Comments | hroniki_paisano: Comments: R-Squared

hroniki_paisano

Comments: R-Squared

Feb 17, 2016 21:25

меня просто прикалывает, что у каждого жителя интернетов есть эталон качества прогноза, вероятно, вынесенный из Палаты мер и весов. прогноз вещь относительная: можно сказать, что прогноз А хуже прогноза Б, но нельзя сказать, что прогноз А просто плох безотносительно к чему-либо. потому что вполне вероятно, что мир просто устроен так, что некоторые ( Read more... )

Comments 54

alknew February 18 2016, 07:15:36 UTC

если отрешиться от научности, то на пальцах все-таки любой человек понимает, что качество прогноза определяется результатом: совпадает/не совпадает реальность с прогнозом. А что уж там с R-squared происходит - это теория, необходимая для подведения математической модели... так сказать работа оракула на основе научного знания, где-то это работает, а где-то не очень.

hroniki_paisano February 18 2016, 08:07:14 UTC

ну как сказать. качество транспорта, вероятно, тоже определяется скоростью доставки из точки А в точку Б, но сетовать на то, что самолеты не летают со скоростью света, довольно бесполезно.
а ведь как было бы хорошо - несколько секунд, и ты уже в Брюсселе каком-нить.

alknew February 18 2016, 09:13:33 UTC

есть у меня и такая мечта, неограниченная и скоростью света :-), но почему-то я уверен, что даже если мечта сбудется (в необозримо далёкой перспективе), с прогнозами все останется по прежнему ).

hroniki_paisano February 18 2016, 19:48:54 UTC

ну, может, и у метеорологов сбудется когда мечта, и они начнут мне писать об отмене рейсов с вечера, а не когда я уже в аэропорт приехал. это будет отлично.
а вот если модели начнут очень точно прогнозировать потребительский выбор, это, кмк, будет стремно, потому что в такой ситуации слово "выбор" будет несколько неуместно.
хотя вон в каментах к предыдущему посту была ссылка на то, как выбор президента США хорошо прогнозирует нейронная сеть с четырьмя извилинами нейронами.

Thread 9

yozhig February 18 2016, 10:13:06 UTC

Жителям инторнетов стоит опасаться, что R2 применят к ним не только со статистическими намерениями: http://arstechnica.co.uk/security/2016/02/the-nsas-skynet-program-may-be-killing-thousands-of-innocent-people/

hroniki_paisano February 18 2016, 19:41:28 UTC

вот еще когда Терминатора смотрел, думал, что на самом деле этот Скайнет будет глючить и тормозить.

yozhig February 18 2016, 23:07:29 UTC

Имхо, из-за глючности она и проиграла в фильме "партизанам", вооруженным удивительно устойчивым Т-800 и шотганами. Вот после прочтения этой статьи мне и начало казаться, что шум preppers и NRAшников вокруг использования дронов внутри страны имеет некоторое рациональное зерно.

hroniki_paisano February 19 2016, 02:02:25 UTC

вот кстати, забыл поделиться впечталениями от обучающей выборки.
мы в эмпирических финансах люди простые, всяких многомерных статанализов не юзаем почти, для разделения двух выборок используем dummies.
вот над теми, у кого "другая выборка", для которой задана dummy, меньше 5% общей выборки, у нас на семинарах смеются.
у меня, правда, есть статья, в которой соавтор соблазнил сделать dummy для 2% выборки (тыщи полторы наблюдений в панели), мы намучились со значимостью, и про размер этой подвыборки стыдливо в статье молчим. потому как будут бить же.

Thread 15

p2004r February 18 2016, 17:25:38 UTC

Странные надо сказать претензии к коэффициенту детерминации. Нормальная метрика качества прогноза если посчитана кроссвалидацией.

Доходность это проблема величины коэффициента детерминации для разницы двух величин, и надеяться получить приемлемый результат при вычитании двух близких величин по которым к.д. меньше 0.95 (а то и выше понадобиться) просто смешно.

hroniki_paisano February 18 2016, 19:54:41 UTC

ну собственно про что и пост: что эр-квадрат имеет смысл сравнивать только у моделей с одинаковой зависимой переменной.

p2004r February 19 2016, 06:50:18 UTC

Тут две вещи обсуждается как я понимаю:

1) Коэффициент детерминации вполне себе абсолютная мера качества количественного прогноза.

2) Перевести качество прогноза одной зависимой переменной в качество прогноза другой (вычисляемой из первой) можно если известна функция перевода. Меньше всего ошибок будет если делать это прямым счетом с помощью бутстрепа.

hroniki_paisano February 19 2016, 08:07:22 UTC

эр-квадрат не абсолютная мера, пост же про это.
если он и абсолютная мера, то скорее того, насколько прогнозируемым Боженька / мать-сыра-природа сделали тот или иной параметр.

Thread 5

abienscumvento February 18 2016, 18:41:53 UTC

что прогноз А просто плох безотносительно к чему-либо

Ну, наверное, интуитивно предполагается, что к датчику случайных чисел.

hroniki_paisano February 18 2016, 19:45:20 UTC

эр-квадрат ноль - это когда прогноз историческая средняя.
если прогнозировать датчиком случайных чисел, можно и поболе ошибку получить. особенно если датчику дисперсию накрутить, ну там на сотню его умножить.

abienscumvento February 19 2016, 03:42:47 UTC

Ну, совсем уж их не накручивают, делают с подходящими параметрами распределения и "прогнозируют", к примеру, отклонение от предыдущего значения. Это как бы моделирует человеческий неквалифицированный прогноз.

j_soldier February 18 2016, 23:49:32 UTC

А вот вы мне скажите - "вариация" и "дисперсия" это одно и то же? И как правильнее говорить?

hroniki_paisano February 19 2016, 01:57:14 UTC

коэффициент вариации - это стандартное отклонение, деленное на среднее значение.
а дисперсия - стандартное отклонение в квадрате.
я слышал, как по-русски говорят "вариация" вместо "дисперсия" (например, "матрица вариаций-ковариаций"), но это неправильно, надо говорить "дисперсия", "ковариационная матрица".

p2004r February 19 2016, 06:52:34 UTC

На диагонали той самой матрицы находятся таки вариации показателей, а в остальных клетках ковариации. И так говорят не только на русском.

abienscumvento February 19 2016, 07:21:45 UTC

Так вариация показателей появилась, по-видимому, в результате "перевода" слова variance. В русском языке термин вариация используется в вариационном исчислении в несколько похожем, но все-таки другом значении.

Thread 22