Comments | alsafr: HHP завершился

alsafr

HHP завершился

Apr 12, 2013 19:44

Эпический конкурс Heritage Health Prize завершился на днях. При этом победитель пока неизвестен. Вернее, неизвестно точное распределение мест в верхней десятке команд. Лично я ставлю на то, что первое место достанется Opera Solutions. Команда Almata, занимавшая долгое время верхнюю строчку с большим отрывом, некисло оверфитнулась и свалилась на 19 ( Read more... )

конкурсы, машинное обучение, kaggle

Comments 7

g00dmann April 13 2013, 11:50:16 UTC

общий подход скорее прямо противоположенный: нагенерить несколько десятков тысяч факторов, а хороший ML-алгоритм сделает все остальное (соответствует моим взглядам)

Вот это-то и хреново, что общий подход (и твой, в частности) стал именно таким. Потому что он верный только в том случае, если выбранные тобой факторы действительно описывают нужные свойства модели, в таком случае эффективность применения ML замечательная, вплоть до 100%. Но рассчитывать на то, что оно так и будет - наивно, как правило всё по-другому. Я хз, почему любители ML этого не видят.

Хотя в некоторых областях такой подход работает хорошо, да. В IR - работает так себе, имхо. :)

ext_681947 April 13 2013, 16:00:12 UTC

если выбранные факторы не имеют корреляции с результатом то в любом случаи будет жопа, что с ML, что без. я вообще этих наездов на ML плохо понимаю, есть вполне конкретная задача, предположим у нас существует какая-то многомерная плотность, и некоторая выборка из нее, мы хотим - восстановить плотность, алгоритмы ML именно это и делают, там нет никакой "магии".

g00dmann April 14 2013, 12:18:37 UTC

Про корреляцию вы сделали крутое заявление, но оно не верно. Для примера возьмем функцию от одного фактора - синус. Корреляции с результатом нет, значит смоделировать функцию не получится? В любом случае будет жопа? ;)

И на ML никто не наезжал. ML-методы на сегодня наверное самые лучшие для подгонки, если факторы выбраны верно. Наезд исключительно на подход к применению ML, когда исследования области игнорируются, потому что разработчик уверен, что всегда заменит качество количеством. Дык вот - это не правильная уверенность. :)

ext_681947 April 14 2013, 12:50:03 UTC

>Про корреляцию вы сделали крутое заявление, но оно не верно ( ... )

Thread 7