Конкурс Automated Essay Scoring

May 04, 2012 21:54

Недавно на каггле завершилось соревнование по автоматической оценке школьных/студенческих сочинений. Задача состояла в том, чтобы по тексту сочинения предсказать его оценку. Кое-что про конкурс:
  • Существует около десятка коммерческих продуктов, специализирующихся на задаче по автоматической оценке сочинений. Разработчики этих продуктов также ( Read more... )

конкурсы, машинное обучение, kaggle

Leave a comment

Comments 7

(The comment has been removed)

anonymous May 9 2012, 09:19:21 UTC
Пока не почитал внимательно, но не думаю, что легко сделать такой набор данных.
Это примерно как написать искусственный текст.
Но студенческие сочинения - по определению - "правильные" тексты с достаточно четкими зависимостями.

Факторы читаемости, поверхностной структуры (по служебным словам), всякие сжатия (как мера структуры), частотка по коллекции (как мера тематичности), language model (как синтаксис ) - достаточно частая "сетка", через которую "плохим" текстам пробиться сложно.

Возможно отклонение "гениальных" текстов (с яркими ассоциациями, метафорами), но уж далеко не "практически нулевая точность".

= bvd =

Reply

(The comment has been removed)

anonymous May 9 2012, 15:37:23 UTC
Яндекс-рефераты - ерунда, элементарно определяются по многим признакам. Там нет общей глобальной связности, что просто определяется. Думаю, даже по элементарному критерию - степени сжатия zip'ом - как простейший способ оценки частотно-рангового распределения ( ... )

Reply


Leave a comment

Up