Структура интеллектуальных игр. Вопросы и поле знаний.
Игры будущего. Информация и факты.
Формализация СИ. Классификация вопросов СИ.
Часть 3 (заключительная). Вопросы и их классификация
Итак, что же мы выяснили в процессе предыдущей формализации интеллектуальной игры?
У нас есть общий набор фактов и имеются игроки, каждый из которых владеет лишь частью
этого набора.
Самый важный момент в игре - это вопросы. Они и представляют собой основной механизм
выявления знаний игроков. Нас в первую очередь интересуют вопросы в "Своей игре".
Вопрос - это факт или набор фактов, в котором одна из ключевых составляющих неизвестна
и требует выяснения. Скажем, если у нас имеется факт "Пётр I основал Петербург в
1703 году", то вопросом будет высказывание "Именно он основал Петербург в 1703
году" и просьба у одного или нескольких игроков восстановить пропущенный
элемент в факте. Этот элемент и является правильным ответом на вопрос. Вопросами
также будут высказывания "Именно это Пётр I основал в 1703 году" или "Именно
это сделал Пётр I в 1703 году с Петербургом".
В связи с последними примерами, как правило, к вопросам применяют ряд строгих требований:
- Ответ на вопрос единственен (т.е. существует только один факт, подходящий под схему
вопроса). В противном случае такой вопрос называют дуалью. Классический пример такого
вопроса - "Назовите русского поэта начала XIX века, которого звали Александр Сергеевич"
- с ответами "Пушкин" и "Грибоедов".
- В основу вопроса
должен быть положен факт с высокой долей истинности (доля определяется коллективно).
В противном случае вопрос считается некорректным. Пример некорректного вопроса -
"Сколько цветов у радуги?" с ответом "8".
Удовлетворяющие этим двум требованиям вопросы подходят для использования в игре.
Перейдём к следующей, достаточно важной и интересной задаче.
Вопросы СИ появляются хаотически. Их пишут разные авторы, и они отыгрываются в разных
турнирах. Далее они кочуют из одного вопросного пакета в другой (например, попадают
в те же пакеты КСИ). Встаёт вопрос: как классифицировать все существующие вопросы
СИ, чтобы их легко можно было искать и чтобы можно было легко помещать новые вопросы
в эту классификацию?
Поясню свою мысль. В
Базе вопросов все вопросы
СИ классифицируются по следующему принципу: Турнир - Пакет - Тур (раунд, игра, бой)
(- Тема - Текст вопроса). Поэтому адресовать некоторый вопрос можно по следующему
образцу:
#II Открытый Чемпионат Клуба "Неспроста по "Своей
Игре"-2006/27-2//Танго/Какая группа поёт про овощное танго?
Вышеприведённая строчка однозначно идентифицирует вопрос. По этому адресу может
быть обнаружен он и только он.
Однако данный способ адресации является не совсем удачным. Во-первых, вопрос может
быть сыгран впоследствии в другом турнире. Во-вторых, какой-либо другой автор может,
совершенно не зная о существовании данного вопроса, спросить о том же. В-третьих,
вопрос привязан к конкретной теме, а ведь его вполне можно поместить в какую-нибудь
другую подходящую тему (матричную, скажем). Наконец, можно задать тот же самый вопрос
другими словами, и адрес вопроса изменится.
Дополнительная проблема - не является ли другой вопрос по тому же факту (группа
"Несчастный случай" поёт про овощное танго) - скажем,
"Про какое танго поёт группа 'Несчастный случай'"? - в некотором
роде родственным исходному?
В ряде вопросов встречаются также дополнительные факты, в которых ни о чём не спрашивается
и ничто не опущено. Такие факты несут лишь познавательный характер. Сами же вопросы
эквивалентны аналогичным вопросам без добавочных фактов. Поэтому будем считать,
что лишние факты в вопросе при анализе сразу же отбрасываем.
СИ - игра на знание фактов, а зная определённый факт, можно ответить на любые вопросы
по нему. Если человек в состоянии ответить на один из вопросов, то он может ответить
и на другой. Бывают озарения, когда по ключевому слову вопроса игрок вспоминает
факт, но это относится уже к особенностям работы памяти. В общем случае вероятности
ответить на эти два вопроса при знании факта и вероятности угадать ответы при его
незнании практически равны между собой.
Это позволяет утверждать, что вопросы, построенные на основе одного и того же факта
и отличающиеся лишь формулировками или пропущенными частями данного факта, являются
родственными. Все вопросы по данному факту можно считать подчинёнными этому факту
в классификационной иерархии. Исходный вопрос можно записать в виде #группа
"Несчастный случай" поёт про овощное танго/"Несчастный случай",
второй вопрос - в формате #группа "Несчастный
случай" поёт про овощное танго/овощное (альтернативный вариант - как-то помечать
опущенные части вопроса). Оба вопроса стали как бы родственными.
Если в основе вопроса лежат несколько фактов, они все перечисляются при адресации.
Точно так же обстоит дело, если в вопросе нужно назвать несколько понятий. Вопрос,
основанный на нескольких фактах, не будет считаться родственным вопросам, основанным
на подмножестве множества этих фактов.
Соответственно, задача классификации вопросов свелась к задаче классификации фактов,
на основе которых созданы данные вопросы. Как классифицировать сами факты, будем
думать как-нибудь в другой раз :)
Глобальная цель вам сейчас станет ясна. Для автоматической генерации вопросов важно
создавать всё время новые вопросы, а для этого уже существующие нужно запоминать
и некоторым образом классифицировать. Благодаря делению по фактам можно будет гарантировать,
что новые вопросы будут заключать в себе информацию, не совпадающую с информацией
старых вопросов.
Генератор вопросов выбирает некоторый факт и выкидывает из него значимую часть,
объявляя её правильным ответом. Если после такой процедуры вопросу стало удовлетворять
несколько имеющихся фактов, генератор добавляет в текст вопроса дополнительные факты-отсечки,
касающиеся правильного ответа, и обеспечивает таким образом отсутствие дуалей.
Конкретным освещением проблемы генерации вопросов мы займёмся гораздо позже.
Существующие вопросы и вновь сгенерированные формируют общую базу вопросов, которая
конечна (ибо конечно число фактов).
В любом случае, классификация вопросов имеет
собственную ценность, так как позволяет определить информацию, по которой уже задавались
вопросы и по которой никаких вопросов ещё не было.