О Википедии и не только: ur

ur_quan1986

О Википедии и не только

Dec 10, 2007 22:25

Вот часто ругают Википедию: мол, ненадёжный источник. А зря: все неточности и некорректности исчезнут со временем. Вспомните Википедию годичной или двухгодичной давности - куча дыр, множество понятий вообще не было освещено. Так что постепенно ситуация выправляется.

Тут есть другая проблема: "знания" Википедии доступны простым людям, но совершенно недоступны программам. А в настоящее время это очень важно. Те же XML файлы обладают тем преимуществом, что одинаково понятны как представителям человеческой расы, так и их электронным собратьям. И в настоящее время программы могут получать информацию из огромной базы знаний Вивикпедии с большим трудом.

Проблема может быть решена таким подходом: пользователей Википедии можно заставить помечать семантику в статьях. То есть поверх текстовой информации накладывать определённые смысловые связи, которые для программы будут более понятны, нежели сам текст. К примеру, фраза "Лондон - столица Великобритании" даёт любому человеку понятие о том, как соотносятся Великобритания и Лондон. Для программы же будет заведено отношение is_capital_of и помечено: is_capital_of(Лондон, Великобритания). Благодаря таким связам возможен некий программный логический вывод и - самое главное - "умный" поиск. "Какой город является столицей Великобритании?" Яндекс вам ответит, но это потому, что такая информация встречается часто :) "Умная" же Википедия ответит вам не поиском ссылок, а по смыслу вопроса.

Однако такой метод имеет существенный недостаток: кто захочет сидеть и заниматься этим нудным помечанием отношений между понятиями и введением свойств понятий? Как мотивировать людей для такой деятельности?

У меня есть несколько иной подход. Умная Википедия будет представлять собой даже не базу знаний, а картину мира некой интеллектуальной системы, которая будет получать новые знания от пользователей не путём создания и правки страниц, а с помощью диалога на естественном языке с пользователями. Пользователи Инета будут общаться с агентами этой системы, и последняя будет расширять свой "кругозор". Причём, возможно, не просто голыми заниями и отношениями, но и новыми правилами вывода по ним. При помощи тех же запросов на естественном языке (т.е. вместо запросов на языке SQL к базе данных, к примеру, вы обращаетесь к программе на русском языке - "Какой город является столицей Великобритании?") можно получать информацию из текущей картины мира и делать логические выводы по этой информации. Благодаря большому числу пользователей рост такой интеллектуальной системы будет очень быстрым.

Когда у меня будет побольше времени, постараюсь яснее осветить эти мысли :)

P.S. А всё это имеет и непосредственное отношение к интеллектуальным играм (этому тоже будет посвящён отдельный пост). В данном случае я имею в виду три ступени роста программного обеспечения для интеллектуальных игр:
- автоматическая генерация неправильных ответов
- автоматическая генерация вопросов (!) (и это не фантастика)
- автоматический ответ на вопросы (не тот, который у меня в КСИ, а конкретное нахождение правильного ответа по тексту вопроса и имеющейся картины мира у конкретного компьютерного игрока-бота)

Продолжение следует...

Технологии