Артигогика (artigogy)

Jun 24, 2012 11:09

Андрагогика (andragogy) -- это про то, как лучше образовывать взрослых. Я думаю, что приходит время артигогики (artigogy) -- про то, как лучше образовывать искусственный интеллект. Я тут не собираюсь проводить чётких границ между всякими AI, strong AI, GAI и smart systems. Я говорю просто, что по факту появляются искусственные (лат. artificiosus) системы, которые нужно учить -- в искусственном интеллекте как дисциплине даже термин появился для специальной поддисциплины: машинное обучение (machine learning), но этот термин подразумевает, что машина обучается сама. А вот и нет: предметную область, обучающие выборки, коррекционные правила и тюнинг алгоритмов machine learning делает человек. Назовём этого человека, специализирующегося на обучении машин, артигогом.

Я бы разделял занимающихся искусственным интеллектом на две крупных категории: разработчиков программно-аппаратной платформы и артигогов. Собственно, такое разделение есть сейчас в большинстве сложных информационных систем: есть фирмы-разработчики, а есть "настройщики". Одни "на заводе" создают софт и хард, которые ставятся "из коробки", а другие "на месте" обеспечивают отражающие целевое операционное окружение справочные данные. В системах искусственного интеллекта будет то же самое. Одни будут делать всякие "коробочные" нейронные сети, генетические алгоритмы, лингвистические платформы и объединяющие их "системы управления жизненным циклом мысли" (pun intended), а другие -- их настраивать на конкретные предметные области и ситуации применения. Склейка этих деятельностей сегодня -- это начальное недоразумение, как всегда на заре какой-то дисциплины. Когда-то врачи тоже не делились на стоматологов, проктологов и гинекологов, а вебмастера на веб-программистов, верстальщиков и веб-дизайнеров.

Если я хочу оказаться в эпицентре проекта искусственного интеллекта, то нужно определяться: кем быть? Пожалуй, я бы был артигогом. Это означает, что нужно выбрать команду разработчиков, и научиться "настраивать" их плафторму на 1. Текущую жизнь в целом. Любая предметная область требует неожиданно много общих знаний для действительно интеллектуальной обработки, как показали исследования CYC -- на 2% специального медицинского знания в ответах на вопросы участвовали большие куски "общей базы знаний" (https://www.cyc.com/wp-content/uploads/2020/01/AI-Mag-NL-Query-2010.pdf): A reader might wonder whether, and how, the full KB and inference system of Cyc is required for this task. To address this, we metered the SRA system‘s use of pre-existing Cyc knowledge (that is, assertions entered into Cyc before our collaboration with CCF started in 2007). We certainly expected some re-use, but were surprised to find empirically that hundreds of pre-existing pieces of prior and tacit knowledge in Cyc were used for each ad hoc query. Cyc KB content was used during each step: interpreting the literal meaning, inferring the intended meaning, carrying out the clarification interaction with the user, putting the fragments together into a meaningful integrated whole, coming up with a plan for answering the query by going out to data bases, optimizing each DB query dispatched, and deciding how best to display the Answers to the user. While there are certainly parts of the Cyc KB that are unlikely to be used in the medical domain (facts entered for a historiography thesis about Merovingian France, for example), the scale of re-use suggests that identifying the reusable elements in advance, and constructing them afresh for each new application would be a difficult and expensive proposition. Having designed Cyc for broad re-use, all those years ago (Lenat et al 1983; Lenat and Guha 1989; Lenat 1995) is now paying off. In domains where the user is likely to inject metaphors and analogies into their queries, even the more esoteric regions of Cyc knowledge-space may turn out to be useful for understanding the intent of their query.
Это "среднее образование" для искусственного интеллекта. Вполне возможно, что такие "модули знаний на уровне средней школы" будут через некоторое время тоже продаваться "из коробки" вместе с платформой-мозгами, но может возникнуть и независимый рынок разных "средних образований". Трудно ожидать "верхнего образования" от систем искусственного интеллекта в ближайшем будущем, но и это постепенно (что во времена сингулярности может означать чуть ли не завтра) придётся делать.

2. Конкретную предметную область, уровень ПТУ -- профессионально-техническая подготовка системы искусственного интеллекта для работы в конкретной предметной области. Собственно, от системы искусственного интеллекта на первых порах чего-то такого и ждут: интеллекта семилетнего ребенка с хорошими знаниями обычного взрослого-профессионала в какой-то одной, в лучшем случае -- паре предметных областей.
Вот я сейчас хочу артигогом побыть -- как хотел быть программистом в семидесятые, когда вычислительные машины были отнюдь не в каждом городе, а где и были, так всего по нескольку штук. Для того, чтобы стать артигогом, нужно определиться с платформой (кого учить -- увы, обучение машин ещё очень и очень платформозависимое), предметной областью (а хоть и PraxOS) и далее зарядиться на несколько лет тюнинга понятий и правил, ибо сроки обучения тут в чём-то быстрее, а в чём-то существенно медленнее человеческих.

Начинать тут проще всего с лингвистических систем. Границы между ними и системами искусственного интеллекта становятся всё более и более призрачны, и всё больше и больше лингвистов знает про "онтологии" и "фреймы". Но сил у лингвистов хватает только на собственно платформы и чуть-чуть начального образования своих систем. Предметников среди них нет, а уж об онтологах и прочих когнитологах, нужных для предметно-специфичного обучения их систем, и говорить не приходится.

Вот и займёмся.
Previous post Next post
Up