Измерение интеллекта: занимаемся миром/средой/окружением/контекстами/domain, становимся демиургами

Jan 29, 2022 22:13

Я уже жаловался на повсеместную распространённость схоластической постановки задачи "может ли машина мыслить" буквально два дня назад, последний пункт в https://ailev.livejournal.com/1608893.html (и там ссылка на тред в фейсбуке). Очередной виток обсуждений измерений интеллекта в чате поддержки "Образования для образованных 2021", с https://t.me/odo_course/3825. Слово за слово, и сразу всплывает известная шутка "Бог всемогущ. Может ли он создать такой тяжёлый камень, который сам не сможет поднять?". Ответ: "должно быть два всемогущих бога и разделение труда. Они должны бесконечно соревноваться между собой: один создаёт всё более и более тяжёлые камни, второй тренируется и все их в конечном итоге поднимает!".

Есть мной обнаруженные две линии измерения интеллекта:
- одна приведена в литературном обзоре Chollet (про его собственный тест можно и не читать). Упор на разнообразие контекстов и задач. https://arxiv.org/abs/1911.01547
- вторая по линии теста Тьюринга (и там всё сводится к тому, что с какого-то близкого уже момента просто одни машины там будут проверять другие машины, а люди уже не будут справляться). Упор на сравнении с заведомо более сильным интеллектом (у самого Тьюринга это был "обыватель с улицы"), но оно перестаёт работать. https://riunet.upv.es/bitstream/10251/172312/7/Hernandez-Orallo%20-%20Twenty%20Years%20Beyond%20the%20Turing%20Test%20Moving%20Beyond%20the%20Human%20Judges%20Too.pdf

Третья линия -- "вы все неправильно определяете интеллект, я ваших Пастернаков не читал, но я скажу". Эта третья линия -- попытка дать собственное понимание интеллекта (без предварительного знакомства с вот этими двумя упомянутыми обзорами, в надежде, что оно почему-то будет лучше). И затем уже предлагать измерить интеллект, понимаемый самостоятельно, "по моей личной школе мысли". Увы это понимание и способы измерения оказываются не лучше, обычно такое "собственное понимание" уже упомянуто в литературных обзорах вот этих двух подходов и разбито там критикой. Поэтому статьи - читать, а потом уже предлагать что-то своё.

Я сам последний раз на эти темы писал тут, в "Как определить, правда ли, что мы делаем людей умнее?" : https://ailev.livejournal.com/1604070.html.

Парадокс в тесте/замере интеллекта, что нужно продемонстрировать решение задач самых разных классов, которые не знает ни интеллект-студент, ни его учитель (или даже все учителя, если он читал учебники каких-то добрых людей, которые занимались его интеллектом и пытались приготовить к испытаниям). Тесты не должен знать никто, кто готовил интеллект к тестам (ужас в том, что не должны знать даже типа текста!). Иначе это сразу ситуация с ЕГЭ: натаскиванием на конкретный экзамен, с рождения будущего носителя высокого интеллекта до самого его прохождения теста. Если известно, что проверять будут знание физики, то только физику и учить. Если проверять будут политологию, то только политикой и заниматься, и к чёрту тогда физику. А если непонятно что -- то что учить-то?!

Дальше дорогу указывает Stanley:
- заниматься средой, в которой действует агент (вот те самые "проблемы", или "среды", но не надо их называть "тестами" или "кейсами", в этой предметной области всё-таки своя терминология, хотя называйте -- но каждый раз определяйте, что вы так называете, это ж не конкретный тест типа ЕГЭ) нужно не менее тщательно, чем самим агентом
- генератор сред с бесконечным разнообразием, да ещё и goldilock для агента - это ключ к бесконечному развитию. То есть богов таки два: один демиург, второй решает задачки демиурга.
- и дальше алгоритмы типа EnhancedPOET, которые демонстрируют open-endedness https://arxiv.org/abs/2003.08536. Хорошее упражнение для "мышления письмом" будет переписать этот алгоритм на нормальный язык типа "правил для жизни". В каждой шутке при этом есть доля шутки!

Stanley после этого оказывается очень озабочен тем, что мы очень мало знаем о том, как создавать богатые для развития среды (мало думаем о мирах, мало озабочены созданием демиургов), а всё больше думаем про богатых для развития агентов, думаем о "решателях проблем". И демиурги должны быть не люди, создание миров легко выходит за пределы мыслительных возможностей одного человека. И тут это смыкается с линией мысли людей, которые сообразили, что тест Тьюринга дальше должен проводиться не людьми, а машинами против машин: ибо средний человек уже путается в тесте Тьюринга и нужны не совсем средние люди, как предлагал когда-то Тьюринг. То есть сравнивать подрастающего всемогущего бога нужно с другим богом, а не человеком.

Там неминуемый вывод, что эта линия приводит к генерации сред с проблемами именно нежитью. Ибо у людей ума не хватит, биологические человеки сейчас работают уже на пределе, и гибридный интеллект (средний человек с гуглём) легко бьёт по решению проблем да хоть нобелевского лауреата, оставленного наедине со своим биологическим мозгом без доступа к нежити.

То есть и среды не совсем живые люди генерируют, и проблемы в них решают тоже не совсем живые люди.

В математике, кстати, "постановка интересной задачи" (генерация среды, в которой можно получить что-то интересное) очень ценится. Интересная задача понимается (пересказываю тут Романа Михайлова) как задача, каждущаяся интересной человеку, который решил уже чью-то предыдущую интересную задачу. То есть мозг, который продемонстрировал интеллект в поиске проблемы, применяет этот интеллект для генерации следующей проблемы. И Михайлов обижался на Перельмана, который проблему-то предыдущих агентов решил (доказал гипотезу Пуанкаре), а вот свою проблему не выставил, гад. Гад, ибо "если может, то должен! Не так много таких, кто решает предыдущие интересные проблемы, то есть разобрался что к чему в математике, поэтому он должен прокинуть цепочку проблем дальше".

Полностью соответствует модели Stanley с "генератором проблем".

Но это не модель "тестирования" или "замера", это модель эволюции: тестирует силу интеллекта реальная жизнь, а не идёт лабораторное/игровое тестирование/замер.

Я считаю, что поднявшие свой интеллект люди берут проблемы из окружающей среды (а не из искусственно придуманных для них проблем какими-то агентами-экзаменаторами) и решают их. У математиков это я описал как парой абзацев выше. Если от математиков перейти к линии директоров по развитию, то ты демонстрируешь шаг развития крупной организации, в котором у тебя была роль инициатора и менеджера -- и вот она, сила твоего интеллекта. Если совсем абсолютная планка, то всё то же самое, только твоя организация - глобус (вот тут я писал, кстати, про масштабы в "большое невидимо, малое шумит", https://ailev.livejournal.com/1327732.html, эту деятельность большого масштаба ещё и заметить нужно будет, о ней вряд ли будут говорить из каждого утюга). И мы знаем, что такие люди-революционеры бывают. Отсюда и наша квалификационная шкала (https://system-school.ru/qualification), если мы хотим замерять усиление интеллекта, и мы даже предположить не можем, в какой предметной области придётся разобраться выпускникам, какие проблемы решать, чтобы научиться самим и научить людей вокруг себя что-то делать по-новому.

Но что с экзаменами? Разве у нас нет в наших курсах каких-то тестов? Вот в курсе системного мышления же есть и тесты, и упражнения, и задания! Почему их не считать тестами на интеллект? Во-первых "на интеллект" -- это сразу от замера переходим к "есть-нет". И неявному предположению, что если "есть", то это не хуже Нобелевского лауреата (по крайней мере для xGI ровно вот так вопрос давно стоит, на меньший интеллект не согласны, хотя ещё десяток лет назад говорили, что "нам бы интеллект пятиклассника получить, были бы счастливы"). Во-вторых, такие тесты должны делать люди, которые сами разобрались в проблеме, и могут отличить Нобелевских лауреатов от Шнобелевских, то есть по этой линии опять быстро приходишь к выводу о том, что некому такие тесты разрабатывать, только тоже суперинтеллигентам, то есть нежить через такт-другой будет тестировать нежить.

Но с людьми как? Вернёмся к экзаменам, проверять-то будем, поумнели люди, или нет? То есть можно заметить, что если человек хорошо делает операции с типами, разбирается с трудовым кругозором, и т.д. (всё это можно хоть как-то замерить простыми тестами в одном контексте) всё это будет делать в разных контекстах (что не так! всегда найдётся контекст, в котором он банально забудет работать "по норме" из SoTA и сделает что-то абы как) и правильно смешивать друг с другом (что не так!), и что в реальной проблеме затык будет не с этими операциями, а с чуть-чуть другими, и нужно будет это всё самый чуток подхакать (но это ж "выучено и экзамены сданы!", как же хакать-то?!), и дальше с тяжёлым вздохом сказать: нет, умение делать какие-то определённые операции (типа аннотировать типами из мета-мета-модели в учебнике какие-то важные объекты в описаниях, и описывать этими объектами что-то в физическом мире) способствует гиперинтеллектуальности, но не гарантирует её.

Итого: начинаем обращать внимание на мир/среду/окружение/контекст/domain, становимся демиургами -- у агента есть окружение, и интеллектуальность проявляется только в достаточно богатом окружении. Обучение тоже должно быть в достаточно богатом окружении (domain randomization, COIN/context inference -- они все про это). Реальная жизнь, реальные проекты (не экзаменационные, не учебные, не тестовые, а рабочие) тут пока выглядит наилучшим решением. Главным демиургом тут выступает вселенная и эволюция, которая дала окружающий нас мир с другими людьми, уже очень неглупыми и компьютерами с уже более-менее универсальными (то есть обучающимися) алгоритмами. Вот и будем держать на это курс, смотреть на реальные результаты в реальных проектах, которые нам кажутся не проще, чем те проекты, которые мы сделали сами. И вот тут мы должны стать малыми демиургами, предложить и среду и решение какой-то проблемы. И огромная вероятность, что одни будут указывать на проблему (иногда таки создавать проблему просто своим существованием!), другие её решать, обычное разделение труда, обычная эволюция, coopetition (https://en.wikipedia.org/wiki/Coopetition ).
Previous post Next post
Up