Мышление/learning и трансдисциплины, мыследействование/inference (привет СМД-методологам)

Dec 21, 2020 03:39

Снова и снова возникает вопрос про мышление: поскольку слово бытовое, и каждый волен его трактовать как хочешь, приходят разные люди со своими размышлениями (двамышлениями, измышлениями, измышлизмами и т.д.). "Мышление -- это оперирование образами", "мышление -- это осознанный поиск правильных интуиций", "мышление -- это поиск лучшего научного описания проблемы" и это первая линия ad hoc определений, а вторая линия приходит как пересказ случайно выдернутой из литературы разных лет идеи из какой-нибудь околохудожественной философской школы. Скажем, берём Ницше и гуглим "Ницше мышление" -- и там сразу "воля к власти как осуществление мышления", и дальше можно уже бесконечно развлекаться словесными построениями вообще вне связи с идеями Ницше или его последователей. Обязательно придёт в дискуссию кто-то, кто погуглил "Анохин мышление", и он будет рассказывать про афферентацию и мозг, и полное отсутствие связи с волей власти его волновать не будет (равно как любителей Ницше не будет волновать афферентация).

Мы говорим об интеллекте как вычислителе, который способен находить решение разнообразных проблем. Вычисления этого интеллекта -- это и есть мышление. Больше разнообразие этих проблем -- выше уровень интеллекта, мощнее мышление, используем модель Chollet -- https://ailev.livejournal.com/1498481.html.

Затруднения возникают, когда мы говорим о системном интеллекте, системном мышлении. Если мы определяем, что трансдисциплины определяют важные объекты, которые выделяет своим вниманием интеллект этой трансдисциплины, то возникает вопрос: если дан набор понятий из учебника кулинарии, можем ли мы считать это "кулинарным мышлением"? Чем отличаются учебники кулинарии (в любом учебнике обычно дают какой-то набор понятий для настройки внимания интеллекта, полученного путём изучения учебника) от учебника кулинарного мышления? Учебники инженерии от учебника инженерного мышления? Учебники системного подхода от учебников системного мышления? Да, принято говорить, что мышление с использованием понятий системного подхода - это и есть системное мышление. Или использование понятий, связанных с вычислениями - это вычислительное мышление. Но использование понятий "кулинарного подхода" или "понятий кулинарии" -- это "кулинарное мышление"?

Есть ещё примеры, как люди определяют виды мышления. Мне наиболее запомнился Дейкстра, который вводил виды мышления (его интересовало программистское мышление, близкое к нужному нам в вычислительном мышлении) на примерах: "Хотя во времена, к которым относится наша история, человечество не знало ЭВМ, неизвестный, нашедший это решение, был первым в мире компетентным программистом. Я рассказывал эту историю разным людям. Программистам, как правило, она нравилась, а их начальники обычно сердились все больше и больше по мере ее развития. Hастоящие математики, однако, не могли понять, в чем соль." - это знаменитая история о туалетах, http://hosting.vspu.ac.ru/~chul/dijkstra/pritcha/pritcha.htm.

Помним, что "программирование" - это для Дейкстры "структурное программирование", то есть алгоритмика на императивном языке с простыми структурами данных. Но вот это "чем мышление программиста отличается от мышления математика" - это важно, Дейкстра различал виды мышления. "Хвост коровы Маргариты это часть стада" для системного мыслителя неправильное высказывание, а для математика -- правильное. Системный интеллект и математический интеллект мыслят по-разному!

Тут произошёл незаметный, но важный сдвиг: мы говорим уже не о мышлении как таковом, а о видах мышления, его специализациях. Не об интеллекте в целом, а о видах интеллекта, специализациях. Или частях общего мышления? В онтологии это вопрос удобства выбора отношения: виды/специализации это мышления и интеллекта, классы/классификации или части.

В случае трансдисциплин мышление "всё системное", "всё онтологическое", "всё эпистемологическое", "всё вычислительное". И только для удобства обсуждения и обучения (но не использования -- оно как раз растворено в целом интеллекте и его мышлении) мы делим этот кисель трансдисциплинарной части интеллекта и его мышления на растворённые друг в друге до неразличимости, но "логически" отдельные/функциональные части, они все "одновременны", то есть выделяются из функционирующего интеллекта и осуществляющегося мышления нашим вниманием.

В AI эта "одновременность" обсуждается как life long learning: все акты inference далее обрабатываются на то, насколько они оказались успешными, и эти результаты идут в learn. При этом времени на learn не хватает в живой природе, и по итогам inference обучение идёт ещё и во сне (мозг пересматривает записи того, что там происходило в ходе inference и перестраивает вычислитель).

Творчество и импровизация - это всё то же самое, но режиме generative алгоритмов, то есть в inference работаем с шумом как входными данными для inference и на выходе получаем выходные приемлемые результаты. А чтобы улучшить порождение/генерацию, нужно всё равно делать шаг learn. Можно ещё пообсуждать функцию награды в рамках reinforcement learning, исследовательскую деятельность в рамках self-supervised learning, самонаграждение в рамках исследований и т.д.. Но это пока лишнее (но на втором такте рассуждений придётся затрагивать, конечно).

Если в мышлении объектами внимания являются системы, выстроенные в какие-то разбиения/иерархии по отношениям часть-целое, то это системное мышление, "мышление системами". Интеллект -- это вычислитель, мышление -- это его поведение, то есть вычисление. Мышление вычислителями, мышление вычислениями, вычислительное мышление, вычислительный интеллект: всё равно, про объекты-вещи или про их поведение, объекты-процессы с объектами-вещами (поведение -- это взаимодействие вещей).

Если у нас в мозгу решение прикладных задач по уже известным объектам внимания, то есть вывод/inference (не меняем синаптические связи мокрой нейронной сетки, то есть не занимаемся работой с понятиями, работаем в режиме GPT-3 на нейроморфном вычислителе), то это мыследействование в рамках мыследеятельности (неразрывно связанных мышления и деятельности). Если занимаемся образованием новых объектов (скажем, выделяем системный уровень тогда, когда он очевидно не выделяется "по правилам", то есть нет прямого алгоритма его получения - не описано в каком-то учебнике), то это чистое мышление/learning. Когда генерируем/строим /кладём гипотезы о том, какие это могли бы быть понятия, каким объектам в жизни они могли бы соответствовать, чтобы была удобна деятельность - вот тогда чистое мышление/learning. Если нейронная сетка (хоть мокрая, хоть кремниевая, хоть оптическая) не меняется сама, а только используется - тогда чистый вывод/inference/мыследействование. Понятно, что любая принадлежность к классам (в том числе классам вычислений inference и learning) определяется статистически.

Learning в жизни ещё известен как программирование, онтологизирование, моделирование. А вот всякие "вычисления программы", "интерпретация модели", "использование онтологии" - это inference/мыследействование. Если плохо вывелось, в мыследействовании затык - идём в мышление, продолжаем мыследеятельность в мышлении.

Трансдисциплины как раз обслуживают learning, это алгоритмы (описания вычислителя-интеллекта), дающие inductive biases для определения целевых понятий в ходе learning/мышления. Для inference потом просто тренируешь мозг обезьянки, и далее S1 хватает. А для понятийных размышлений в S2 нужно построить понятия, в терминах которых дальше будет автоматический (с небольшой утерей качества, но быстрый и лёгкий) S1. В природе они круто перемешаны, конечно, выделяются нашим вниманием, но имеют слегка разные конструктивы и чуток таки разведены во времени. Мы предпочитаем эти "слегка" и "чуток" доводить до экстремума в наших схематизациях мышления и мыследействования в рамках общей мыследеятельности.

В СМД-методологии в ходе деятельности люди занимаются не столько мышлением, сколько мыследействованием, перемежаемым мыслекоммуникации -- и у них есть для этого схема мыследеятельности aka "трёхслойка" (вот публикация с её рассмотрением 1987 года, https://gtmarket.ru/laboratory/basis/3961/3974). Переведём часть той схемы на современный язык, то есть скажем чуть другими словами то, что я уже сказал чуть выше: для мыследействования речь идёт не о мышлении как функции интеллекта по способности найти/выучить/learn алгоритм решения какого-то класса проблем, а о применении этого выученного ранее алгоритма к решению прикладной проблемы данного класса, проведению вычисления/inference по этому алгоритму. Нет вычисления мышления/learn, есть вычисление мыследействования/inference. "Выход в мышление" - это когда вывод/inference на имеющихся понятиях как объектах внимания в деятельности с заземлением/grounding их на имеющиеся объекты в физическом мире невозможны, и требуется ввести новые объекты внимания (или подкорректировать старые), то есть выполнить обучение или дообучение/learning. Работа интеллекта - чистое мышление, разборка с новым типом задач, для этого используем в качестве объектов внимания понятия из трансдисциплин. А когда идёт inference по шаблону - не мышление, а мыследействование, использование выученных в ходе мышления понятий прикладных дисциплин. Про коммуникацию из схемы пока будем молчать, в полной схеме мыследеятельности есть и она.

Дальше СМД-методологи любят прибавить, что чистое мышление так же часто встречается в мире, как танцы лошадей. То есть этих вычислений у человечества по объёму не так много: вычисления системного мышления, вычислительного мышления, эпистемологического мышления и т.д. редки, как танцы лошадей. Хотя и бывают. А основной объём "думания" на планете -- это мыследействование/inference, использование плодов интеллекта: создаваемых интеллектом прикладных алгоритмов решения каких-то классов задач, для которых понятна понятийная структура. Нет затыков в (мысле)деятельности -- мозг работает в режиме автомата, лёгкий режим с использованием S1 (как GPT-3 -- работает "интуиция", новые теории при этом не порождаются). Есть затыки -- это значит, что наше описание мира/модель неверна, нужно выдвигать новую модель, описывать мир получше. Это делается дообучением/learning, и проверки/доказательства для полученных решений -- это понятийная работа, логические рассужения "по правилам", использование S2.

Примат мыследействования/inference активно обсуждается: по объёму в датацентрах вывода (распознавания голоса, например), в разы и разы больше в части задействования ресурсов. Но чтобы выучить/learn/вычислить_интеллектом этот распознаватель, ресурсов тоже немало нужно. Но всё одно меньше, чем ресурсов для задействования итогового распознавателя голоса.

У мыслителей, которые главным образом вырабатывают новые понятия (наука, да и существенная часть инженерии) мышления/learning много. А вот у каких-нибудь клерков среднего звена - понятийной работы ноль, сплошной вывод (вот их, замечу, и списывают за ненадобностью, заменяют компьютерами, это легко. Плохо понятно, как выучить компьютер пока, требуются разработчики софта со всем их искусством нахождения мыследействования и пересадки его в компьютер, но хорошо понятно, как заставить софт делать могучий вывод, когда его выучили/learn мозгом, а потом записали в машинночитаемой форме ("разработали"). А уж если не просто "автоматизируют", пересаживая мыследействование в компьютер, а задействуют чистое мышление разработчиков (получают новые объекты внимания и уже их воплощают в софте), то тогда вообще могут говорить о "цифровой трансформации" (ага, это я даю ретроспективное придание смысла бессмысленным словосочетаниям, навеянным современной атишной музыкой).

Тут в комменты обязательно придут СМД-методологи сказать, что я схему мыследеятельности в СМД-методологии не понимаю. Привет! (тот самый -- из заголовка поста). Я им отвечу, что они сами её не понимают, а я довольно много этой схемой занимался -- впервые я увидел её зимой 1988 года на ОДИ. И любил спрашивать: на каком холсте нарисована эта схема, то есть что там за foundational ontology, upper ontology для этой схемы? Молчание мне обычно было ответом. Ну вот, считайте, что я этим постом двинул СМД-методологию, связал хоть как-то с современностью. Цели СМД-методологов хорошие, я их вполне разделяю -- вот об этом мой текст 2011 года, https://ailev.livejournal.com/718446.html. Но вот средства существенно устарели, там ведь десятки лет уже ничего не происходит. И хотя пожилые уже СМД-методологи могут сказать, что "всё это они говорили прямо в момент появления схемы мыследеятельности, ничего нового не сказано и мир только ещё через десяток лет поймёт всю глубину трёхслойки", я отвечу, что идеи людям на планете приходят в голову давно уже очень похожие, терминология только разная -- и различение learning и inference из современного AI имеет больше шансов стать рабочим языком человечества, нежели различение "мышления" и "мыследействования" по схеме-трёхслойке.

В мире сегодня есть и обсуждение интеллекта по Chollet (хотя и это только одна из школ), и обсуждение трансдисциплинарности (https://en.wikipedia.org/wiki/Transdisciplinarity), и обсуждения вычислительного мышления. Этот пост просто показывает, что всё это разные части одного и того же набора идей -- в посте проделана примерно та же работа, которую я делал, выдёргивая разные фрагменты системного мышления из инженерных стандартов в один связный текст учебника. Или работа, которую делал Дэвид Дойч, рассказывая связно о четырёх сюжетных линиях объяснений структуры вселенной: квантовая физика, эпистемология, теория эволюции и вычисления, которые невозможно понять без учёта их тесной связи.

UPDATE: обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10220035178483821
Previous post Next post
Up