Маржинальная революция во всех мыслительных практиках, активное рассуждение, и куда думать дальше

Mar 18, 2022 20:24

Я продолжаю потихоньку знакомиться с литературой по SoTA в направлении трансдисциплинарных/ренормализационных (то есть для всех уровней) описаний автопоэтических/чувствующих/агентских/неравновесных динамических/"...и ещё много разных терминов из этой серии" систем. Задача: иметь минимальный набор понятий для обсуждения практик работы на самых разных системных уровнях стека создания: вещество-существо-личность/разумное существо-коллектив/проект/фирма-сообщество-общество-человечество (всё-таки пока у нас нет нечеловеческих агентов, пока снимем термин "агентечество", тем более что агентность оказывается не самым тут главным). Пост этот -- просто слегка аннотированный список литературы, поэтому я в нём даже рубрикации не даю.

Материала до чёртиков, и его нужно не столько постами в блог выдавать, сколько прямо вписывать в новую редакцию "Образования для образованных 2022", но я пока ещё не приступил к выдаче результатов размышлений в текст, а только "начитываюсь". Так что пока приведу только некоторое количество ссылок. Я ещё даже не все эти работы просмотрел, но кто интересуется этими исследованиями получат тут если не ответы на некоторые свои вопросы, то хотя бы куда смотреть в поисках ответов. Но не факт, что ответы будут -- это ж фронтир. Может быть, ответы на сегодняшние вопросы будут получены и опубликованы только где-нибудь в августе или даже в следующем году!

Я писал о важности вариационного исчисления 16 марта 2022 вот тут: https://ailev.livejournal.com/1617647.html и там говорил, что без этого плохо можно понимать в таких темах, как порождение и творчество (GAN ведь начинались с VAE, variational autoencoder), экономика (маржинализм), активное/деятельностное/практическое/active рассуждение/inference (и мои мысли были вызваны как раз задействованием вариационности/маржинализма в этой линии мысли). Писал я это в связи с необходимостью развернуть обучение математике и физике к проблемам из жизни, а не как "теоретическим фундаментальным, но бесполезным для большинства проектов" дисциплинам. Это я ещё не знал, что 15 марта 2022 года вышел большой текст Кацнельсона, где он обосновывает вариационное исчисление как основу понимания многомасштабного/многоуровневого устройства жизни и эволюции, и даёт ход на переформулирование его как оптимизационной задачи: "Владимир Арнольд говорил, что главное достижение Ньютона можно сформулировать одной фразой: «Полезно решать обыкновенные дифференциальные уравнения». Исаак Ньютон заметил, что фундаментальные физические законы имеют математическую структуру дифференциальных уравнений. А после Ньютона другие физики: Пьер Ферма в оптике с принципом наименьшего времени, Пьер де Мопертюи в механике с принципом наименьшего действия и, наконец, Жозеф Лагранж с Уильямом Гамильтоном обнаружили, что есть альтернативная формулировка: вместо того чтобы описывать процесс шаг за шагом, как предполагается в дифференциальных уравнениях, можно делать утверждение об оптимальности какого-то функционала, который есть действие (принцип наименьшего действия)" -- "Вся наша жизнь - задачи по оптимизации", интервью с Михаилом Кацнельсоном, https://trv-science.ru/2022/03/vsya-nasha-zhizn-zadachi-po-optimizacii/. А "действие" как фундаментальную физическую величину, которую тоже нужно изучать внимательно, а не "пробегая мимо" в учебниках физики и математики, я обсуждал 22 февраля 2022 в тексте "физмат-стек рациональности", https://ailev.livejournal.com/1613398.html.

Повторю тут на всякий случай алгоритм чтения научной литературы, а хоть это и такое специальное "интервью для газеты", в котором даётся ещё и список литературы. Каждый раз убеждаюсь, что люди не знают, как читать научные статьи -- ведь этому должны были где-то учить, но не учат! Я сам познакомился с этим алгоритмом, работая с СМД-методологами существенно позже своего окончания университета. Вот кратенько: если тебе встретилось слово, похожее на термин, то не стесняйся погуглить -- без этого вполне возможно, что ты не поймёшь, зачем автор пишет свой текст и что им хочет сказать. Если в предисловии делаются какие-то утверждения по поводу каких-то вроде банальностей, смотри литературу по поводу этих утверждений -- там тоже будет много интересного. Если что-то непонятно в литературе, гугли, но ещё лучше -- читай литературу к этой литературе. Это нужно, чтобы хоть как-то синхронизировать модель мира и требуемых в мире действий в голове авторов статьи и модель мира и требуемых в мире действий в твоей голове.

Вот это интервью с Кацнельсоном нужно обязательно читать, и также читать к нему литературу. В интервью проставляются акценты: например, раскрывается роль фрустраций как конкурирующих взаимодействий между (системными/эволюционными) уровнями (грубо говоря: клетка хочет делиться неграниченно, а организму это не надо, зато организм хочет размножить себя неограниченно, но популяции это не надо -- проблемы на многих уровнях, и оптимизационная многоуровневая задача как раз и приводит к цветущей сложности мира). И акцентируется, что речь идёт не только о какой-то концептуальной схеме, но и математическом аппарате. Вот текст про фрустрации как движущую силу эволюции, Physical foundations of biological complexity: https://www.pnas.org/doi/full/10.1073/pnas.1807890115 (Вольф, Кацнельсон, Кунин, ещё без Ванчурина). Или вот напоминается о том, как и откуда возникает (emerge) квантовость/цифровость в нейронных сетях, https://arxiv.org/abs/2012.05082, shows that quantum mechanics provides a correct statistical description of the dynamics of the grand canonical ensemble of neural networks at the learning equilibrium.

Фристон со товарищи тоже хвастается математическим и физическим (хотя физичность он мало поминает, напирает на математику -- но математика-то обслуживает именно физику!) аппаратом, и он по большому счёту тот же самый у всех этих авторов, которых мы отслеживаем. Вот этот матаппарат и подразумеваемую им физику нужно вытащить за скобки всех этих подходов разных исследовательских групп к описанию жизни и развития/эволюции/познания/оптимизации (это, похоже, одно) на многих системных уровнях и давать как общее SoTA знание, которое пригодится для рассуждений/моделирования/объяснений /предсказаний в самых разных проектах на самых разных (в том числе многих, в том числе социальных/культурных) уровнях.

Продолжая тему вариационного исчисления и вариационных принципах (любителям истории: https://en.wikipedia.org/wiki/History_of_variational_principles_in_physics ) в "науках о человеке", вот ещё: "Thinking Through Other Minds: A Variational Approach to Cognition and Culture", которые легко находятся по K.Friston как четвёртому соавтору, https://discovery.ucl.ac.uk/id/eprint/10075929/1/thinking_through_other_minds_a_variational_approach_to_cognition_and_culture.pdf и сразу же ответ критикам с уточнениями TTOM (Thinking Through Other Minds), https://www.academia.edu/download/63300910/2020_BBS_TTOMResponsetoCommentaries.pdf, но это находим по странице первого автора (которую, конечно, сортируем по годам): https://scholar.google.ca/citations?hl=en&user=3_fS8uAAAAAJ&view_op=list_works&sortby=pubdate. Вот это всё о чём: TTOM in Action: Refining the Variational Approach to Cognition and Culture, 2019, "The target article Thinking Through Other Minds (TTOM) offered an account of the distinctively human capacity to acquire cultural knowledge, norms, and practices. To this end, we leveraged recent ideas from theoretical neurobiology to understand the human mind in social and cultural context. Our aim was both synthetic - building an integrative model adequate to account for key features of cultural learning and adaptation; and prescriptive - showing how the tools developed to explain brain dynamics can be applied to the emergence of social and cultural ecologies of mind". Ага, обсуждение культуры и вариационное (и как мы понимаем, оптимизационное) исчисление в основе.
Скажем, при чтении текстов Фристона со товарищи часто используются отсылки к "прагматическому повороту в философии" (pragmatic turn). Те, кто проходил наш курс "Онтологика и коммуникация" сразу понимают, что это что-то про использование в делах, а не про какое-то описание. Гуглим: https://en.wikipedia.org/wiki/Pragmatism и понимаем, что это таки SoTA (и это означает, что всякие другие дисциплины будут медленно дрейфовать в эту сторону). Смотрим литературу и находим "The Pragmatic Turn Toward Action-Oriented Views in Cognitive Science" под редакцией Andreas K. Engel, Karl J. Friston, and Danica Kragic, https://b-ok.cc/book/3360830/020ed2. Смотрим там внутри, и точно -- парочка статей ссылаются непосредственно на Pierce. И довольно много неявных отсылок к философии (скажем, normative science -- https://en.wikipedia.org/wiki/Normativity, это оптимизационное поведение для какой-то целевой функции или функционала/objective function or functional).

А про что основной текст этого сборника про "прагматический поворот к действие-ориентированным описаниям в когнитивных науках"? От сдвига в понимании рассуждений как чисто внутреннего рассуждения с презентациями наблюдаемого мира к пониманию активного (выходящего в мир) рассуждения как шагов действия, причём вычисления идут про действия (восприятие при этом тоже активное действие -- "ощупывание", "оглядывание", а не просто "принятие информации на вход"). Иногда про классический "репрезентационный" подход, подход "отражения" мира в моделях так и пишут: spectator theory, "зрительские" теории, в мире ты как зритель, а не на сцене. Переход на "активный взгляд" с точки зрения действия -- это очень трудный парадигмальный сдвиг. В текущем ОдО2021 постоянно подчёркивается, что мастерство это такой специальный вычислитель с глазками-ручками (датчиками и актуаторами), мозг обязательно с приделанным к нему телом, которым проводятся изменения -- это концепт 4E (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7250653/ -- это критический обзор The “4E” approach to cognition argues that cognition does not occur solely in the head, but is also embodied, embedded, enacted, or extended by way of extra-cranial processes and structures):
-- Embodied: Cognition cannot be fully described in terms of abstract mental processes (i.e., in terms of representations). Rather, it must involve the entire body of the living system (brain and body).
-- Embedded: Cognition is not an isolated event separated from the agent’s ecological niche. Instead, it displays layers of co-determination with physical, social, and cultural aspects of the world.
-- Extended: Cognition is often offloaded into biological beings and non-biological devices to serve a variety of functions that would be impossible (or too difficult) to be achieved by only relying on the agent’s own mental processes.
-- Enactive: Cognition is conceived of as the set of meaningful relationships determined by an adaptive two-way exchange between the biological and phenomenological complexity of living creatures and the environments they inhabit and actively shape.

Познание/исследование/мышление, напомню, это у меня learning, а inference -- это рассуждение (https://ailev.livejournal.com/1548229.html, и я повторил это в ОдО2021). Active inference это "деятельное рассуждение" или даже "практичное рассуждение", ибо это из того же корня, что activity/деятельность/практика и помним human action, но и action -- это "действие" из физики.

Мы обсуждали этот вопрос "прагматического поворота" в наших моделях внимания на последней встрече лаборатории собранности. Переход от метафоры "входной поток от камеры внимания и его обработка/фильтрация/гейтование" к более общему "планирование выставления камеры, её подстройка на каждом шаге рассуждения/действия/нарратива" -- этот переход даётся очень тяжело, ибо язык привычно следует привычному "репрезентационно-вычислительному", "зрительскому" фреймворку. Цикл Бойда в новом фреймворке должен рассматриваться совсем по-другому, ибо шаг "наблюдай" такой же деятельностный и требует понимания, стратегии и планирования, как предыдущий шаг "действуй". В active inference это подают как epistemic foraging, например 2021 "Epistemic Foraging and the Creative Process: Crawling Over Creation", https://link.springer.com/chapter/10.1007/978-3-030-89708-6_6. Так что работа с циклами и ритмами (ритмы по всем исследованиям тоже произошли прежде всего от выделенного ритма шагов, так что мы должны рассматривать их восприятие тоже как сенсоримоторную активность, а не "вычислительную по распознаванию во входном потоке") должна будет как-то перерабатываться, если мы следуем этому прагматическому повороту. Ещё одно следствие этого поворота -- это включение новизны, по линии теории любопытства и теории творчества (сам Фристон всё время поминает при этом Шмитхубера, https://people.idsia.ch/~juergen/creativity.html и https://people.idsia.ch/~juergen/interest.html, но мы помним ещё и о open-endedness и новизне в работах Stanley и Lehman, и много чего ещё по этой линии).

Идея совместного нарратива в диадической (в социологии dyad/диада -- это простейшая группа из двух человек/агентов) коммуникации (в active inference об этом говорят как о structuring communcations как одном из приложений active inference), https://www.sciencedirect.com/science/article/pii/S0149763420304668. These models employ high-order interactions among abstract (discrete) states in deep (hierarchical) models. The sequential nature of language processing mandates generative models with a particular factorial structure-necessary to accommodate the rich combinatorics of language. Many behavioural and neurophysiological correlates of linguistic communication emerge under variational (marginal) message passing, given the right kind of generative model. [вот с этого "variational (marginal)" употребления я и задумался о важности "маржинальной революции" не только в экономике, но во всех трансдисциплинах]. Само понятие "нарратива как лианеризации языка" (я обычно это описываю как "разворачивание спутанного клубка knowledge graph в ниточку" мы давно рассматривали (вот тут в 2019 мы затрагивали этот вопрос как противопоставление схематизации/моделированию/кодированию/формализации и рендеринга/порождения/деформализации/элокуции/разворачивания схемы/нарративизации -- https://ailev.livejournal.com/1494762.html, и там ещё много дополнительных соображений, куда с этим "совместным нарративом" выходить).

Вот с этого места нужно копать идею Markov blankets в её связи с идеей границы агентоида (не агент, но на агента похож, как гуманоид -- не человек, но на человека похож, надо же как-то называть единицу многошкального рассмотрения в стеке создания, в физике это "гранула", хотя может и прямо писать "создатель" в рамках constructor theory и "граница создателя", но нет уверенности, что речь идёт в случае Markov blanket именно о создателях): The Emperor’s New Markov Blankets, http://philsci-archive.pitt.edu/19726/7/The%20Emperor%27s%20New%20Markov%20Blankets_updated.pdf. Причинность: она впаяна в каждое дифференциальное уравнение, ибо states cause motion. И вот тут начинаем различать причинность по Перлу, по Фристону и разные ещё другие варианты причинности (это поминается и в материалах июньского 2021 года симпозиума ActInfLab: https://zenodo.org/record/5797041, Фристон: "So, I think the discussions around Markov, Pearl, Friston and blankets are essential - they're fascinating - and the conclusions of those discussions that I think I'm gonna probably have to refer back to the underlying maths - and that maths is all about connecting Langevin formulations of physics to the kind of calculus that Pearl has established, in a more statistical sense").

В принципе, можно было бы сослаться на учебник active inference, но его ещё нет, он будет в конце марта: https://mitpress.mit.edu/books/active-inference (Thomas Parr, Giovanni Pezzulo and Karl J. Friston -- обратите внимание, что Friston появляется во многих работах третьим-четвёртым автором, его собственных работ не так много, он больше участвует обсуждениями. Но искать все эти работы по active inference проще всего по его страничке в google scholar, https://scholar.google.com/citations?hl=en&user=q_4u0aoAAAAJ&view_op=list_works&sortby=pubdate). На этом закончу, материала по ссылкам в этом посте и так достаточно. Ещё в этом active inference есть много и других направлений, в которых нужно покопаться и разобраться:
-- особенности generative models по сравнению с discriminative models (в том числе воображение и возможные миры)
-- свежие выходы в квантовоподобность (январские статьи Chris Fields с Фристоном в 2022 году, например, https://arxiv.org/abs/2112.15242)
-- niche modification,
-- extension of affordances,
-- reduction of uncertainty как общая цель активных рассуждений
-- меметические рассмотрения
-- проблема индивида (ага, "агентоид" по этой линии)
-- термодинамическая семантика
-- ... там ещё много чего, это ж фронтир. Достаточно вернуться, например, к "куда думать в первом квартале 2022", https://ailev.livejournal.com/1601601.html

UPDATE: обсуждение в фейсбуке -- https://www.facebook.com/ailevenchuk/posts/10222617523120823
Previous post Next post
Up