"О программе
CICERO (Цицерон) от Meta AI, играющей в стратегическую настольную игру Diplomacy, уже неделю пишут как о прорыве. Вполне по делу.
Как говорят разработчики, «агент научился балансировать между ложью и честностью».
Отмечу один момент. Понятно, что Diplomacy требует умения вести переговоры, и Цицерон действует на пересечении двух разных исследовательских областей ИИ: стратегического мышления и обработки естественного языка. Прорыв здесь в том, что агент освоил прямую манипуляцию сознанием людей - умеет словами побудить их принять решение, нужное агенту.
И это уже похоже на выстраивание theory of mind. Вот что
утверждают авторы:
«CICERO может сделать вывод, что на более поздних этапах игры ему понадобится поддержка одного конкретного игрока, а затем разработать стратегию, чтобы завоевать его расположение - и даже распознать риски и возможности, которые этот игрок видит со своей точки зрения».
Сразу же вспомнил, что весной я написал текст
Имитация человека: как нейросети смогут нас убедить, и там был в т.ч. такой прогноз:
«Если объединить технологии, о которых идет речь выше, мы получим машину, которая выявляет стиль принятия решений конкретного индивида, строит вероятные сценарии его будущих решений и с учетом его уникального стиля подбирает систему аргументов - стремится убедить его мыслить или действовать в нужном направлении».
Цицерон можно считать прообразом такой машины, ее предком. Возрастающую disruptive роль этого сценария еще только предстоит осознать и осмыслить.
И, конечно, убеждение людей машинами будет дополнено, словно по закону симметрии, встречным явлением -
убеждением машин людьми. События ускоряются.
Про CICERO см. также:
-
новость и исходная
статья в Science
-
разбор в блоге Гари Маркуса"
via
t.me/dtulinov The first thing to realize is that Cicero is a very complex system. Its high-level structure is considerably more complex than systems like AlphaZero, which mastered Go and chess, or GPT-3 which focuses purely on sequences of words. Some of that complexity is immediately apparent in the flowchart; whereas a lot of recent models are something like data-in, action out, with some kind of unified system (say a Transformer) in between, Cicero is heavily prestructured, in advance of any learning or training, with a carefully-designed bespoke architecture that is divided into multiple modules and streams, each with their own specialization.