Цицерон: vadperez

vadperez

Цицерон

Nov 28, 2022 08:37

"О программе CICERO (Цицерон) от Meta AI, играющей в стратегическую настольную игру Diplomacy, уже неделю пишут как о прорыве. Вполне по делу.

Как говорят разработчики, «агент научился балансировать между ложью и честностью».

Отмечу один момент. Понятно, что Diplomacy требует умения вести переговоры, и Цицерон действует на пересечении двух разных исследовательских областей ИИ: стратегического мышления и обработки естественного языка. Прорыв здесь в том, что агент освоил прямую манипуляцию сознанием людей - умеет словами побудить их принять решение, нужное агенту.

И это уже похоже на выстраивание theory of mind. Вот что утверждают авторы:

«CICERO может сделать вывод, что на более поздних этапах игры ему понадобится поддержка одного конкретного игрока, а затем разработать стратегию, чтобы завоевать его расположение - и даже распознать риски и возможности, которые этот игрок видит со своей точки зрения».

Сразу же вспомнил, что весной я написал текст Имитация человека: как нейросети смогут нас убедить, и там был в т.ч. такой прогноз:

«Если объединить технологии, о которых идет речь выше, мы получим машину, которая выявляет стиль принятия решений конкретного индивида, строит вероятные сценарии его будущих решений и с учетом его уникального стиля подбирает систему аргументов - стремится убедить его мыслить или действовать в нужном направлении».

Цицерон можно считать прообразом такой машины, ее предком. Возрастающую disruptive роль этого сценария еще только предстоит осознать и осмыслить.

И, конечно, убеждение людей машинами будет дополнено, словно по закону симметрии, встречным явлением - убеждением машин людьми. События ускоряются.

Про CICERO см. также:
- новость и исходная статья в Science
- разбор в блоге Гари Маркуса"

via t.me/dtulinov

The first thing to realize is that Cicero is a very complex system. Its high-level structure is considerably more complex than systems like AlphaZero, which mastered Go and chess, or GPT-3 which focuses purely on sequences of words. Some of that complexity is immediately apparent in the flowchart; whereas a lot of recent models are something like data-in, action out, with some kind of unified system (say a Transformer) in between, Cicero is heavily prestructured, in advance of any learning or training, with a carefully-designed bespoke architecture that is divided into multiple modules and streams, each with their own specialization.

мопед не мой, пиар науки