Comments | anhinga_anhinga: 9 months since GPT-3 revolution

anhinga_anhinga

9 months since GPT-3 revolution

Feb 28, 2021 03:56

On May 28, 2020 OpenAI published the GPT-3 paper, "Language Models are Few-Shot Learners", https://arxiv.org/abs/2005.14165Read more... )

Comments 60

anhinga_anhinga February 28 2021, 08:56:59 UTC

This is what I wrote in mid July: https://www.cs.brandeis.edu/~bukatin/transformer_revolution.html

A lot has happened since then.

vvagr February 28 2021, 10:45:00 UTC

Не вижу, в каком смысле может "вдруг" появиться "True AI". И что это вообще такое.

А в остальном согласен :-)

anhinga_anhinga February 28 2021, 17:00:57 UTC

Я думаю, что можно сформулировать две узкие задачи. Одна - сделать искусственного программиста на таком уровне, чтобы его, для начала, можно было бы нанимать в корпорации вместо, ну хотя бы, обычных младших программистов (понятное дело, настраемого, чтобы было некоторое разнообразие в популяции таких систем). Это - важная задача, программистов всем не хватает ( ... )

vvagr February 28 2021, 17:49:02 UTC

Если мои представления о ML верны, то в OpenAI, DeepMind & FB уже некоторое время задействованы автоматические системы, проектирующие другие системы на уровне архитектур, обучающие их и гибридизирующие.

Не вижу, чем это не описанный тобой AI researcher.

Насколько я опять-таки понимаю, эти системы гарантированно перешли описанный Винджем рубеж - их работу не понимают ни их создатели, ни создатели их создателей. Однако сингулярности пока нет...

anhinga_anhinga February 28 2021, 19:16:38 UTC

Системы-то есть, но всё, что они делают, это ускоряют и улучшают сходимость при тренировке. То есть, это очень ограниченный класс задач... Это по духу ближе к оптимизируещей части оптимизирующего компилятора, чем к AI researcher, это даже не программист, это что-то вроде очень-очень умного генератора улучшенных оптимизирующих компиляторов ( ... )

Thread 6

egovoru February 28 2021, 13:55:45 UTC

"True AI" can emerge any moment"

А что же все-таки понимается под "true AI"? Каким критериям он должен отвечать?

anhinga_anhinga February 28 2021, 17:16:06 UTC

Я думаю, что для начала нужно сделать искусственного программиста на таком уровне, чтобы его, для начала, можно было бы нанимать в корпорации вместо, ну хотя бы, обычных младших программистов. И сделать так, чтобы могла возникать популяция достаточно разнообразных вариантов таких искусственных программистов ( ... )

egovoru February 28 2021, 18:28:08 UTC

"Я думаю, что для начала нужно сделать искусственного программиста на таком уровне, чтобы его, для начала, можно было бы нанимать в корпорации"

А как Вы оцениваете, насколько далеко мы уже продвинулись по этому пути?

anhinga_anhinga February 28 2021, 19:30:47 UTC

Я знаю, что 9 месяцев назад умели делать вот такую штуку, как в этом демо: https://twitter.com/matvelloso/status/1263193089310461952 (это, как раз, прогресс, который стал возможен благодаря GPT-3, с тех пор люди, пользовавшиеся GPT-3, делали много вещей на таком уровне). Вот, система, которая подсказывает инженеру, как, скорее всего, должны выглядеть следующие несколько строк кода, уже вполне реалистична (и, сколько я понимаю, на ходу кое-где ( ... )

Thread 5

russhatter March 1 2021, 15:58:29 UTC

Твоя попытка объяснения, что такое "attention", похоже, с той же кухни, что и бытовой "наивный байес".
Хочется даже как-то посоветовать где-то перед сложением прологарифмировать вероятности... Но я не вчитывался, надо всё-таки копать сначала оригинал, чтобы что-то утерждать.

anhinga_anhinga March 1 2021, 17:19:31 UTC

Ну, то, как я это пытаюсь объяснить, надо смотреть здесь ( ... )

russhatter March 1 2021, 16:06:14 UTC

Задача для старт-апа такая: клиент грузит отмаркированный датасет, ставит несколько галочек и нажимает на кнопку. А ему в ответ прилетает сваренная по датасету нейронка. И платит за то, что ему не пришлось нанимать спеца по ML.
...Или так уже делают?
Мне кажется, что задача настроек обучения нейронок намного проще задачи кодогенерации говнокода. И ведь это тоже по сути тоже "researcher"...

anhinga_anhinga March 1 2021, 17:39:38 UTC

Да, теперь уже наверное все большие фирмы делают такой AutoML в качестве части своих "machine learning cloud services"; я уж не знаю, насколько он хорошо работает. Статьюки они про это публикуют, и вообще рекламируют, а как оно на деле - хрен знает. Google первым начал предлагать клиентам это дело несколько лет назад.

> Мне кажется, что задача настроек обучения нейронок намного проще задачи кодогенерации говнокода. И ведь это тоже по сути тоже "researcher"...Про это можно много чего сказать. Настоящий "researcher" будет, когда будет более серьёзный прогресс в "AI-generating algorithms"; вот, я тут разбираю эссе человека по имени Jeff Clune на эту тему: https://dmm.dreamwidth.org/24201.html... )

russhatter April 11 2021, 21:34:13 UTC

взглянуть более подробно на тот класс нейронных машин, которые я изучаю последние 5 с небольшим лет: они отлично заменяют любой говнокод
Уточняю: towards-practical-dmms.pdf - оно про это?

anhinga_anhinga April 11 2021, 22:05:09 UTC

Да, это самый новый из моих опусов на эту тему: https://www.cs.brandeis.edu/~bukatin/towards-practical-dmms.pdf

Там, на третьей страничке, есть секция А.2, "Conventional programming and program synthesis", и в ней есть ссылки на примеры.