Путь к светлому будущему

May 07, 2021 23:20

Десять лет назад, ещё до современного взлёта deep learning, в этом журнале я предсказал, что прорыв в AI будет основан на обобщении методов распознавания изображений. Я, правда, совершенно не ожидал, что методами этими окажется старый добрый градиентный спуск, только хорошо так перебрендированный и умеющий уважать инварианты предметной области, а ( Read more... )

2017

Leave a comment

Comments 96

baramin May 7 2021, 20:38:50 UTC
Спасибо! Очень познавательно!

Reply


andrey_zorin May 7 2021, 21:42:13 UTC
Вот с телом как раз и основные проблемы. Проще человека приспособить выполнять команды ИИ.
Раньше думали, что киборг - это уникальные человеческие мозги плюс   новое тело взамен несовершенного мяса.
Оказалось наоборот

Reply

andrey_zorin May 7 2021, 22:48:45 UTC
Эта проблема как раз решаема, - достаточно сделать что-нибудь умнее человека, и пусть оно этим занимается.

А, если серьезно, то вся проблема в материалах, которые бы сокращались при подаче напряжения. Такие решения уже есть, но до человеческих мышц им пока далеко в плане прочности, силы и кратности сокращения.

Reply

plakhov May 10 2021, 09:40:50 UTC
Вы звучите как человек, который в этом разбирается. Расскажите, я никогда не понимал, а зачем вообще это нужно? Почему линейных электродвигателей недостаточно?

Reply

plakhov May 10 2021, 09:35:27 UTC
> Проще человека приспособить выполнять команды ИИ
Гораздо проще, но, к счастью для человечества, итоговая конфигурация дороже.

А так-то да, к этому уже всё идёт. Один мой друг уже пару лет делает довольно жуткие технологии вида "видеокамера следит за людьми, выделяет моменты нарушения инструкции и штрафует". Лично я не хотел бы, чтобы это стало мейнстримом. В принципе, по ту сторону камеры и человек может сидеть, конечно, но у всего этого есть какой-то важный переход количества в качество.

Reply


egovoru May 7 2021, 21:47:08 UTC
Спасибо, полезный обзор!

Reply


anonymous May 7 2021, 22:27:09 UTC
Спасибо, это интересно. Соглашусь с вами, что прорыв в создании сильного AI кажется уже совсем близким, даже несмотря на затянувшееся ожидание. Но есть несколько замечаний ( ... )

Reply

plakhov May 10 2021, 10:26:14 UTC
> Все-таки прорывом в распознавании изображений последних лет стал не градиентный спуск ( ... )

Reply

kray_zemli May 10 2021, 17:49:51 UTC
Если считать, что реальный мир предлагает по одному обучающему примеру раз в секунду, то это всего лишь 30 миллионов примеров в год.

Reply

plakhov May 11 2021, 08:30:02 UTC
Данных "объект-контекст" гораздо больше, каждый фрейм их даёт тысячи. Типа "предскажи левую половину поля зрения по правой и наоборот", только доведенное до предела. Там в комментах GLOM упоминали, вот это как раз размышления Хинтона на эту тему.

Reply


evlasov May 7 2021, 23:43:52 UTC
Boston Dynamics к искусственному интеллекту не имеют отношения.
Распознавание команд на естественном языке далеко не главная задача.

Reply

plakhov May 10 2021, 10:28:33 UTC
Вы звучите так, как будто с чем-то спорите.
Я не очень понял, с чем.

"Распознавание команд на естественном языке" не главная задача, главная задача это построение универсальной Q-функции, специфицируемой командами на естественном языке.

Reply

evlasov May 11 2021, 06:37:28 UTC
Сори, наверное, невнимательно читал.
Q-функция это что-то вроде модели?

Reply

plakhov May 11 2021, 07:46:45 UTC
Это функция оценки позиции. "Вознаграждение", которое непосредственно задаёт задачу, дискретное и редкое, а Q-функция это сглаженная версия, которая показывает, насколько действия агента приближают его к этому вознаграждению.

Очень простым и древним примером является функция оценки позиции в шахматах. Аналогом "функции вознаграждения" является только исход партии: выигрыш, проигрыш или ничья. А подсчёты вроде "конь стоит 3 пешки, ладья 5, ферзь 9-10", позволяющие, собственно, перебирать варианты, это уже какой-то аналог Q-функции. Современные шахматные программы свои функции оценки позиции как раз выучивают, но это легко, потому что сама игра очень дискретная и с полной информацией.

Q-функция для задач реального мира, конечно, будет гораздо сложнее, и в определенном смысле должна включать в себя его модель. Есть надежда, что при достаточно большом датасете и transfer learning-е с предиктивных моделей она там возникнет сама собой. По крайней мере, в тяжелых языковых моделях типа GPT-3 так и случилось.

Reply


Leave a comment

Up