История искусственного интеллекта (ИИ)

Oct 25, 2024 21:43


 ИИ - это способность компьютера или управляемого компьютером робота выполнять задачи, обычно связанные с разумными существами. Этот термин часто применяется к проекту разработки систем, наделенных интеллектуальными процессами, характерными для людей, такими как способность рассуждать, обнаруживать смысл, обобщать или учиться на прошлом опыте.


Алан Тьюринг и начало ИИ

Теоретическая работа

Самая ранняя работа в области искусственного интеллекта была проделана в середине 20-го века британским логиком и пионером компьютеров Аланом Матисоном Тьюрингом. В 1935 году Тьюринг описал абстрактную вычислительную машину, состоящую из бесконечной памяти (ленты) и каретки чтения записи, которая перемещается вперед и назад по ленте, считывая и записывая символ за символом. Действия каретки диктуются инструкциями, которые также хранится на ленте в форме символов. Концепция хранимой программы предложенная Тьюрингом,  подразумевает возможность работы машины на основе своей собственной программы, изменяя или улучшая ее.

Эта концепция  теперь известна просто как универсальная машина Тьюринга. Все современные компьютеры по сути являются универсальными машинами Тьюринга.

Во время Второй мировой войны Тьюринг был ведущим криптоаналитиком в Блетчли-Парке , Бакингемшир, Англия.  После окончания войны Тьюринг, возможно, дал самую первую публичную лекцию (Лондон, 1947), в которой упоминался компьютерный интеллект, заявив: «Нам нужна машина, которая может учиться на опыте», и что «возможность позволить машине изменять свои собственные инструкции обеспечивает механизм для этого». В 1948 году он представил основные концепций ИИ в докладе под названием «Интеллектуальные машины».

Тест Тьюринга

В 1950 году Тьюринг представил практический тест на определение искусственного интеллекта как ответ на дебаты, что такое интеллект, который теперь известен просто как тест Тьюринга.  В 1991 году американский филантроп Хью Лёбнер начал ежегодный конкурс Премии Лёбнера, пообещав 100 000 долларов первому компьютеру, который пройдет тест Тьюринга, и ежегодно присуждая 2000 долларов лучшему приложению. Однако ни одна программа ИИ не приблизилась к прохождению чистого теста Тьюринга.

В конце 2022 года появление LLM ChatGPT позволило некоторым специалистам утверждать, что компоненты теста Тьюринга были выполнены. Специалист по данным BuzzFeed Макс Вульф сказал, что ChatGPT прошел тест Тьюринга в декабре 2022 года, но некоторые эксперты утверждают, что ChatGPT не прошел настоящий тест Тьюринга, поэтому указывается, что ChatGPT это языковая модель.

Первые вехи в развитии ИИ

Первые программы ИИ

Самая ранняя успешная программа ИИ была написана в 1951 году Кристофером Стрейчи, впоследствии директором группы исследований программирования в Оксфордском университете. Программа Стрейчи для игры в шашки работала на компьютере Ferranti Mark I в Манчестерском университете, Англия. К лету 1952 года эта программа могла сыграть полную партию в шашки с разумной скоростью.  Информация о самой ранней успешной демонстрации машинного обучения была опубликована в 1952 году. Shopper, написанный Энтони Эттингером из Кембриджского университета, работал на компьютере EDSAC.

Имитируемый мир Shopper представлял собой торговый центр из восьми магазинов. Получив указание купить товар, Shopper искал его, посещая магазины наугад, пока товар не был найден. Во время поиска Shopper запоминал несколько товаров, имеющихся в каждом посещенном магазине (так же, как это мог бы сделать покупатель-человек). В следующий раз, когда Shopper отправляли за тем же товаром или за каким-то другим товаром, который он уже нашел, он сразу же отправлялся в нужный магазин.

Первой программой ИИ, запущенной в США, также была программа для шашек, написанная в 1952 году Артуром Сэмюэлем для IBM 701. Сэмюэл взял за основу программу для шашек Стрейчи и добавил новый функционал. В 1955 году он добавил функции, которые позволили программе учиться на опыте. Сэмюэл включил механизмы как для механического заучивания, так и для обобщения, усовершенствования, которые в конечном итоге привели к тому, что его программа выиграла одну игру против бывшего чемпиона Коннектикута по шашкам в 1962 году.

Эволюционные вычисления

Программа Сэмюэля «Шашки» также примечательна тем, что была одной из первых попыток эволюционных вычислений. Эволюционные вычисления обычно подразумевают использование некоего автоматического метода генерации и оценки последовательных «поколений» программы, пока не будет разработано высокоэффективное решение.

Один из ведущих сторонников эволюционных вычислений Джон Холланд также написал тестовое программное обеспечение для компьютера IBM 701. В частности, он помог разработать программу моделирующую виртуальную крысу, которую можно было бы обучить навигации по лабиринту. Также Холланд предложил новый тип компьютера - многопроцессорный компьютер, который назначал бы каждый искусственный нейрон в сети отдельному процессору. (В 1985 году Дэниел Хиллис решил инженерные трудности и построил первый такой компьютер - суперкомпьютер Thinking Machines Corporation с 65 536 процессорами)

Языки программирования ИИ

В 1960 году Джон Маккарти создал язык программирования LISP (List Processor), который на протяжении десятилетий был основным языком для работы с искусственным интеллектом в мире, прежде чем его вытеснили в 21 веке такие языки, как Python , Java и C++.

Язык логического программирования PROLOG (Programmation en Logique) был задуман Аленом Кольмерауэром в Университете Экс-Марсель, Франция, где язык был впервые реализован в 1973 году. PROLOG был в дальнейшем развит логиком Робертом Ковальски, членом группы ИИ в Эдинбургском университете. Этот язык использует мощный метод доказательства теорем, известный как резолюция, PROLOG может определять, следует ли данное утверждение логически из других данных утверждений. Например, если даны утверждения «Все логики рациональны» и «Робинсон - логик», программа PROLOG отвечает утвердительно на запрос «Робинсон рационален?» PROLOG широко использовался для работы с ИИ, особенно в Европе и Японии.

Развитие ИИ

Экспертные системы

Экспертные системы представляют собой модели изолированного мира - например, модель трюма корабля и его груза - который является самодостаточным и относительно несложным. Для таких систем ИИ включают всю информацию о некоторой узкой области, которую мог бы знать эксперт (или группа экспертов), так что хорошая экспертная система часто может превзойти любого отдельного эксперта-человека.

Существует множество коммерческих экспертных систем, включая программы для медицинской диагностики, химического анализа, управления кредитами, финансового управления, корпоративного планирования, маршрутизации финансовых документов, разведки нефти и полезных ископаемых, генной инженерии и др.

Знание и вывод

Базовыми компонентами экспертной системы являются база знаний (БД) и механизм вывода. Информация, которая должна храниться в БД, получается путем интервьюирования людей, являющихся экспертами в рассматриваемой области. Интервьюер (или инженер по знаниям) организует информацию, полученную от экспертов, в набор правил, обычно имеющих структуру «если-то». Правила такого типа называются правилами вывода. Механизм вывода позволяет экспертной системе делать выводы из правил в KB.

Некоторые экспертные системы используют нечеткую логику. В стандартной логике есть только два значения истинности: истина и ложь. Эта абсолютная точность затрудняет характеристику нечетких атрибутов или ситуаций. Часто правила, которые используют эксперты-люди, содержат нечеткие выражения, и поэтому для механизма вывода экспертной системы полезно использовать нечеткую логику.

DENDRAL и MYCIN

В 1965 году исследователь искусственного интеллекта Эдвард Фейгенбаум и генетик Джошуа Ледерберг , оба из Стэнфордского университета, начали работу над Heuristic DENDRAL (позже сокращенной до DENDRAL ), экспертной системой химического анализа. А в 1972 году была разработана MYCIN, экспертная система для лечения инфекций крови. MYCIN пыталась диагностировать пациентов на основе сообщенных симптомов и результатов медицинских тестов.

Программа могла запрашивать дополнительную информацию о пациенте, а также предлагать дополнительные лабораторные тесты, чтобы прийти к вероятному диагнозу, после чего она рекомендовала курс лечения. По запросу MYCIN объясняла рассуждения, которые привели к ее диагнозу и рекомендации.

Используя около 500 правил, MYCIN работала примерно на том же уровне компетентности, что и специалисты по инфекциям крови, и даже лучше, чем врачи общей практики.

Тем не менее, экспертные системы не понимают общего смысла или границ своей экспертизы.

Коннекционизм

Коннекционизм, или нейроноподобные вычисления , развились из попыток понять, как работает человеческий мозг на нейронном уровне и, в частности, как люди учатся и запоминают. В 1943 году нейрофизиолог Уоррен Маккалок из Иллинойсского университета и математик Уолтер Питтс из Чикагского университета опубликовали влиятельную статью о нейронных сетях и автоматах , согласно которому каждый нейрон в мозге представляет собой простой цифровой процессор, а мозг в целом является формой вычислительной машины.

Как впоследствии выразился Маккалок, «то, что мы думали, что делаем (и я думаю, что мы довольно хорошо в этом преуспели), было обращением с мозгом как с машиной Тьюринга».

Создание искусственной нейронной сети

Однако только в 1954 году Белмонт Фарли и Уэсли Кларк из Массачусетского технологического института сумели запустить первую искусственную нейронную сеть - хотя и ограниченной памятью компьютера 128 нейронами. Они смогли обучить свои сети распознавать простые шаблоны.

Кроме того, они обнаружили, что случайное разрушение до 10 процентов нейронов в обученной сети не влияет на производительность сети -особенность, которая напоминает способность мозга переносить ограниченные повреждения, нанесенные хирургическим вмешательством, несчастным случаем или болезнью.

Персептроны

В 1957 году Фрэнк Розенблатт из Корнеллской авиационной лаборатории в Корнеллском университете, начал исследовать искусственные нейронные сети, которые он назвал персептронами. Он внес большой вклад в область ИИ, как экспериментальными исследованиями свойств нейронных сетей (с использованием компьютерного моделирования), так и посредством детального математического анализа. Розенблатт и его последователи назвали свой подход коннекционистским, чтобы подчеркнуть важность создания и изменения связей между нейронами в обучении. Современные исследователи приняли этот термин.

Современный AI

Применение нейронных сетей

Работы по нейроноподобным вычислениям включают следующее:

Визуальное восприятие. Сети могут распознавать лица и другие объекты по визуальным данным. Например, нейронные сети могут различать, является ли животное на картинке кошкой или собакой. Такие сети также могут различать группу людей как отдельных индивидуумов.

Обработка языка. Нейронные сети способны преобразовывать рукописный и машинописный материал в электронный текст. Нейронные сети также преобразуют речь в печатный текст и печатный текст в речь.

Финансовый анализ. Нейронные сети все чаще используются для оценки кредитного риска, оценки недвижимости, прогнозирования банкротства, прогнозирования цен на акции и других бизнес-приложений.

Медицина. Медицинские приложения включают диагностику органов, а также прогнозирование побочных реакций на лекарства.

Телекоммуникации. Телекоммуникационные приложения нейронных сетей включают управление телефонными коммутационными сетями и подавление эха на спутниковых линиях связи.

Nouvelle AI и LLM

LLM - это языковая модель, состоящая из нейронной сети со множеством параметров (обычно миллиарды весовых коэффициентов и более), обученной на большом количестве неразмеченного текста с использованием обучения без учителя. LLM появились примерно в 2018 году и хорошо справляются с широким спектром задач. Это сместило фокус исследований обработки естественного языка с предыдущей парадигмы обучения специализированных контролируемых моделей для конкретных задач.

В период с 2018 по 2020 год стандартный метод использования LLM для конкретной задачи NLP заключался в тонкой настройке модели с дополнительным обучением для конкретной задачи. Впоследствии обнаружилось, что более мощные LLM, такие как GPT-3, могут решать задачи без дополнительного обучения с помощью методов «подсказки», в которых решаемая задача представляется модели в виде текстовой подсказки, возможно, с некоторыми текстовыми примерами подобных задач и их решений.

Традиционный ИИ в целом пытается создать бестелесный интеллект, чье единственное взаимодействие с миром было косвенным (например, CYC или ChatGPT).

С другой стороны, существует поход который пытается создать воплощенный интеллект, находящийся в реальном мире, - метод, известный как ситуативный подход или Nouvelle AI.  Центральная идея Nouvelle AI заключается в том, что интеллект, выраженный сложным поведением, «возникает» из взаимодействия нескольких простых поведений.

Системы Nouvelle не содержат сложной символической модели своей среды. Вместо этого информация остается «в мире» до тех пор, пока она не понадобится системе. Система Nouvelle непрерывно обращается к своим датчикам, а не к внутренней модели мира: она «считывает» с внешнего мира любую информацию, которая ей нужна, именно тогда, когда она ей нужна.

Критика

Критики  Nouvelle AI указывают на неспособность создать систему, демонстрирующую хоть что-то похожее на сложность поведения, обнаруженную у насекомых. Предположения исследователей конца 20-го века о том, что их новые системы вскоре станут сознательными и будут обладать языком, были несколько преждевременными.

Previous post
Up