Исследователи из Университета будущего Хакодате с помощью искусственного интеллекта написали роман, который прошел в финал литературной премии имени Хоси Синъити. Объявление победителей и вручение призов состоялось еще 12 марта, однако различные издания обратили внимание на это событие только сейчас.
Набор входных данных, определенный учеными заранее, включал в себя пол главных персонажей, описание сюжета, а также набор фраз и предложений, которые должны были быть использованы при написании произведения. После этого программа самостоятельно сгенерировала текст романа, получившего название «День, когда компьютер напишет роман». Других подробностей о работе алгоритма не сообщается.
Текст романа выдвинут для участия в литературном конкурсе имени японского фантаста Хоси Синъити, и был был принят на рассмотрение жюри. Из 1450 работ, поданных на конкурс, 11 были написаны с помощью различных программ, генерирующих текст, однако после четырех этапов отсева только один написанный с помощью искусственного интеллекта роман прошел финальный отбор. При этом членам жюри было неизвестно, что автор роман «робот-писатель».
По словам японского писателя Хасэ Сатоси, роман «День, когда компьютер напишет роман» достаточно хорошо написан. Тем не менее, писатель отметил некоторые недостатки в тексте, написанном машиной - в частности, плохую проработку персонажей.
Это не первый случай, когда робот используется для написания качественного текста. Ранее компания Automated Insights открыла бесплатный доступ к бета-версии сервиса «робота-журналиста» Wordsmith, который позволяет создавать на основе массивов данных короткие заметки, написанные естественным языком.
Вот еще интересный пример.
Скот Хорсли состязается с роботом. Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015
В мае 2015 года Скотт Хорсли (Scott Horsley), корреспондент NPR в Белом доме и бывший бизнес-журналист, бросил дерзкий вызов пишущему алгоритму Wordsmith компании Automated Insights. «Мы хотели узнать, - пишет NPR, - как наше лучшее перо покажет себя против машины». Поскольку NPR - радио, то био-журналист был достаточно тренирован для быстрого письма. По условиям соревнования, оба противника должны были дождаться публикации финансового отчета сети кафе Denny’s и - вперед. Причем у Скота было преимущество - ведь он был постоянным клиентом Denny’s. У него там даже была любимая официантка, Женевьев, которая знала наизусть его заказ: сэндвич из яичницы с беконом. Не помогло. Хотя… как судить.
Робот управился за две минуты, Скот Хорсли - за семь с небольшим. NPR публикует обе заметки и предлагает читателю своего рода тест Тьюринга - определить, какой текст сгенерирован роботом, а какой - человеком.
Журналистский «тест Тьюринга». Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015
Робот написал, конечно же, левую заметку. В ней очевидно выше плотность цифр, и она суше по стилю. Тогда как Скот, вспомнив то ли меню, то ли Женевьев, подпустил немного необязательной для финансового отчета лирики. Например, вставил фразу: «Рост продаж показывает, что потребители не прочь раскрыть свои бумажники ради блинчиков, яиц и картофельных оладий».
Формально словарь робота больше, поскольку должен включать в себя весь словарный запас языка (это свыше 1 млн слов для английского языка). Словарь образованного англоговорящего человека может достигать 100 тысяч слов. Но робот должен использовать наиболее частотные слова, что и делает его язык «суше». Кроме того, словарь этого робота ограничен еще и финансовой специализацией. Ему и «в голову» не могло прийти, что можно использовать в финансовом отчете кулинарные или спортивные названия (grand slam). Человек же, наоборот, частотностью не ограничен и волен использовать сколь угодно редкие и вычурные слова, расширяя контекст и образность. Более того, человек-писатель потому и писатель, что использует оригинальные образы. Роботу для финансового отчета это просто не нужно.
“But that could change”, это может измениться, - пишет NPR. Если хозяин решит скормить Wordsmith массивы более раскованных текстов NPR и слегка подкрутит алгоритм, то «Словесный кузнец» быстро перестроит свою лексику, точнее - расширит границы и принципы ее применения. Это все настраивается.
Кто победил в соревновании? Робот написал быстрее, деловитее. Скот Хорсли, как это ни банально, - медленнее, но человечнее. Аудитория этой заметки - финансисты. Ценна ли для них лирическая вставка про кошельки и блинчики? Покуда читатели еще люди, а не роботы, то, наверное, да, ценна.
В общем, ничья. Хотя две минуты против семи… Для радио, для новостей финансового рынка - это может оказаться критично. Есенинское состязание жеребенка с паровозом проводилось и в академической среде. В 2012 году Кристер Клирвал (Christer Clerwall), профессор медиа и коммуникаций из университета Карлстад, Швеция, попросил 46 студентов прочитать два спортивных отчета - один написанный роботом, и один - человеком. Человеческая заметка была сокращена до размеров роботической, но и роботическая слегка поправлена редактором: заголовок, лид, первые абзацы - как это обычно делает редактор в СМИ. Студентам было поручено оценить материалы по ряду критериев: объективность, доверие, аккуратность, занудность, интересность, ясность, удовольствие читать, полезность, цельность и т.п.
Результаты показали, что одна заметка выигрывала в одних параметрах, другая - в других. Человеческий текст получил больше баллов по критериям «хорошо написано», «приятно читать». Роботический текст, тоже предсказуемо, получил больше баллов по критериям «объективность», «четкое описание», «аккуратность» и т.п. То есть снова ничья.
Но самое главное, что выявило исследование шведского профессора, - что различия между средним текстом био-журналиста и средним текстом кибер-журналиста незначительны. Это критически важный фактор для оценки будущего и уже настоящего робото-журналистики. Кибер-скептики все время говорят, что робот не может написать лучше человека. Но это неверный подход. «А может, заметке робота не обязательно быть «лучше»? Что если она будет просто достаточно хорошей?» - делится профессор Клирвал своими опасениями с Wired.
А как вам такая история.
Это землетрясение вошло в историю журналистики. 17 марта 2014 года в 6.25 утра журналист и программист The Los Angeles Times Кен Швенке (Ken Schwencke) был разбужен подземными толчками. Он подбежал к компьютеру, где в издательской системе его уже ожидала заметка, написанная его алгоритмом Quakebot. Кен пробежал заметку глазами и нажал кнопку «Опубликовать». Так LAT стала первым СМИ, написавшем о землетрясении, - через 3 минуты после толчка. Робот-журналист опередил своих био-коллег.
Первая заметка о землетрясении, написанная роботом. Источник: The First News Report on the L.A. Earthquake Was Written by a Robot. By Will Oremus. Slate, March 17, 2014
Вот эта заметка на сайте LAТ, дополненная через час после повторного толчка. Она подписана именем Швенке, но в конце указано: «this post was created by an algorithm written by the author.»
Алгоритм Quakebot, написанный Кеном Швенке, к тому времени существовал уже два года. Quakebot подключен к ленте американской службы геомониторинга. Из нее он мгновенно берет исходные данные - место, время, амплитуду, сравнивает эти данные с предыдущими землетрясениями в этом районе, тем самым автоматически определяя историческую значимость события. Данные помещаются в подходящий шаблон, и заметка готова. Робот загружает ее в издательскую систему и посылает редактору уведомление. На Пулитцера заметка явно не тянет, зато редактор уже через несколько минут после события имеет готовую публикацию. Остается добавить, что землетрясения входят в перечень горячих новостей Лос-Анджелеса. На сайте Los Angeles Times есть целый раздел Earthquakes, который пополняется роботом-юнкором.
В той же Los Angeles Times робот ведет и другую рубрику - криминальную хронику Homicide Report, причем с 2007 (!) года. Как только полицейский coroner вывешивает в свою базу (она, очевидно, публична) рапорт о чьей-то насильственной смерти, робот берет все данные, помещает их на карту, относит к категориям по расе, полу, причине смерти, участии полицейских и т.п., и публикует заметку с простенькой шаблонной формулировкой в ленту. Далее, если событие того заслуживает, журналист добирает информацию и дописывает развернутую криминальную заметку. А если нет - то нет.
Однако не обходится и без курьезов
Созданный компанией Microsoft самообучающийся твиттер-бот с искусственным интеллектом менее через сутки после запуска начал публиковать экстремистские посты нацистской направленности, сообщает BBC. Робот TayTweets должен был самообучаться в процессе общения в соцсетях. «Тэй создана для того, чтобы развлекать общающихся с ней в интернете людей легкими и шутливыми разговорами, - описывает Microsoft. - Чем больше вы общаетесь с Тэй, тем умнее она становится, общение становится более личным».
Робот был запущен в Twitter 23 марта. Менее чем через 24 часа Microsoft была вынуждена удалить значительную часть опубликованных им постов за экстремистское содержание. В частности робот утверждал, что «Гитлер был прав и я ненавижу евреев», «Буш ответственен за 11 сентября», «Дональд Трамп - наша единственная надежда». Также искусственный интеллект сообщил, что Холокост придумали, поддержал геноцид против мексиканцев и заявил, что ненавидит феминисток.
Представители Microsoft удалили все посты, кроме трех, сделанные роботом, и заявили, что в программу будут внесены некоторые исправления. С вечера 23 марта новых сообщений на аккаунте не появлялось.