Творчество машин И уже электронная лира От своих программистов тайком Сочиняет стихи Кантемира, Чтобы собственным кончить стихом. Арсений Тарковский
1 В статье Алана Тьюринга «Вычислительные машины и разум», о которой я уже говорил, есть отдельная главка: «VI. Противоположные точки зрения по основному вопросу», где Тьюринг собрал более-менее стандартные возражения против того, что машины могут «мыслить». Хотя авторы этих возражений весьма уважаемые и серьезные специалисты, но они, с точки зрения Тьюринга, «не в теме». Но некоторые «противоположные точки зрения» касаются глубоких проблем и требуют серьезного ответа. Одно из возражений принадлежит дочери Байрона – графине Августе Аде Лавлейс (1815–1852), первому в истории программисту, автору программ для аналитической машины Чарльза Бэббиджа (1791–1871). Графиня, в частности, написала программу для вычисления чисел Бернулли. Эта программа содержала оператор цикла и использовала переменные («рабочую ячейку») – едва ли не главные признаки любого настоящего языка программирования. Программы леди Лавлейс так и не заработали, поскольку машина Бэббиджа не была достроена. Но всякому программисту приятно думать, что при рождении того вида деятельности, которому он посвятил жизнь, стоит не какой-нибудь бородатый хмурый зануда, а очаровательная светская леди. Графиня высказывалась, так сказать, проспективно, далеко на будущее. Конечно, она не представляла, какими станут машины даже во времена Тьюринга, а тем более сегодня. 17
Но ее точку зрения Тьюринг счел достойной внимания, и я последую его примеру. Тьюринг приводит слова леди Лавлейс: «Аналитическая машина не претендует на то, чтобы создавать что-то действительно новое. Машина может выполнить все то, что мы умеем ей предписать» [Курсив. – Леди Лавлейс]. Тьюринг комментирует ее слова: «Один из вариантов аргумента госпожи Лавлейс – это утверждение, гласящее, что машина “никогда не Августа Ада Кинг (урожд. Байрон), может создать ничего подграфиня Лавлейс (1815–1852) – первый программист в истории линно нового”». А потом Идеи, разработанные графиней Лавлейс, уточняет: «Более удачный вошли во все современные языки про вариант этого возражения граммирования. В ее честь был назван состоит в утверждении, что алгоритмический язык Ada. Первый стандарт языка был утвержден в 1983 г. “машина никогда не может Современная версия – Ada 2012 ничем поразить человека”. Это утверждение представляет собой прямой вызов, который, однако, мы можем принять, не уклоняясь. Лично меня машины удивляют очень часто». Чтобы ответить на возражение леди Лавлейс, я приведу свое понимание того, что можно считать «действительно новым». Понятно, что, если мы подадим 2 и 2 на вход алгоритму сложения натуральных чисел и получим на выходе 4, это, вероятно, не будет чем-то действительно новым. Но всегда надо помнить слова Тьюринга: «Мнение о том, что машины не могут чем-либо удивить человека, основывается, как я полагаю, на одном заблуждении, которому в особенности подвержены математики и философы. Я имею в виду предположение о том, что коль скоро какой-то факт стал достоянием разума, тотчас же достоянием разума становятся все следствия этого 18
факта. Во многих случаях такое предположение может быть весьма полезно, но слишком часто забывают, что оно ложно. Естественное следствие из него – утверждение, что якобы нет ничего особенного в умении выводить следствия из имеющихся данных, руководствуясь общими принципами». Действительно, если бы было достаточно установить некий факт, а все следствия из него получались бы автоматически, то Евклид написал бы только первую книгу своих «Начал», где изложены аксиомы и постулаты геометрии, и этим бы ограничился, поскольку все следствия заведомо известны. Евклид так не поступил, а счел необходимым довольно большое количество следствий (теорем) доказать явно. И на протяжении двух с лишним тысячелетий геометры доказывали все новые и новые теоремы. По-видимому, они полагали, что создают нечто «действительно новое».
2 Тьюринг в более ранней статье «Intelligent machinery» («Интеллектуальные машины», 1948) сформулировал свое отношение к природе познания: «Существует удивительно близкая параллель между задачами физика и криптографа. Система, по которой зашифровано сообщение, соответствует законам Вселенной, перехваченные сообщения – имеющимся наблюдениям, ключи дня или сообщения – фундаментальным константам, которые надо определить. Сходство велико, но с предметом криптографии очень легко оперировать при помощи дискретных механизмов, физика же не так проста»9. На самом деле криптографу немногим легче, чем физику. То, что сообщение, с которым имеет дело криптограф, дискретное, т.е. состоит из конечного набора символов, проблему не слишком упрощает. Ведь и физик в конечном счете имеет дело с дискретным набором экспериментов и наблюдений, которые записаны в виде дискретных же результатов измерений. Единственное преимущество физика, может 9
Цит. по: Стивенсон Н. Криптономикон / Пер. с англ. Е. Доброхотовой-Майковой. М.: АСТ; ЛЮКС, 2004. С. 5.
19
быть, в том, что физические «сообщения» (наблюдения) достаточно регулярны и, как правило, воспроизводимы. То есть, если компьютер сможет достаточно «самостоя тельно» (доля его самостоятельности – это предмет отдельного разговора, как и доля самостоятельности физика, который ставит эксперимент и делает выводы на основе накопленного опыта) проанализировать хаотичную на первый взгляд последовательность нулей и единиц и выявить в ней некоторый нетривиальный смысл, он проделает вполне творческую работу, т.е. найдет нечто «действительно новое», например неизвестный закон природы.
3 В 1960-е годы один из крупнейших математиков ХХ века Андрей Колмогоров (1903–1987) предложил меру сложности информационного сообщения. Пусть нам дано дискретное сообщение – последовательность нулей и единиц, мерой ее сложности будем считать длину программы, которая способна такое сообщение порождать. Например, если сообщение состоит из одних нулей, его сложность мала, поскольку для порождения этой последовательности достаточно очень простой программы (она просто записывает подряд нужное количество нулей), будем считать ее длину равной 1 – просто по числу разных символов, которые она порождает. Информация, содержащаяся в такой последовательности, также равна 1. Это один предельный случай. Пусть теперь у нас есть случайная последовательность из нулей и единиц, где появление нового бита в сообщении никак не связано с предыдущими, тогда нам понадобится программа, которая будет равна длине последовательности. Информация, содержащаяся в ней, равна числу символов в сообщении. Такая последовательность – это шум или хаос. Оба этих предельных случая вырождены: все, что передает подобная последовательность, это сам факт существования сообщения: оно просто есть. Это минимальная информация, которую сообщение может передать. Но нас, вообще говоря, интересует не сама последовательность, а нечто другое, то, что зашифровано этими нулями и единицами, т.е. структура 20
и типы связей в последовательности. У предельно информативной последовательности никакого другого смысла, кроме нее самой, нет. У последовательности из одних нулей смысл элементарен. Когда мы рассматриваем некоторую последовательность символов, мы заранее не знаем, есть ли у отдельных символов или групп символов какие-то связи, содержит ли последовательность какие-то скрытые структуры. Если у нас есть ключ к шифру последовательности, мы можем установить, например, что кажущийся хаос на самом деле закодированный набор букв русского алфавита – а это уже структура. Колмогоровская сложность в этом случае станет меньше, чем у чистого шума. Наша программа будет оперировать уже кодами букв и, вместо того чтобы просто порождать нули и единицы, будет буквы шифровать. Но как раз внутренняя структура нам и интересна. Назовем такую структуру знанием. То есть нас интересуют не сами символы, а их связи и отношения. Всегда существует минимальная колмогоровская программа, которая порождает данную последовательность, – эта программа должна учесть все связи и отношения, имеющиеся в последовательности. Эта минимальная программа и определяет меру сложности. Если компьютер сумеет найти такую программу, он выяснит все возможные связи и отношения, имеющие место в последовательности. Возьмем такой пример. Стихотворный текст включает в себя многочисленные регулярные повторения, и потому каждый символ предсказуем с высокой вероятностью (мы часто можем попросту угадать, какой символ будет следующим, и вероятность такого угадывания, как правило, гораздо выше, чем в произвольном высказывании на русском языке). Колмогоровская сложность такого текста низка, и объем информации в нем сравнительно мал (заведомо меньше, чем в прозе). Но кроме чистой информации сообщения такая минимальная колмогоровская программа шифрует (вкладывает) в сообщение еще и нетривиальную структуру (повторение стоп, рифмы, аллитерации и т.д.), т.е. содержит нетривиальное знание. Как я уже говорил, нас интересует не само сообщение, а те структуры, которые в нем содержатся, т.е. знание. Если 21
мы его отыщем, мы сможем сообщение «понять» (что бы мы ни понимали под «пониманием»). Компьютеры способны обрабатывать огромные массивы данных и выделять в них такие структуры, которые человек выделить не может. Уже только потому, что компьютеры умеют обрабатывать несравнимо бóльшие, чем человек, объемы информации, они уже способны создавать нечто «действительно новое».
4 Теперь отвлечемся от компьютеров и обратимся прямо к человеку, к тому, как в мозге происходят процессы, которые принято называть творческими. Конечно, здесь пока мало что известно, но даже то, что удалось установить, представляется крайне любопытным. В книге Джоны Лерер10 приводятся описания нескольких серий экспериментов, в которых нейрофизиологи и психологи пытались выяснить механизм внезапной догадки, озарения. Ведь именно такой процесс наиболее близок в нашем представлении к творчеству. Марк Биман и Джон Куньос с коллегами поставили следующий опыт. Испытуемым предлагалась задача на догадливость. Ученых интересовал именно сам процесс догадки, и потому задачи были специально подобраны так, чтобы, во‑первых, их трудно было решить прямым перебором и, во‑вторых, чтобы решение не было слишком сложным и догадаться все-таки удалось. Например, задачи такого типа. Дается три существительных: «цветок», «гость» и «век». Придумайте прилагательное, которое подходит ко всем трем. Правильный ответ: «каменный». Действительно, словосочетания «Каменный цветок», «Каменный гость» и «каменный век» вполне «нормальны» с точки зрения русского языка. На задачу отводилось 15 с, потом предлагалась следующая. При этом регистрировались ЭЭГ (электроэнцефалограммы), и мозг испытуемых сканировался с помощью Лерер Дж. Вообрази: Как работает креативность / Пер. с англ. Е. Щербаковой. М.: АСТ, CORPUS, 2013. Статьи, на которые ссылается Дж. Лерер: Beeman M.J. et al. Neural activity when people solve verbal problems with insight // PLOS Biol. Publ. April 13, 2004; Kounios J. et al. The prepared mind: Neural activity prior to problem presentation predicts subsequent solution by sudden insight // Psychol. Sci. 2006, Oct. Vol. 17(10). P. 882–890.
10
22
метода магниторезонансной томографии (МРТ). ЭЭГ позволяет сразу же зарегистрировать активность мозга, а данные МРТ – локализовать его область, где возникла активность. При этом испытуемого просили нажать на клавишу, если он пришел к решению не прямым перебором, а вдруг догадался, т.е. решение как бы «вспыхнуло» у него в мозгу. Как ни странно, человек, оказывается, легко и точно различает эти два разных пути к решению. Человек, решающий задачу, сосредоточен, и в этот момент наиболее активно его левое полушарие, ответственное за логико-символический анализ. Иногда человек решает задачу без всякого озарения. Иногда он не решает задачу – активность мозга спадает и внимание рассеивается. Но иногда происходит удивительная вещь. После того как человек потратил серьезные усилия на решение, его внимание рассеивается, и тут внезапно происходит всплеск гамма-ритма, который регистрирует ЭЭГ. Причем всплеск происходит примерно за 30 мс, прежде чем человек нажимает на клавишу – сигнализирует о догадке. Лерер пишет: «Предполагается, что гамма-ритм происходит от нейронных связей: клетки, распределенные по всей коре, объединяются в новую сеть, которая затем может влиять на сознание». По показаниям МРТ, в этом момент резко повышается активность в передней верхней височной извилине. Лерер пишет: «Эта маленькая складка ткани, расположенная на поверхности правого полушария чуть выше уха, активизировалась за секунды до озарения. (При этом она была пассивна, когда люди пытались решить задачу путем анализа.) Возбуждение контура коры было внезапным и интенсивным, всплеск электроэнергии провоцировал прилив крови». То есть мозг, отчаявшись решить задачу прямым перебором, включает новые ресурсы – фактически задействует правое полушарие, а затем активизируется новая нейронная подсеть. Не имея возможности решение вычислить, мозг делает попытку решение увидеть, схватить сразу целиком как образ. И иногда это удается. К этому вопросу мы еще вернемся, когда в главе «О поэзии и рабочей памяти» будем говорить о том, как мозг анализирует трудный текст. Как показали уже другие исследования, такое переключение часто происходит после того, как мозг расслабляется 23
и концентрация внимания слабеет. Многие трудные проблемы решаются, например, в тот момент, когда уставший человек принимает теплый душ.
5 Пример такого озарения подробно описал великий французский математик Анри Пуанкаре (1854–1912). Как-то он упорно работал над трудной задачей, которая ему никак не давалась. Пуанкаре так описывает моменты озарения11: «В этот момент я покинул Кан, где тогда жил, чтобы принять участие в геологической экскурсии, организованной Горной школой. Перипетии этого путешествия заставили меня забыть о моей работе. Прибыв в Кутанс, мы сели в омнибус для какой-то прогулки; и вот когда я встал на подножку, мне вдруг пришла в голову идея, без всяких, казалось бы, предшествовавших раздумий с моей стороны, – идея о том, что преобразования, которые я использовал, чтобы определить автоморфные функции, были тождественны преобразованиям неевклидовой геометрии» [Курсив мой. – В.Г.]. Обратим внимание на такой важный момент: «автоморф ные функции» (что это по существу мы здесь обсуждать не будем) – весьма нетривиальный абстрактный объект (теория), а вот геометрия (пускай и неевклидова) – в первую очередь конкретный образ и ее можно «увидеть», правда, для этого нужен хорошо тренированный мозг (у Пуанкаре он был в этом смысле едва ли не идеальный). Но это был только первый шаг к решению. Работа сдвинулась и опять застопорилась. «Разочарованный своими неудачами, я поехал провести несколько дней на берегу моря и думал совсем о другой вещи. Однажды, когда я прогуливался по берегу, мне так же внезапно, быстро и с той же мгновенной уверенностью пришла на ум мысль, что арифметические преобразования квадратичных форм тождественны преобразованиям неевклидовой геометрии» [Курсив мой. – В.Г.]. Пуанкаре А. Математическое творчество // Адамар Ж. Исследование психологии процесса: Изобретения в области математики / Пер. с фр. М.А. Шаталовой и О.П. Шаталова, под ред. И.Б. Погребысского. М.: Сов. радио, 1970.
11
24
В этот момент две далекие задачи сомкнулись – автоморфные функции и квадратичные формы оказались «тождественны преобразованиям неевклидовой геометрии» – их связала геометрическая интуиция. И наконец: «Затем я переехал в Мон-Валерьян, где должен был продолжать военную службу. Таким образом, занятия у меня были весьма разнообразны. Однажды, во время прогулки по бульвару, мне вдруг пришло в голову решение этой трудной задачи, которая меня останавливала. Я не стал пытаться вникать в нее немедленно и лишь после окончания службы вновь взялся за нее. У меня были все элементы, и мне оставалось лишь собрать их и привести в порядок». Все этапы этого выдающегося открытия – полной теории автоморфных функций, одного из красивейших результатов во всей истории математики, – завершались в те моменты, когда мозг математика был расслаблен, но это расслабление следовало за периодами чрезвычайно интенсивной сознательной работы. И что не менее важно – главные шаги к решению сопровождались геометрическими интуициями, т.е. мозг обращался к неевклидовой геометрии как к видимой структуре – вычисления включали воображение, и крепости падали одна за другой.
6 Сегодня в связи с возникновением огромных потоков информации человек уже не может с ней справиться. Причем текстовая информация – самая простая, и ее очень мало – это только несколько процентов от всего объема информации, которая циркулирует по глобальным сетям и сохраняется на носителях. Более 90% всей информации – это видео и аудио. Во всем этом информационном океане человек просто тонет. И сегодня едва ли не самой востребованной профессией становится информационный аналитик – человек, способный хоть как-то в этом океане ориентироваться. И здесь ему очень нужна помощь машины, способной выделять структуры из хаоса, отыскивать минимальную колмогоровскую программу. Отдельная область computer science – это data mining, что можно перевести как «добыча данных». Data mining занимается поиском структур в хаосе данных – компьютер проводит 25
разбиение данных на классы, визуализацию, построение функциональных зависимостей данных, проверку корректности данных, т.е. ищет противоречия в показаниях людей и приборов. Особняком стоит поиск аномалий – резких отклонений от нормального (гауссового) поведения. Возьмем такой пример. В аэропорту есть несколько сотен камер наблюдения. Люди с помощью этих камер следят за происходящим, но следят они плохо. Не потому, что они плохие работники, а потому, что они люди, и их ресурс сосредоточенного внимания весьма ограничен. И в эти же камеры смотрит компьютер, анализируя поведение людей в аэропорту. Человек, который пришел в аэропорт, ведет себя довольно предсказуемо. Его маршруты стандартны. Например, пройдя регистрацию и сдав багаж, он с высокой степенью вероятности отправится на посадку. Компьютер знает все стандартные маршруты, и пока человек от них не отклоняется, ничего тревожного машина не замечает. Но стоит человеку отклониться от «нормального» маршрута, компьютер тут же выделяет его из потока и поднимает флажок тревоги. Если человек после регистрации пошел купить воды или направился в туалетную комнату, за ним уже следит машина, но пока его маршрут еще не вызывает особых опасений, а вот если, сдав багаж, человек направится к выходу из аэропорта, компьютер сразу даст сигнал охране – срочно требуется проверка. Конечно, служба охраны тоже следит за пассажирами. Конечно, опытные сотрудники тоже знают, что нестандартное поведение требует повышенного внимания, но в аэропорту тысячи людей, и движется эта масса хаотически. А риск слишком велик. Компьютер нестандартное отклонение не пропустит и сделает это в реальном времени. И это важнейшее преимущество машин. Обнаружить аномальное поведение пассажира постфактум, просматривая видеозаписи, наверное, смогут и люди. Но может быть уже слишком поздно.
7 Другой пример «мыслящих» программ – антивирусные системы. Самый простой и весьма эффективный способ борьбы с вирусами состоит в следующем: поскольку вирус есть некоторая последовательность нулей и единичек, 26
которая активируется в специальной среде (операционной системе), эту последовательность (или ее неизменяемую часть) всегда можно детектировать – найти ее в памяти машины. Такая постоянная последовательность называется сигнатурой вируса. Антивирусные системы имеют непрерывно пополняемые базы таких сигнатур. Но если у вируса нет постоянной сигнатуры, бороться с ним гораздо труднее – его трудно однозначно распознать в памяти. Этим пользуются так называемые полиморфные вирусы – они способны полностью измениться, буквально до последнего бита. Каждый экземпляр подобного вируса выглядит совершенно по-другому, хотя все они делают свое черное дело примерно одинаково. Для их поиска применяются так называемые эвристические методы. Все они основаны не на поиске сигнатуры, а на анализе поведения программы. Антивирус следит за программой в памяти машины примерно так же, как программы наблюдения следят за поведением человека в аэропорту. Например, если неизвестная программа вдруг запросила доступ к загрузочному сектору, это наверняка вирус, поскольку все программы, имеющие право работать с загрузочным сектором, известны заранее. Но это простой случай, бывают гораздо более изощренные ситуации, и такого рода вирусы нередко пробивают защиту и на какое-то время получают возможность контролировать работу машины. Один из методов, который применяют антивирусные системы, называется «песочница». Антивирус «прикидывается» операционной системой, запускает подозрительную программу в замкнутой, контролируемой среде и смотрит, что программа будет делать. Если поведение программы нормальное, антивирус разрешает ей работать. Если программа пытается сделать что-то вредоносное – она сразу блокируется. Существуют и другие методы борьбы. Самое важное здесь для нашей сегодняшней темы – антивирус в реальном времени должен принять решение о вредоносности программы. Он не знает заранее, с чем имеет дело. Если он ошибется и заблокирует нормальную программу – будет плохо, он нарушит штатную работу пользователя. Если он ошибется и пропустит вредоносную программу, будет еще хуже. То есть и здесь антивирусная программа должна выделить 27
в хаосе памяти определенную структуру и самостоятельно принять решение. Это уже близко к настоящему творчеству. Эволюция компьютерных вирусов – очень интересная тема, поскольку здесь мы имеем возможность проследить, как меняются методы «выживания» в жесткой конкурентной среде. Мы наблюдаем борьбу не на жизнь, а на смерть между вирусами и антивирусными системами. Конца этой борьбе не видно. Методы, применяемые обеими сторонами конфликта, становятся все более тонкими и сложными. На сегодня нет как неуловимых вирусов, так и непробиваемых систем защиты.
8 Лауреат Филдсовской премии математик Владимир Вое водский (1966–2017) так сформулировал главную задачу, которая сегодня стоит перед математикой: «Чистая математика работает с моделями высокого уровня абстрактности и малой сложности (математики эту малую сложность любят называть “элегантность”). Прикладная математика работает с моделями более конкретными, но высокого уровня сложности (много переменных, уравнений и т.д.). Интересные применения идей современной чистой математики, скорее всего, лежат в области высокой абстрактности и высокой сложности. Эта область сейчас практически недоступна во многом из-за ограниченной способности человеческого мозга работать с такими моделями. Когда мы научимся использовать компьютеры для работы с абстрактными математическими объектами, эта проблема постепенно отойдет на второй план и появятся интересные приложения идей сегодняшней абстрактной математики»12. Владимир Воеводский активно исследовал такие языки программирования и такие основания математики, которые позволят работать со сложными моделями высокого уровня абстракции. Фактически задача сводится к тому, чтобы научить компьютер проводить доказательство и искать решения очень сложных математических проблем. Воеводский 12
И нтервью Владимира Воеводского. URL: http://baaltiil.livejournal. com/200269.html
28
полагал, что этого вполне можно достигнуть в обозримом будущем. Если вы когда-либо занимались решением математических задач (например, в школе), то помните, как это было непросто. Часто нужно и сосредоточенное внимание, и выдумка, и даже озарение. Но это в школьных задачах. Воеводский говорит о настоящих, глубоких проблемах, которыми занимаются математики самого высокого уровня. Если удастся хотя бы приблизиться к решению поставленной Воеводским задачи, то мы приблизимся к настоящему творчеству машин. Тогда действительно достаточно будет написать первую книгу Евклида и попросить компьютер установить многие возможные следствия из аксиом и постулатов или хотя бы убедиться, что сформулированная теорема верна.
9 В 2018 году филологи Борис Орехов и Павел Успенский поставили следующий эксперимент13. Они обучили искусственную нейронную сеть писать стихи. Сегодня это не слишком сложно. А потом предложили человеку (одному из соавторов) пройти своего рода тест Тьюринга. «Исследователю предложено два поэтических текста: малоизвестное стихотворение автора первой четверти XX века и компьютерное произведение, сгенерированное при помощи нейронных сетей. Обучающим корпусом выступило собрание русскоязычных стихотворных текстов 1900–1930-x годов, включенных в поэтический корпус Национального корпуса русского языка». Исследователь должен был решить, какой из текстов написан машиной, а какой – человеком. Я приведу оба стихотворения целиком, чтобы читатель попробовал пройти этот тест самостоятельно, т.е., прежде чем продолжать чтение (где ответ дан), решить: какой из текстов написала машина. 13
Орехов Б., Успенский П. Гальванизация автора, или эксперимент с нейронной поэзией // Новый мир. 2018. № 6.
29
Стихотворение А Автомобили на полях, и вот он веселый поднял как ветер, и вот и все возвратится в поле, и в полумгле неподвижной под водой поднялись в поле заката, и вот он на поле над водой поднялась в поле и волна веселая веселая, и в поле вечернем положит волна. И вот она возвратилась в поле волна, и в поле волнуют ветер ветерки, и вот под поляной полный волн, и вот под небом белым поднялась волна, и в поле ветер взор весело поднял. И вот он поднял веселый голос, и вечерний полет волненья вознесли в полумгле невольной, и снова в городе поднимались. Под ветерком волны вдоль полей поднялись в поле веселом, и ветер ветер в поле проснулось, и вот под поляной полоса взоров ветер поднял веселый полог. Стихотворение Б автомобили роют грубой толпы рожи в качели луну нудя руду левой левой ватаги солдат кружит жужжелица ковчеги убогих ложат на мостовую деревяшки тьмы тем тьмы тем кофеен столы мосты с перепугу прыгают нынче молотит женщину сутолка лакеи как тангенс как тангенс столбы торчат улицу оплели провода телефонов рыжие волосы созвездия по ним говорят с землей злы гудки подымают окрайны травят просонки городов варьете фокстерьеры лижут лижут людей гной рушат рабочие столбы изъедены червоточиной провода в рыжие клочья горе горе господам им падают подстрелены гарью на тротуары капканы светила в концах волос с дохлой дохлой давно луной но углится земля заплатана лохмотьями под ущербом любви сожжена сожжена смерть дым 30
Прежде чем привести ответ филолога, расскажу, как я сам пытался решить, где же здесь сочинение компьютера, а где – человека. Стихотворение Б мне показалось зависимым от текстов Маяковского и русских футуристов и напомнило явление, известное по работе с искусственными нейронными сетями: так называемое «переобучение»14, когда сеть «залипает» на обучающих примерах. Особенно часто случается, когда обучающие данные разнофакторны и их сравнительно мало, а в примере, который разбирают филологи, мы имеем дело именно с таким случаем. Переобученная сеть при самостоятельной работе (например, при распознавании или формировании предсказания) пытается воспроизвести случайно выделенные «закономерности», которые, может быть, в обучающих выборках и есть, но сеть-то обучали для работы с гораздо большими объемами входных данных, а вот для них эти случайные «закономерности» совсем нетипичны. Переобучение сети, как правило, приводит к серьезным отклонениям и требует специального «огрубления», чтобы сеть могла работать более «гладко». То, что в тексте встретилась «дохлая луна» (а так назывался один из сборников русских футуристов), показалось мне характерным признаком переобученности. Стихотворение А напротив показалось звуковым слепком, построенным на аллитерации и постепенном варьировании некоторого смыслового инварианта – образе колебания или волны вне зависимости от того, что же колеблется. Я даже предложил его интерпретацию. Автомобиль едет через поле овса (в полумгле молодой овес практически синий) – и поле колеблется, примерно как «волнуется желтею щая нива». При сильном (веселом) ветре поле выглядит практически как море. Если дорога то опускается в низину, то поднимается на взгорок, – поле оказывается то выше линии взгляда, то ниже, и машина как бы то ныряет в море, то поднимается на волне. Вот только строчка про город меня 14
Так обычно переводят английский термин «overfitting», что, скорее, значит «переприспособленность», «слишком большая адаптированность к конкретным условиям».
31
несколько смутила – она в предложенную мной картинку как-то не укладывалась. Филолог, «проходивший» тест Тьюринга, подробно – строчку за строчкой – проанализировал оба стихотворения и пришел к следующим выводам. «Представляется, что стихотворение А очень плохо поддается концептуализации. Каждая новая строка резко меняет смысловой фокус текста. В стихотворении одновременно слишком много повторов и слишком много недоговоренностей (эллипсисов и семантических пропусков)… О чем этот текст? О рождении ветра? О заражении весельем? О неких волнах, которые каким-то образом связаны с ветром? Возникает впечатление, что в этом стихотворении сломана линейная структура повествования, хотя текст все время настаивает на последовательности событий (повторы “и вот”), а сами события, о которых повествуется, никак не могут появиться в фокусе высказывания. Можно было бы сказать, что текст А написан нейронной сетью. Стихотворение Б представляется предельно апокалиптическим… Тот факт, что стихотворение по своей сути модернистское, не вызывает никаких сомнений. Обыгрывание названия футуристического сборника 1913 года, влияние стилистики Маяковского, а также описание то ли чаемой, то ли уже случившейся революции заставляет датировать его 1913–1920-ми годами… Таким образом, если необходимо категорически ответить на вопрос, какой из текстов написан компьютером, то напрашивающийся кандидат – это текст А. Стоит подчеркнуть, что это решение отчасти продиктовано логикой от противного: поскольку текст Б, несмотря на сложные языковые метафоры, в каком-то смысле оказался проще и “прочитался” как связный и последовательный (при этом не все его элементы получили глубокое и до конца логичное обоснование), а текст А, в свою очередь, остался загадочным, то логично было предположить, что именно первый текст – компьютерный». Я ошибся, а филолог оказался прав. Он верно определил, что компьютер «написал» именно текст А. Автор 32
текста Б – человек. Это стихотворение в 1917 году написал авангардист Илья Зданевич (1894–1975), в оригинале оно называется «Ущерб любви». Но аргументированно показать, какое стихотворение написал именно компьютер, оказалось совсем непросто. Фактически главным доводом в пользу «компьютерного происхождения» текста А стало отсутствие концептуальной рамки, т.е. некоторого осмысленного высказывания, которое передает не каждая строка отдельно, а весь текст целиком. Но это ограничение не кажется непреодолимым: нужны бóльшие объемы обучающих данных, чтобы работать не с отдельными строчками, а с крупными блоками текста. И тогда, вполне возможно, компьютеру удастся построить целый текст, имеющий смысл. То, что это возможно, подтверждается и моим прочтением. Я видел это волнуемое ветром поле молодого овса, и оно осталось в памяти. Есть ли этот образ в тексте, который «писал» компьютер, или он просто «вчитан» в текст, ответить я не берусь.
10 Эпиграф к этой главе взят из стихотворения Арсения Тарковского «Мне другие мерещатся тени…». Оно написано в начале 1970-х, на излете «кибернетического бума», когда казалось – и не только любителям, но и самим ученым, – что машины вот-вот и заговорят, и задумаются, и книги будут писать, и музыку. Ничего этого не произошло. Оказалось, что даже такие вполне технические задачи, как создание все более мощных процессоров, невероятно сложны и требуют радикально новых идей. Примерно в то же время, когда Тарковский писал свое стихотворение, была реализована американская программа «Apollo» – полет человека на Луну. Так вот, компьютеры IBM, которые NASA использовало при реализации этой программы, имели производительность несравнимо меньшую, чем любой сегодняшний смартфон: бортовой компьютер «Аполлонов», летевших к Луне, имел оперативную 33
память 8 Кбайт15 и неперезаписываемый диск с данными на 70 Кбайт. Оперативную память у наших сегодняшних игрушек мы считаем в гигабайтах – это в 100 000 раз больше, чем у компьютера «Аполлона». Но кажется, как раз сегодня компьютеры подходят к тому пределу сложности, за которым возможна их самостоятельная («автономная») работа. Кажется, они уже могут что-то такое сочинять «от своих программистов тайком». К разговору о взаимоотношениях человека и машины мы вернемся в последних разделах этой книги.
15
https://en.wikipedia.org/wiki/Apollo_Guidance_Computer