Две разные дороги к искусственному интеллекту
Джон Маккарти, профессор математики в Дартмутском колледже, определял искусственный интеллект как «научные и технические методы создания разумных машин»[169], [170]. Он организовал первую конференцию по этой теме, которая состоялась в колледже в 1956 году. Всего несколько лет спустя вокруг искусственного интеллекта началась масштабная и длительная полемика. Чтобы понять ее суть, а также осознать важность этого обсуждения, давайте рассмотрим различие между тем, как ребенок изучает первый язык, и тем, как большинство взрослых изучает второй язык.
Дети в основном делают это на слух. Они воспринимают разговоры окружающих людей, усваивают некоторые слова и правила, образующие язык, и в какой-то момент начинают говорить сами. У них есть обратная связь: если они делают ошибки, их поправляют, и в итоге дети преуспевают в сложной работе – умении говорить.
Взрослые при изучении нового языка знают, насколько это трудно. Когда они задаются целью овладеть вторым языком, то немедленно сталкиваются с множеством правил: куда поставить местоимения в предложении; какой предлог использовать; как спрягать глаголы; есть ли род у существительных, и если да, каким он бывает; как различать субъект и объект (чтобы понимать, кто является действующим лицом во фразах типа «мать видит дочь») и так далее. Запоминать слова очень трудно, но большинство взрослых людей, изучающих язык, больше страдают от необходимости изучать массу сложных и иногда непоследовательных правил.
Детям не нужны уроки по правилам языка, чтобы научиться хорошо говорить. А вот большинство взрослых не может без них обойтись. Разумеется, эти подходы отчасти перекрываются – многие дети изучают родную речь в школе, а взрослые воспринимают некоторые вещи на слух, – но разница все равно существенна. Мозг ребенка специализируется на изучении языка, и работа происходит по статистическим принципам выделения языковых закономерностей[171]. Например, когда мама говорит о себе как о субъекте, она использует слово «я» и ставит его в начало предложения. Когда она является объектом, она использует слово «меня» и ставит его не в начало. Поскольку мозг взрослых отличается, им приходится изучать правила в явном виде.
На ранних стадиях работы над искусственным интеллектом занимавшееся им сообщество разделилось на два лагеря. Одни сосредоточились на так называемом символическом, или основанном на правилах, искусственном интеллекте, в то время как другие строили системы статистического распознавания образов. Первые пытались разработать искусственный интеллект на тех принципах, посредством которых взрослые люди учат иностранный язык; вторые стремились сделать искусственный интеллект похожим на ребенка, осваивающего речь.
Поначалу казалось, что более успешен символический подход. Например, на Дартмутском семинаре 1956 года Аллен Ньюэлл, Джон Клиффорд Шоу и будущий нобелевский лауреат Герберт Саймон продемонстрировали свою программу Logic Theorist, которая использовала правила формальной логики для автоматического доказательства математических теорем. Она смогла доказать 38 теорем из второй части Principia Mathematica – фундаментального труда Альфреда Уайтхеда и Бертрана Рассела по логике и философии математики. Одно из доказательств программы настолько превосходило по изяществу приведенный в книге аналог, что сам Рассел отреагировал на него «с восторгом»[172]. Саймон объявил, что они с коллегами «изобрели мыслящую машину»[173]. Тем не менее оказалось, что другие задачи намного хуже решаются с помощью подхода, основанного на правилах. Десятилетия исследований в области распознавания речи, классификации изображений, перевода с одного языка на другой и прочих дали весьма неубедительные результаты. Самые лучшие из систем, работающих в этих областях, справляются со своими задачами намного хуже человека, а худшие просто чудовищны. Например, если верить сборнику баек 1979 года, исследователи предлагали для перевода с английского языка на русский фразу «The spirit is willing, but the flesh is weak»[174], [175]. Программа выдала «Виски приемлемо, но мясо испортилось». Вполне вероятно, что это вымышленная история[176], но даже если и так, она вполне правдоподобна. Символические системы искусственного интеллекта, рассматриваемые как единая группа, генерировали весьма заурядные результаты, так что к концу 1980-х в этой области наступила «зима», поскольку иссякли корпоративные и государственные источники финансирования.
СЛИШКОМ МНОГО ПРАВИЛ
Что объясняет такой масштабный провал символических подходов к искусственному интеллекту? Есть два основных препятствия. Одно представляет серьезную проблему для этой области, а второе выглядит вообще непреодолимым. Прежде всего, в мире есть масса правил – как прекрасно знают взрослые, изучающие язык, – и в целом недостаточно знать и соблюдать большинство из них. Чтобы грамотно говорить, вам нужно освоить все правила. Даже если предложение грамматически правильно на 80 процентов, оно, скорее всего, будет звучать комично или даже покажется бессмысленным.
Внутри правил есть свои правила. Так, недостаточно знать, что в английском языке прилагательное обычно ставится перед существительным. В своей книге The Elements of Eloquence («Элементы красноречия»)[177] Марк Форсайт пишет: «Прилагательные в английском языке должны следовать строго в таком порядке: мнение – размер – возраст – форма – цвет – происхождение – материал – предназначение, а далее идет существительное. У вас может быть любимый маленький старый прямоугольный зеленый французский серебряный перочинный ножик. Но если вы хоть чуть-чуть перепутаете порядок слов, вас посчитают безумцем. Странная штука: любой человек, говорящий на английском языке, строго придерживается этого правила, но почти никто не может его сформулировать»[178].
Кроме того, миры, в которых мы живем – и мир физических объектов, и мир идей и понятий, – не стремятся придерживаться единого набора правил. У табуретов есть ножки, а пуф хоть и является частным случаем табурета, ножек может не иметь. В 2002 году американские мужчины не имели права заключать брак друг с другом, а в 2015 году получили такую возможность. Белки не летают, за исключением летяг, которые способны планировать – это своего рода полет. Два отрицания могут иметь положительный смысл («она никогда не грустит»), но два положительных утверждения никогда не составляют отрицания. Ага, конечно.
Попытки систематизировать все правила для таких сложных вещей, как язык, запрограммировать их в компьютерные системы и добиться, чтобы они делали что-нибудь полезное, были большей частью безуспешными. Специалист по информатике Эрнест Дэвис и нейробиолог Гэри Маркус пишут: «В 2014 году мало какие коммерческие системы в значительной степени применяли рассуждения на основании автоматизированного здравого смысла… Никто еще не приблизился к созданию механизма, способного удовлетворительно рассуждать, опираясь на здравый смысл»[179]. Огромное количество людей успешно пользуются здравым смыслом, чтобы преодолевать создаваемые миром барьеры, сложности и непоследовательность. В этом людям не мешают даже искажения и ошибки разума, речь о которых шла в предыдущей главе. Но мы все еще не смогли разработать символьные цифровые системы, способные понимать реальное устройство мира так же хорошо, как наша собственная биологическая Система 1. Компьютеры становятся все эффективнее в узких областях применения искусственного интеллекта, таких как го или распознавание образов, но мы далеки от того, что Шейн Легг, один из основателей DeepMind, назвал общим искусственным интеллектом, – системы, способной применять интеллект к множеству непредусмотренных типов проблем.
ВЕЗДЕСУЩИЙ ПАРАДОКС ПОЛАНИ
Дэвис и Маркус рассказывают, в чем состоит, возможно, самое серьезное препятствие на пути к созданию таких систем: «Рассуждая с помощью обычного здравого смысла, люди… опираются на процессы, большей частью не поддающиеся самоанализу»[180]. Другими словами, когнитивная работа, которую мы делаем, легко проходя через чащобу правил, – это постоянная демонстрация парадокса Полани, утверждающего, что мы можем знать больше, чем способны рассказать. Как говорилось в главе 1, именно этот парадокс до недавнего времени мешал созданию программ, способных играть в го на одном уровне с людьми. Имейте в виду, что этот парадокс вездесущ. Во многих важных случаях мы просто не знаем и не можем знать, какие правила используем, чтобы делать что-то верно.
Этот факт кажется непреодолимым препятствием для создания любого рода автоматизации или искусственного интеллекта. Если никто в мире не знает правил, по которым люди что-то делают, включая самих людей, как же можно создать систему, основанную на правилах или любую другую, способную делать то же, что и мы? Кажется, что парадокс Полани строго ограничивает список человеческих задач, поддающихся автоматизации. Наш коллега из Массачусетского технологического института Дэвид Аутор пишет: «Рамки замены такого рода [замены людей компьютерами] ограничены, поскольку множество задач люди понимают по умолчанию и выполняют без усилий, но ни программисты, ни кто-либо другой не может сформулировать для таких задач явные “правила” или процедуры»[181].
МОЖНО ЛИ СОЗДАТЬ САМООБУЧАЮЩИЕСЯ МАШИНЫ?
Другой лагерь исследователей искусственного интеллекта (тех, кто отказался от символического подхода) с конца 1950-х пытался преодолеть парадокс Полани, разрабатывая системы, изучающие задачи тем же способом, каким дети учат язык, – с помощью опытов, повторения и обратной связи. Эти специалисты создали область машинного обучения, суть которой в точности соответствует названию.
Одной из первых цифровых машин, способных обучаться таким образом, был перцептрон – финансируемый Военно-морскими силами США проект думающей и обучающейся машины. Руководил им Фрэнк Розенблатт, ученый из Корнелльской лаборатории аэронавтики. Назначением перцептрона, появившегося в 1957 году, была классификация объектов, которые он видит, – например, предполагалось, что он сможет отличать кошек от собак[182]. В каком-то смысле он представлялся чем-то вроде крохотной версии мозга[183].
Примерно 100 миллиардов нейронов человеческого мозга не упорядочены по какой-то аккуратной схеме. Они сильно переплетены между собой: типичный нейрон воспринимает входящие сигналы от 10 тысяч своих соседей, а затем посылает выходящий сигнал примерно такому же количеству получателей[184]. Каждый раз, когда на определенное количество входов поступает достаточно сильный электрический сигнал, нейрон направляет собственный сигнал на все свои выходы. Величины, которые мы обозначили словами «достаточное количество» и «достаточно сильный», меняются со временем в зависимости от обратной связи, и нейрон придает каждому из своих входов важность, называемую «весом». В результате этих странных, сложных, не прекращающихся ни на мгновение процессов возникают память, умения, Система 1 и Система 2, внезапные озарения, когнитивные искажения и все остальное, что имеет отношение к нашему разуму.
Перцептрон не мог выполнять такую сложную работу. Его создали только для классификации простых изображений. В нем было 400 фотоэлементов, соединенных случайным образом (чтобы смоделировать запутанность мозга) в один слой искусственных нейронов. Первая демонстрация этой «нейронной сети» вкупе с уверенными прогнозами Розенблатта привела к тому, что газета New York Times написала в 1958 году о перцептроне как о «зародыше электронного компьютера, который, по ожиданиям [ВМС США], будет способен ходить, разговаривать, видеть, писать, воспроизводить себя и сознавать свое существование»[185].
Однако обещанного быстрого прорыва не произошло, а в 1969 году Марвин Минский и Сеймур Пейперт опубликовали сокрушительную критическую работу под названием Perceptrons: An Introduction to Computational Geometry («Перцептроны: введение в вычислительную геометрию»)[186]. Они математически доказали, что проект Розенблатта не способен выполнять некоторые базовые задачи классификации. Для большинства исследователей искусственного интеллекта этого было достаточно, чтобы отвернуться не только от перцептронов, но и от более широкой концепции нейронных сетей и машинного обучения в целом. Зима опустилась на оба лагеря исследователей искусственного интеллекта.
ВЕРНОСТЬ ПЕРЦЕПТРОНАМ ПРИНОСИТ РЕЗУЛЬТАТ
Несколько групп ученых все-таки продолжали заниматься машинным обучением, будучи убеждены, что правильный способ заставить компьютеры думать по образцу человека – это построить на основе модели мозга нейронные сети, способные учиться на примерах. Исследователи поняли, в чем заключались ограничения перцептрона, и преодолели их, комбинируя сложную математику, все более мощное аппаратное обеспечение и прагматичный подход, который позволял им вдохновляться тем, как работает мозг, но не ограничиваться этим. Например, в нейронах мозга электрические сигналы текут только в одну сторону, а в успешных системах машинного обучения, построенных в 1980-е годы Полом Уэрбосом[187], Джеффом Хинтоном[188], Яном Лекуном[189] и другими, информация могла проходить по сети в обоих направлениях.
Это «обратное распространение»[190] обеспечило значительное улучшение работы, однако прогресс происходил безнадежно медленно. К 1990-м система машинного обучения, разработанная Лекуном для распознавания чисел, была способна прочитать до 20 процентов всех рукописных банковских чеков в США[191], но другого практического применения ей не нашлось.
Как показывает недавняя победа AlphaGo, сейчас ситуация совершенно другая. Поскольку AlphaGo использовала эффективный поиск по огромному количеству возможностей – классический элемент систем искусственного интеллекта, основанных на правилах, – она, по сути, была системой машинного обучения. Как пишут ее создатели, AlphaGo – «новый подход к компьютеру, играющему в го, который использует… глубокие нейронные сети… обучаемые новаторским сочетанием контролируемого обучения с помощью игр с экспертами-людьми и обучения с подкреплением через игры с собой»[192].
AlphaGo неединичный случай. В последние годы мы видим расцвет нейронных сетей. Сейчас они, бесспорно, доминирующая форма искусственного интеллекта и, вероятно, некоторое время останутся на лидирующих позициях. Эта область искусственного интеллекта наконец выполняет хотя бы некоторые из тех обещаний, что нам когда-то давали ученые.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОК