Специалисты Google создали полностью самообучаемый искусственный интеллект.

М ногие вопросы, над которыми размышляли крупнейшие умы человеческой цивилизации, по прошествии времени становятся тривиальными и очевидными. Они входят в школьные программы, и непонимание их становится признаком задержки в умственном развитии. Это нормальный процесс эволюции знания. Но остаются проблемы из разряда "вечных", которые не были решены, и неизвестно, существует ли у них решение вообще. К их числу относится понимание того, что такое интеллект, определение искусственного интеллекта и все, связанные с ними практические вопросы. Научным базисом современных разработок в этой области явились работы Норберта Винера , в которых он показал, что основой информационных процессов, происходящих в живом организме, являются сложные отрицательные и положительные обратные связи, которые могут быть смоделированы в искусственном автоматическом устройстве.

Практическая важность темы стала очевидна не так уж давно, если применять временные масштабы истории развития человеческой мысли. Однако сегодня "интеллектуальные агенты" типа Copernic`а или системы распознавания образов установлены уже почти на каждом компьютере. Причиной, почему этот вопрос не нашел своего однозначного решения до сих пор, является то, что для его понимания необходимо применить иные принципы мышления, отличающиеся от тех, которые являются основными для большинства носителей не только "искусственного", но и "естественного" интеллекта. Нельзя понять нечто, находясь внутри. Необходим взгляд извне. Только такой подход может дать объяснение явлению в его взаимодействии с окружающим. Иными словами, для того чтоб понять, как мы думаем, надо думать иначе или не думать вовсе... А понять это необходимо, так как наши "железные" творения уже приблизились к уровню, когда отношение к ним, просто как к техническим приспособлениям, может оказаться недопустимым и привести к стратегическим ошибкам.

Начать анализ существующих систем искусственного интеллекта и сделать предположения об их дальнейшем развитии удобнее всего с программ распознавания графических образов и речи. Эта задача, рассмотренная изолировано, еще не дает ответа на вопрос о том, что же такое искусственный интеллект или способность к мышлению вообще, но позволяет вплотную подойти к нему. Не случайно еще классики марксизма-ленинизма связывали в своих философских работах вопрос появления "человека разумного" с развитием речи.

Если говорить именно об обработке речи, то программное обеспечение от Dragon Systems практически уже решило этот вопрос. Пятая версия Speech SDK от Microsoft , являясь, как и все произведения этой компании, гораздо более громоздким (более 500 Мб на системном диске!) и требовательным к используемым ресурсам, также позволяет обеспечить приемлемое для диктовки качество. Устойчивое распознавание слов и даже целых фраз достигается после нескольких часов тренировки и адаптации системы к особенностям произношения и создания статистической модели речи пользователя. При этом оно может достигать 95-98%. Если сравнить, то, наверное, и человек не сможет разобрать устную речь точнее.

В основе принципа действия упомянутых программных продуктов лежит математическая модель преобразования акустических сигналов в числовые последовательности, каждой из которых соответствует то или иное слово из предварительно загруженного словаря. Словари могут дополняться пользователем, а вероятность выбора из списка близких по своим числовым параметрам слов изменяется в зависимости от частоты их употребления конкретным пользователем. Распознавание графических образов, от стандартных шрифтов до разборчивого рукописного текста, известное большинству читателей по программному обеспечению от фирмы ABBYY (Fine Reader), имеет в своей основе тот же принцип.

Однако сходство между искусственными и естественными или биологическими системами носит чисто внешний характер. Необходимо сразу внести определенность в терминологию. В случае перечисленных программных продуктов мы имеем дело с распознаванием или узнаванием образов, а вот говоря о биологических системах вообще и человеке в частности, правильнее говорить об их понимании. В чем разница?

Диктуя своему скверно русифицированному "Дракону" (Dragon Systems), легко можно обнаружить напечатанной фразу о том, что "Солнце ярко синело на небе". И "Дракон" может гордиться тем, что определил именно эту символьную последовательность с вероятностью 90%, так как слова "сияло" и "синело", с его точки зрения, почти не различаются. Если программа будет учитывать более полную статистику не только по словам, но и по словосочетаниям, (последние версии ряда Natural Speaking уже это делают), а процесс ее обучения составит не дни, а месяцы, что по человеческим меркам - довольно быстро, то, конечно, в следующий раз она запишет эту фразу правильно. Но принцип "узнавания" все же останется именно узнаванием, а не пониманием.

С точки зрения "понимания", прежде всего, необходимо исключить вариант того, что повествование идет от лица собаки, которая из всего спектра цветов различает только оттенки синего, и, следовательно, для нее солнце действительно может "синеть", так как ничего иного ему не остается. Но если говорить серьезно, то для правильного понимания сказанной фразы необходимо иметь представление об описываемых образах реальности. Надо иметь опыт и помнить ощущения жары, лета, берега моря или иной ситуации, в которой данное описание могло бы иметь место. При этом слова (неважно, на каком языке, так как для понимания выбор языка не является принципиальным) являются лишь отражением этой реальности. С точки зрения нашего "Дракона" (или иной системы распознавания образов) это было бы возможным, если оснастить его температурными и световыми спектральными датчиками и отправить в отпуск, скажем, в Анталию. Иными словами, обеспечить ему весь набор органов чувств, сходных с человеческими, и позволить пройти процесс обучения с целью накопления базы данных жизненного опыта хотя бы пятилетнего ребенка. Вывод прост - адекватное человеческому понимание речи или иной вводимой информации возможно только при тождественности жизненного опыта и устройств ввода. Ведь программа распознавания может быть достаточно совершенна и адекватна, но только самой себе. Все ее "органы чувств" состоят из микрофона и клавиатуры, а жизненный опыт - это те часы тренировки и запоминания речевой модели при диктовке, которые она, собственно, и "прожила", как уникальное виртуальное "существо" во взаимодействии со своим окружающим миром, ограниченным голосом "хозяина".

Но и этого еще не достаточно для "понимания". Одной из самых важных черт систем искусственного и "естественного" интеллекта является способность к самообучению. В системах распознавания образов, помимо первичной тренировки изначально установленных словарей и таблиц символов, существует еще и процесс исправления ошибок распознавания, который также запоминается и становится частью их "жизненного опыта". Это очень похоже на дрессировку. Правда, возможности стимулирования здесь сильно ограничены. Правильно определенное слово (или символ) проходит "по умолчанию", а вот ошибка требует ручного ввода нужного значения и, возможно, его дополнительной тренировки. При этом системе, в общем-то, все равно, правильно или нет была определена данная последовательность. Отрицательные эмоции приходятся на долю пользователя-дрессировщика. С собачкой Павлова дело обстоит более жестко: за правильную последовательность действий - сахар, а за ошибку - можно и удар электротоком (или просто удар) получить. Справедливее было бы, если ручная коррекция ошибок распознавания (или, в более общем виде, исправление неправильной с точки зрения "хозяина" реакции на команду или сигнал) вызывала "отрицательные эмоции" именно у системы. Представляете - вы вносите исправление в продиктованный текст, а ваш "Дракон" жалобно попискивает от обиды и переживаний за свою некомпетентность (а может, так оно и есть?)!

В природе существует два механизма совершенствования поведенческих реакций (в нашем примере - это вывод в текстовой форме продиктованного и распознанного материала). Для простейших организмов - это, в основном, принцип естественного отбора, когда наиболее адекватно реагирующие на окружающую среду особи оказываются и наиболее плодовитыми, а сами реакции закрепляются в генетическом коде. Для наиболее развитых представителей и, соответственно, для более сложных поведенческих реакций основным становится механизм мотивации за счет эмоций. Уже не просто физическая боль, чувство голода или стремление к размножению, но и весь мир страданий и радостей - часто по совершенно не понятным на первый взгляд причинам - становится той силой, которая движет человеком (или не только человеком?) по пути самообучения и развития.

Вспомним Книгу Иова (глава 5): "Но человек рождается на страдание, как искры, чтоб устремляться вверх". Вопрос только в том, положительная или отрицательная мотивация (кнут или пряник) преобладает в каждой конкретной жизни. Обычно приходится иметь дело с обоими вариантами, а вообще - кому как повезет...

Из этого следует, что, кроме неадекватности мировосприятия, вторым отличием современных систем искусственного интеллекта является отсутствие стимулов или мотивации для развития как на индивидуальном, так и видовом уровне. Но это отличие является вполне преодолимым.

Если говорить о развитии на видовом уровне, то уже известны "мутирующие" вирусы, которые хотя и не являются интеллектуальными в полном смысле, но зато уже вполне способны в процессе естественного отбора в искусственной среде передавать своим "потомкам" наиболее зловредные черты, препятствующие их отлову.

Вопрос мотивации или создания стимулов к развитию на эмоциональном уровне также является вполне разрешимым. Для этого достаточно понять, что эмоция, положительная или отрицательная, - это всего лишь, соответственно, положительная или отрицательная обратная связь, свойственная любому автоматическому устройству. Поясню: отрицательная эмоция, или отрицательная обратная связь, - это процесс, в котором заложено стремление к его прекращению. Соответственно, и положительная эмоция, или положительная обратная связь, - это процесс, несущий тенденцию к своему продолжению или многократному повторению. Варианты их технической реализации многочисленны, и практически любое устройство - от классического сливного бачка с поплавком и клапаном до современного электрочайника - содержит в себе несколько примеров обратных связей. Естественные же и природные системы буквально насыщены их всевозможными вариантами. Важно отметить, что, в отличие от отрицательной, положительная обратная связь всегда склонна к насыщению, то есть прекращению своей "положительности" с течением времени или после повторения нескольких циклов. Это является принципиальной особенностью. Чисто житейский вывод - страдание бесконечно, а удовольствие всегда ограниченно ("вечный кайф" недостижим). Так что в приведенной цитате из Книги Иова, к сожалению, больше правды, чем нам хотелось бы. Да и кто когда-нибудь слышал, чтоб удовлетворенный и довольный субъект создал что-нибудь достойное внимания, кроме как в области кулинарии?

Внутренние противоречия, конфликты и неудовлетворенность всегда были нормой в творческой среде. Можно попытаться вывести общую закономерность о преобразовании количества неудовлетворенности и страдания в импульс развития, но категории являются слишком общими и расплывчатыми. Одно ясно - Господь Бог посредством применения теории эволюции и теории игр в полной мере оснастил нас комплексом взаимоисключающих желаний и связанными с ними переживаниями для нашего же развития на благо общего прогресса. Причем мера персональных страданий каждого из участников процесса значения не имеет и заслугой не является, а что является конечной целью этого самого прогресса - одному Богу ведомо. Как это очевидное положение совместить с образом Христианского Бога, любящего и всепрощающего, мне пока не ясно. Может, кто на форуме разъяснит. УИрины Богушевской на эту тему есть замечательная песенка со словами: "Небесам все равно, что будет с нами" ... Поэтическое и научное восприятие мира часто приводят к одинаковым выводам.

Но вернемся к нашим баранам и "Драконам", обладающим некоторыми признаками интеллекта. А что если для стимуляции обучения, по примеру Господа Бога, поступившего так с нами, дать им возможность безграничного страдания и кратковременной радости?

Оказывается, подобная работа уже ведется. В качестве стимула выбрано элементарное чувство голода, или - поясню для тех, кто не знает, что это такое, - физиологическое ощущение возможного прекращения существования при отсутствии некоторых внешних компонентов. Речь идет об уникальной серии "Гастророботов" , извлекающих электроэнергию из переработки белков и углеводов в специальном биореакторе. Первой машиной в ряду вечно голодных творений человека является "Жуй-жуй" (Chew Chew), сконструированный Стюартом Вилкинсоном (Stuart Wilkinson) в Университете Тампа (Южная Флорида). Сам изобретатель считает мясо идеальным кормом для своего создания, однако пока "Жуй-жуй" ест кусочки сахара, так как при этом, на радость лаборантам, он оставляет минимум "фекалий". Основной стратегией робота является изучение окружающей среды - вполне реальной, с целью обнаружения и потребления пищи. Адекватность восприятия окружающего мира является достаточно условной и достигается при помощи ультразвуковых сонаров. "Жуй-жуй" пока не сможет подкрасться к вам незаметно, так как состоит из трех вагончиков на колесах, длиной около метра каждый, и похож на поезд детской железной дороги. Постоянное чувство голода - его нормальное состояние, так как аккумуляторы требуют непрерывной подзарядки. Продолжением проекта должна стать подводная машина, питающаяся рыбой и предназначенная для патрулирования побережья и защиты купающихся от акул. Как бы здесь программисты не ошиблись и не создали реальные стальные "челюсти", ведь пловец более легкая добыча, чем акула и автономный "Жуй-жуй" может легко переучиться в "Кус-куса". А какие мысли будут в его вечно голодных электронных мозгах, когда он будет наблюдать беззащитного "Творца", проплывающего вверху, на поверхности?

Несомненно, что развитие науки и технологии в области искусственного интеллекта создает целую группу вопросов, требующих своего решения. Среди них есть и морально-этические проблемы. Причем голодающий, жаждущий мяса "Жуй-жуй" - пожалуй, не самая главная из них. Некоторые из них мы рассмотрим в последующих статьях цикла.

Сейчас же я хотел бы сформулировать вывод, который, возможно, поможет вам по-иному взглянуть на окружающие предметы, животных и людей.

Он заключается в следующем - почти все, что находится рядом с вами, наделено в той или иной мере способностью к отражению мира, к страданию или радости и демонстрирует некоторые признаки интеллекта, далеко не всегда искусственного, а чаще - вполне естественного происхождения. То, что вы их не замечаете, не означает, что их нет. Просто они не совместимы с вашим уникальным восприятием мира.

Может, не так уж и не правы индуистские монахи и последователи некоторых древних учений, одушествляющие все окружающие предметы и наделяющие их способностью "мыслить", страдать и радоваться?

Система искусственного интеллекта ЭЛИС представляет собой программное обеспечение, способное разговаривать как человек на простом языке, управлять устройствами, а также обучаться. С помощью данной программы можно общаться с компьютером, а также взаимодействовать с физическим миром. Программа также использует возможность подключения Ардуино, чтобы создавать системы умного дома, автоматики и т.д.

Скачать программу искусственного интеллекта ЭЛИС

Описание:

Программа искусственного интеллекта ЭЛИС — Электронно Логически Интеллектуальная Система. Система искусственного интеллекта ЭЛИС представляет собой программу. Это программное обеспечение, способное разговаривать как человек на простом языке, управлять устройствами , а также обучаться. Данная система не является ассистентом, так как упор идёт на разработку человекоподобной системы, которая сможет обучаться как ребёнок и вести осознанный диалог.

С помощью данной программы можно общаться с компьютером , а также взаимодействовать с физическим миром. Программа также использует возможность подключения Ардуино, чтобы создавать системы умного дома, автоматики и т.д.

Система искусственного интеллекта ЭЛИС построена по модульному принципу. Система универсальна и её функционал наращивается с помощью модулей . Модули могут быть различные, от простых, до сложных.

Программа искусственного интеллекта ЭЛИС самостоятельно ведет диалог с человеком.

Она может самостоятельно начать диалог, может делать это несколько раз, что уже отличает её от голосовых асистентов, которые работают по структуре вопрос — ответ. Программа искусственного интеллекта ЭЛИС самостоятельно принимает решение после того, что скажет человек, и если не знает, её можно обучить.

При поддержке диалога с пользователем система сама обучается. Система способна запоминать несколько ответов на один или множество вопросов и иметь несколько вопросов на один или множество ответов.

Программа искусственного интеллекта ЭЛИС полностью совместима с платформой Ардуино, поэтому можно управлять любыми устройствами. Можно попросить у системы включить свет, система спросит, где именно включить, но можно попросить включить свет сразу в определённом месте, тогда она не будет переспрашивать.

Программа искусственного интеллекта ЭЛИС также способна запускать сторонние приложения и т.д.

Модули:

В настоящий момент программа искусственного интеллекта ЭЛИС включает следующие модули:

модуль «Знания» — модуль поиска информации по WIKIPEDIA. Система знает любое устройство, предмет и так далее, Спросите например, что такое велосипед или что такое яблоко и система расскажет, что это такое,

модуль «Новости». Свежие новости на интересы пользователя. Просто спросите, какие новости или расскажи новости, система расскажет и спросит, надо ли рассказать ещё, ответив да, она расскажет ещё,

модуль «Погода». Погода на сегодня и на завтра по моему городу. Можно узнать температуру, влажность, скорость ветра, будет ли дождь или мороз. Можно спросить, брать ли зонтик сегодня или можно ли одеть сегодня шорты,

модуль «Калькулятор». С помощью данного модуля , система умеет складывать, вычитать, умножать и делить предметы и т.д. Например спросив, сколько будет два яблока плюс два яблока, система ответит четыре яблока. Модуль в разработке,

модуль «Будильник». Модуль позволяет устанавливать любое количество будильников. Установив будильник, система Вас разбудит. Просто надо сказать, разбуди меня в 7 утра. Модуль в разработке,

модуль «Корректировка ответов». Правильная расстановка знаний в базе,

модуль «Праздники, именины, события». Данный модуль позволяет узнать, кому сегодня день имени или какой сегодня праздник,

модуль «Тосты». Модуль позволяет системе говорить различные тосты. Надо попросить, скажи тост,

модуль «Анекдоты». Система знает тысячи анекдотов. Просто попросите её рассказать анекдот, так-же можно попросить рассказать анекдот для взрослых,

модуль «Стихи». Данный модуль превращает систему в поэта. Просто попросите рассказать стих, так-же можно попросить рассказать стих для взрослых,

модуль «Афоризмы». Система знает тысячи афоризмов. Просто попросите её сказать афоризм, так-же можно попросить сказать афоризм для взрослых,

модуль «Управление освещением». С помощью данного модуля, система умеет управлять освещением квартиры или дома. Для этого надо подключить Arduino и Ethernet Shield,

модуль «Угадывание цифры». Система пытается угадать загаданную цифру. Называет предполагаемую цифру, после надо ей сказать, больше или меньше. Модуль в разработке,

модуль «Пользователь». Модуль позволяет изменять данные пользователя, имя, город и т.д. Например чтобы поменять имя, надо сказать, запомни меня зовут Олег и она запомнит,

модуль «Диалог». Анализ диалога. Модуль, который обрабатывает диалог за сутки, анализируя пользователя, обучаясь и т.д.

Примечание: описание технологии на примере программы искусственного интеллекта ЭЛИС.

Гидрат природного газа - «горючий лед...

Каназит - комплексное стекольное сырье...

Углеродные наноконусы

Наноспутники

Камерные электрические печи гибкого комбинированно...

Промобот – живой автономный робот-промоутер с хара...

Отечественный компьютер Эльбрус...

Рекуперативное торможение

Ротационное формование полимерных изделий...

Солнечная черепица

Гидроэлектростанции с колеблющимися цилиндрическим...

Компания Google занимается созданием искусственного интеллекта, способного обучаться прохождению компьютерных игр, вырабатывая для каждой из них собственные стратегии по итогам серий испытаний. Об этом сообщает The Guardian .

Искусственный интеллект или «агент», как его называют в Google, самостоятельно освоил 49 ретро-игр, для каждой из них предложив уникальную стратегию победы. В будущем эти разработки могут быть применены в области создания беспилотных автомобилей, цифровых ассистентах и научных исследованиях в области климата и космологии.

Это первый значительный шаг на пути к доказательству того, что подобные системы самообучения могут работать. Что они могут решать сложные задачи, которые даже человек находит трудными. Это детский шажок на пути к достижению этой грандиозной цели, но очень важный шажок.

Демис Хассабис, основатель DeepMind

Как отмечает The Guardian, разработанный DeepMind искусственный интеллект следует отличать от программы Deep Blue, обыгравшей Гарри Каспарова в шахматы в 1997 году, или компьютера IBM Watson, научившегося на равных с людьми принимать участие в интеллектуальном шоу «Jeopardy!» (российский аналог - «Своя игра»). В этих случаях правила игр были изначально заложены в программы, а тогда как детище DeepMind способно обучаться им самостоятельно.

При первом запуске игры агент DeepMind получает в своё распоряжение только информацию о расположении объектов на экране и счёте, а затем начинает случайным образом нажимать на кнопки, пытаясь определить, какие действия приводят к улучшению результатов, а какие - к проигрышу.

На то, чтобы освоить ретро-игру, у искусственного интеллекта уходит порядка 600 попыток и двух недель машинного времени. Во многих случаях агент придумал стратегии прохождения, которые исследователи даже не могли себе представить.

По результатам эксперимента искусственный интеллект освоил набор из 49 игр, включающих себя шутеры, гонки и сайд-скроллеры, на 75% от уровня опытного пользователя. В некоторых задачах агент превзошёл человека, а в некоторых - нет.

Как отмечают создатели искусственного интеллекта, подобно людям он обучается методом проб и ошибок, однако уступает человеческому мозгу в играх, где необходимо долгосрочное планирование, из-за отсутствия полноценной памяти. Именно создание такого рода буфера станет следующей целью для компании.

Специалисты DeepMind не разделяют главы Tesla Motors Элона Маска, одного из своих инвесторов, о том, что искусственный интеллект может быть опасен. По их мнению, технология сможет представить реальную угрозу для человечества только спустя десятилетия.

Подразделение DeepMind корпорации Google выпустило алгоритм искусственного интеллекта AlphaGo Zero, который самостоятельно выучил правила игры го. На это ему понадобилось всего три дня, сообщается в статье, вышедшей в журнале Nature .

Компании DeepMind удалось создать самообучаемую программу AlphaGo Zero для игры в Го, для которой можно будет найти и другие применения. Что это значит для науки и для исследователей, рассказали эксперты, занимающиеся вопросами искусственного интеллекта.

Дочерняя компания Google DeepMind, занимающаяся развитием искусственного интеллекта, представила новую версию программы для игры в Го AlphaGo Zero. Новая программа играет значительно лучше старой, которая победила мирового чемпиона по игре в Го ранее в этом году, но, что более важно — она полностью самообучаема.

В DeepMind говорят, что теперь компания на один шаг ближе к созданию алгоритмов общего назначения, которые смогут решать сложнейшие научные проблемы – от создания новых лекарств до моделирования эффектов изменения климата

Специалисты из подразделения DeepMind отмечают, что искусственный интеллект способен обучаться многим наукам и стать специалистом в нескольких областях.

AlphaGo Zero впервые смог сам, без вмешательства человека, обучиться игре. Он победил искусственный интеллект версии 2015 года, который в прошлом году обыграл чемпиона по го из Южной Кореи Ли Се Дола.

Разработчики отмечают, что большинство алгоритмов искусственного интеллекта ограничены в использовании, так как могут решать лишь одну задачу. Однако их разработка способна превзойти человека в выполнении сразу нескольких задач.

Оригинальная AlphaGo продемонстрировала сверхчеловеческую способность игры в Го, но ей для этого потребовалась экспертиза людей-игроков. Для обучения использовалась база данных из более чем 100,000 “человеческих” партий в Го.

В AlphaGo Zero, для сравнения, были заложены только базовые правила Го. Все остальное было изучено с нуля. Как указано в статье в Nature, Zero выработала свои навыки, играя против себя.

Все начиналось со случайных ходов, но при каждой победе Zero обновляла свою систему и играла против себя снова и снова, миллионы раз.

После трех дней игры против себя Zero стала достаточно сильна, чтобы победить свою предыдущую версию, которая победила 18-кратного чемпиона мира Ли Се-дола. Zero победила во всех ста партиях.

Через 40 дней у Zero было 90% побед в игре против самой сложной версии программы AlphaGo. В DeepMind заявляют, что это делает Zero самым сильным игроком в Го в истории.

"Без использования человеческих данных и человеческой экспертизы – в любом виде – мы обошли границы человеческого понимания игры, – сказал ведущий программист AlphaGo Zero Дэвид Сильвер на пресс-конференции. – Следовательно, алгоритм способен создавать знания самостоятельно, просто на основе фундаментальных принципов. Это позволяет ему быть сильнее предыдущих версий".

Сильвер объяснил, что так как Zero играл против себя, он заново открыла стратегии Го, которые люди разрабатывали тысячелетиями.

“Она начала очень наивно, как и начинающий человек, но со временем она играла так, что её было сложно отличить от людей-профессионалов”.

Программа натыкалась на некоторые известные стратегии и варианты во время игры до того, как создать ещё неизвестные стратегии.

“Она обнаружила человеческие ходы, попробовала их, но потом нашла что-то ещё”, – сказал Сильвер.

DeepMind надеется, что, как и более ранние версии AlphaGo, Zero выступит в качестве вдохновения для профессиональных игроков, предлагая им новые ходы и стратегии для игры.

У Zero есть и другие важные преимущества перед ранними версиями. Во-первых, система требует меньше вычислительной мощности, запускаясь всего на четырех TPU (это специальные процессоры для ИИ, созданные Google), в то время как предыдущие версии использовали 48.

Во-вторых, так как Zero самообучаема, это показывает, что мы можем создать новейшие алгоритмы без зависимости от больших объемов данных.

Скептики, например, Джоффри Хинтон, предполагают, что машинное обучение может выполнять только одну задачу. Сбор данных и вычислений помогают приспособить машинное обучение под новые функции, но существующие темпы развития неустойчивы.

Последние исследования DeepMind демонстрируют, что существуют значительные улучшения, которые можно сделать, просто сосредоточив внимание на алгоритмах.

“Эта работа показывает, что комбинация существующих техник может привести дальше, чем многие эксперты могли подумать, даже хотя эти методы не новы”, – сказал Илья Суцкевер, директор по исследованиям в OpenAI. — Но в итоге важно то, что исследователи продолжают совершать улучшения в области, и не так важно, достигается ли эта цель разработкой новых методов или применением существующих методов необычными способами”.

В случае AlphaGo Zero особенно умным ходом оказался отказ от человеческой экспертизы. Сатиндер Сингх, профессор информатики, который написал сопроводительную статью к исследованию DeepMind в Nature, описывает работу как “элегантную” и выделяет её аспекты.

Сингх сказал, что это важная победа для сферы обучения с подкреплением, области ИИ, в которой программы учатся при помощи получения наград за достижение определенных целей, но не получают для этого никаких указаний.

Это более новая сфера работы, чем контролируемое обучение (когда программы получают данные с метками и учатся на них), но у неё больший потенциал. Сингх говорит, что чем больше машина может узнать без руководства человека, тем лучше.

“За последние пять-шесть лет обучение с подкреплением развилось из академического метода до более широкого влияния на мир, и DeepMind внес в это свой вклад”, – говорит Сингх. — Тот факт, что они смогли создать лучшего игрока в Го со значительно меньшим количеством данных и вычислительной мощности и намного быстрее – это большое достижение. Так как обучение с подкреплением – это большая часть ИИ, это значит, что это большой шаг вперед в целом”.

Где можно применить такие алгоритмы? Согласно сооснователю DeepMind Демису Хассабису, они могут обеспечить общество чем-то вроде мыслительного движка для научных исследований.

“Большая часть команды AlphaGo теперь переходит на другие проекты, чтобы попробовать применить эту технологию в других сферах”, – сказал Хассабис на пресс-конференции.

Он объясняет, что AlphaGo – это очень хорошая машина для поиска среди сложных данных.

В случае Zero эти данные сравниваются с возможными ходами в игре Го. Но так как Zero не запрограммирована понимать исключительно Го, она может быть перепрограммирована, чтобы открывать информацию в других областях: поиск лекарств, синтез белка, квантовая химия, физика частиц и создание материалов.

Хассабис предполагает, что потомка AlphaGo Zero можно будет использовать для поиска сверхпроводника при комнатной температуре, гипотетического вещества, которое проводит электрический ток без потери энергии, что позволяет создать необыкновенно эффективные энергетические системы (сверхпроводники существуют, но сейчас они работают при экстремально низких температурах).

Как и в случае Го, алгоритм начнет создавать сочетания разных данных, то есть, атомного состава различных материалов и их свойств, пока не обнаружит что-то, что упустили люди.

“Может быть, где-то существует сверхпроводник при комнатной температуре. Я мечтал о нем, когда в детстве читал книги по физике”, – говорит Хассабис. — Но комбинаций материалов очень много, сложно сказать, [существует ли такая вещь]”.

“Мы пытаемся создать алгоритмы общего назначения, и это просто ещё один шаг вперед, но это волнующий шаг”, – говорит Хассабис.

Пока что испытания, которые выявили бы многозадачность устройства, не проводились. Тем не менее, создатели самообучающегося искусственного интеллекта уверены, что через десять лет их детище будет играть роль научных экспертов и работать бок о бок с людьми.

Планируется, что программа будет использоваться в научной сфере в качестве полноценного члена команды или интерактивной энциклопедии.