Вести.net: нейронная сеть AlphaGo научилась играть в го как человек

Искусственный интеллект, похоже, создан: компьютер научился обыгрывать человека в игру Го. Это очень древняя и очень простая с точки зрения правил настольная игра, в которой невозможно просчитать все ходы. То есть в ней побеждают не вычислительные ресурсы, а интуиция и субъективная оценка ситуации.

Искусственный интеллект, похоже, создан: компьютер научился обыгрывать человека в игру Го. Это очень древняя и очень простая с точки зрения правил настольная игра, в которой невозможно просчитать все ходы. То есть в ней побеждают не вычислительные ресурсы, а интуиция и субъективная оценка ситуации.

Игры между человеком и искусственным интеллектом выходят на новый уровень. На этой неделе Седоль Ли, чемпион мира по го из Южной Кореи, проиграл два матча подряд в серии игр с системой искусственного интеллекта AlphaGo, и еще одно поражение в серии приведет к победе компьютера над человеком в этой игре. От предыдущего, первого тестового поединка между AlphaGo от Google и чемпионом Европы Фан Ху (который, кстати, проиграл все пять матчей машине), эта серия игр отличается тем, что к ней приковано внимание всего мира. И суть этого поединка — далеко не столько в самом соревновании, сколько в возможном качественном скачке развития и в признании уровня искусственного интеллекта.

"Почему го? Потому что это одна из самых сложных, если не самая сложная игра с точки зрения количества вариантов, — говорит Александр Крайнов, руководитель службы компьютерного зрения и технологий искусственного интеллекта компании "Яндекс". — Она очень простая по правилам, но вариантов в го великое множество. Расчеты говорят, что их гораздо больше, чем атомов во Вселенной. И рассчитать их, в каких-то других играх, не представляется возможным. Сделать ход и просчитать его последствия в го невероятно тяжело".

Тут стоит оговориться, что AlphaGo — это не классическая вычислительная модель, а целая система параллельной обработки информации. Пропуская данные через нейронные слои, она сразу дает ответ. И он будет правильным, если программу обучать на огромной выборке данных. Специалисты считают, что нейронная сеть AlphaGo (а с точки зрения оборудования — это кластер из 1200 процессоров и 176 специальных серверных видеокарт) обучалась стратегии го около двух лет. И если у человека с годами игровой практики вырабатывается интуиция на сильные и значимые ходы, то программу AlphaGo в Google решили обучить этой самой интуиции. В программу загрузили базу партий профессиональных игроков, пометили как хорошие ходы победителей и как плохие — ходы проигравших игроков.

"Нейронная сеть стала действовать в чем-то как человек, — поясняет Александр Крайнов, руководитель службы компьютерного зрения и технологий искусственного интеллекта компании "Яндекс". — То есть в начале она высказывала некое предположение, куда нужно сходить, затем просчитывала шаги на несколько ходов вперед, как это делали другие программы до этого, пытаясь определить, верное это предположение или нет. И, придя в какую-то точку, оценивала эту позицию — хорошо получилось или нет. И так программа играет. Кроме того, обучаясь на играх лучших игроков и достигнув какого-то уровня, программа стала играть сама с собой, стала глубоко, на много ходов вперед разбирать свои гипотезы, свои предположения, и учиться на собственных играх. Когда я говорю "стала", я не хочу сказать, что это прекратилось. Это делается прямо сейчас. Вот я об этом рассказываю, а где-то нейронная сеть продолжает играть сама собой, учиться на своих ошибках и совершенствоваться".

И искусственный интеллект от Google превзошел все ожидания. Комментаторы отметили, что AlphaGo играет подобно человеку: система ищет и создает уязвимые группы камней, чтобы сделать сильные ходы. Но все-таки говорить об историческом моменте пока рано. Последняя пятая игра в серии пройдет 15 марта. Тогда же определится судьба призового миллиона долларов: или он уйдет на благотворительность, или его получит игрок-человек.

При этом значение этого поединка — в случае если победит ИИ — для мира станет столь же великим, как легендарное шахматное противостояние Deep Blue — Каспаров, проходившее 20 лет назад. Впрочем, некоторые скептики уверены, что знаменитый шахматный матч в девяностых был саморекламой IBM. Сейчас же пиарится Google.

"Впервые статья о том, как играет AlphaGo, появилась в ноябре, но появилась она тихо, на мало кому заметным ресурсе, и достоянием широкой общественности не стала, — рассказывает Александр Крайнов, руководитель службы компьютерного зрения и технологий искусственного интеллекта компании "Яндекс". — В статье рассказывалось, как играет программа, говорилось, что ей удалось одержать победу над европейским чемпионом. Европейские чемпионы, конечно, слабее азиатских, но все равно это был очень сильный игрок. Раньше ничего подобного программы не демонстрировали. Но как-то никто на это не среагировал. А этой зимой Цукерберг еще раз всем сказал: Facebook (запрещена в РФ) работает над искусственным интеллектом, в том числе — над тем, чтобы побороть человека в го. Ну тут PR-отдел Google подсуетился и сказал: "Мы-то еще в октябре обыграли человека в го, в ноябре об этом вышла статья". И это прозвучало как гром среди ясного неба, стало полной сенсацией. Бедного этого француза Фан Ху прям замордовали вопросами: как же так, почему он так плохо играл, может быть, он специально поддался? Как он так — вдруг проиграл программе? Ну и закрутилось".