Роборука учится играть в "Дженгу"

Инженеры из Массачусетского технологического института (MIT) прибегли к алгоритмам машинного обучения, чтобы научить промышленного робота-манипулятороа ABB IRB 120 правилам игры в "Дженгу" ("Башню"). Обладая подвижным запястным шарниром с функцией обнаружения усилия и мягким схватом, роборука научилась ловко выстраивать башню из деревянных брусков, поочередно вытаскивая блоки и перемещая их на верхний этаж.

Инженеры из Массачусетского технологического института (MIT) прибегли к алгоритмам машинного обучения, чтобы научить промышленного робота-манипулятороа ABB IRB 120 правилам игры в "Дженгу" ("Башню"). Обладая подвижным запястным шарниром с функцией обнаружения усилия и мягким схватом, роборука научилась ловко выстраивать башню из деревянных брусков, поочередно вытаскивая блоки и перемещая их на верхний этаж.

На то, чтобы освоить игру, механизму понадобилось всего 300 попыток, а не тысячи, как раньше. Тренировался он как человек, объединяя серии удачных ходов в группы. Как говорит разработчик Альберто Родригес, перед каждой попыткой IRB 120 прощупывает башню на устойчивость, определяя, безопасно ли вытянуть брусок.

"В отличие от задач и игр сугубо познавательного характера, например шахмат или го, игра в 'Дженгу' также требует овладения двигательными навыками, такими как прощупывание, толкание, вытягивание, размещение и выравнивание брусков, — сказал Родригес. — Она требует интерактивного восприятия и манипуляционных действий, когда вам нужно коснуться башни и понять, как и когда переместить блоки".

Технология может быть найти применение в промышленных роботах, которые задействованы на сборочных линиях. Однако сражаться с опытными игроками-людьми манипулятор пока не готов: например, роборука неспособна определить, какие бруски были сдвинуты умышленно, чтобы понизить устойчивость башни к последующим ходам.

Прошлым летом организация OpenAI (финансируется Илоном Маском) объявила о разработке инновационных ИИ-алгоритмов для роботизированной руки. Система получила название Dactyl: она способна не просто манипулировать объектами с ловкостью, близкой к человеческой, но и обучаться этому без какого-либо внешнего вмешательства. Например, ИИ-система позволяет роборуке держать и вертеть пальцами шестигранный кубик почти так же умело, как человек.