Искусственный интеллект умеет побеждать в шахматах без знания правил

Система тренируется за действием и "наблюдает" за наградами
Лондонская компания DeepMind создала систему обучения MuZero для искусственного интеллекта, которая побеждает в шахматах и других играх даже без знания правил.

Об этом сообщает Spectrum.

Система тренируется действие за действием и "наблюдает" за наградами, которые она получает после этого. Например, в шахматах - это поставить мат, а в Pac Man - проглотить желтую точку. Затем она меняет методы игры, чтобы как можно эффективнее получить вознаграждение, то есть улучшает свои навыки.

Этот вид обучения путем наблюдения подходит для любого искусственного интеллекта, который сталкивается со сложными проблемами. Кроме абстрактных игр в реальном мире их тоже достаточно.

Читайте также

Томас Хуберт, один из соавторов статьи в Nature, сообщил, что исследователи развивают систему обучения, чтобы она могла сжать размер видео. Среди других планов применения - самоуправляемые машины и дизайн белков, что станет следующим шагом после технологии сборки белков (которую недавно освоила дочерняя программа AlphaFold). Целью может быть разработка фармацевтического препарата на основе белка, который должен действовать на вирус или рецептор на поверхности клетки.

Напомним, что ученые Массачусетского технологического института разработали алгоритм на основе искусственного интеллекта, который может обнаружить признаки коронавируса (COVID-19) в звучании кашля человека.

1