Роборука научилась собирать кубик Рубика
Управляющий роборукой искусственный интеллект от компании OpenAI научился собирать кубик Рубика. Чтобы решить эту задачу, которая под силу не каждому человеку, разработчикам понадобилось
Управляющий роборукой искусственный интеллект от компании OpenAI научился собирать кубик Рубика. Чтобы решить эту задачу, которая под силу не каждому человеку, разработчикам понадобилось более двух лет, а у нейросетей на это ушел аналог 13000 лет. Об этом компания сообщила в своем блоге.Компания начала работу с симуляции сборки. С этой задачей нейросеть, которую создали сотрудники OpenAI, справилась относительно легко, за два месяца. Однако физическая реализация оказалась гораздо сложнее - спустя чуть более года после начала работы инженеры смогли научить роборуку лишь манипулировать обычным кубиком.Чтобы решить задачу, инженеры OpenAI использовали два инструмента - алгоритм Герберта Косиембы, с помощью которого можно переупорядочить цветные квадраты (то есть сделать то, в чем заключается сборка кубика Рубика) менее чем за 20 ходов, и так называемое обучение с подкреплением. Особенность этого метода тренировки нейронных сетей заключается в том, что искусственный интеллект во время обучения действует в некоторой среде, а потом получает от нее обратную связь и учится таким образом.
Также по теме: