Робота научили виртуозным навыкам тенниса на примере игроков-любителей — видео

Человекоподобным роботам нелегко дается освоение атлетических навыков. Подвижные игры требуют превосходной динамики движений, быстрой реакции и предельной точности. Некоторых роботов удалось обучить таким видам спорта, как настольный теннис или футбол, но их движения оставались ограниченными и далекими от естественных.
Решением стал новый подход к обучению, разработанный в Китае. Система под названием LATENT (Learns Athletic humanoid TENnis skills from imperfect human motioN daTa — Обучение атлетическим навыкам игры в теннис с помощью несовершенных данных о движениях человека) описана в препринте на arXiv. Сложность обучения в ней снижена за счет сбора неполных данных о движениях человека, которые представляют собой лишь фрагменты, фиксирующие базовые элементы игры в теннис — например удар справа, удар слева, приставной или перекрестный шаг.
«Наше главное предположение в том, что, несмотря на свою неидеальность, такие квазиреалистичные данные все же задают априорные ограничения относительно базовых человеческих движений в теннисе. Благодаря последующей коррекции и композиции мы можем выработать политику управления роботом, которая позволяет стабильно отбивать летящие мячи в широком диапазоне условий и направлять их в заданные зоны, сохраняя при этом естественность движений», — пояснили авторы.
Отправной точкой послужили пять часов фрагментов базовых теннисных навыков с участием игроков-любителей. Используя компактную систему захвата движений, на их основе составили латентное пространство действий — оптимизированное представление возможных для робота движений, — которое допускает последующую корректировку при выполнении теннисных задач. Применив обучение с подкреплением и серию обширных симуляций, систему развернули на человекоподобном роботе Unitree G1.
В испытаниях роботы играли против людей. Оценивалась эффективность ударов справа и слева, а также игра в ближней и дальней зонах корта. Результаты усреднены по итогам 10 000 раундов и сопоставлены с предыдущими методами.
Такого робота пока нельзя сравнить с профессиональными теннисистами, но выглядят его достижения впечатляюще. Робот может поддерживать розыгрыши из нескольких ударов с человеком, применяя как удары справа, так и удары слева, и адаптироваться к игре в разных зонах корта. Как в симуляции, так и в реальных тестах LATENT превзошел другие методы по частоте успешных ударов, точности и естественности движений.
В лучшем случае робот достиг 96,5% успешных ударов — под этим понимается процент раундов, в которых ему удавалось направить мяч в зону радиусом 2,5 метра от заданной цели.
«Представленная работа открывает несколько возможных направлений для улучшения. Во-первых, предложенный метод для развертывания в реальном мире полагается на систему захвата движений. Внедрение активного зрения могло бы снять это ограничение. Во-вторых, в текущей постановке задачи робот возвращает мячи, которые появляются в случайном месте с заданной скоростью, — это по-прежнему отличается от реального матча, в котором участвуют два игрока», — поделились планами разработчики.
В перспективе система может быть распространена на другие виды спорта или задачи, где сбор безупречных данных о движениях человека затруднителен.




