Робота научили виртуозным навыкам тенниса на примере игроков-любителей — видео

Система обучения на несовершенных данных может быть применена для освоения человекоподобными роботами и других видов спорта.
Galbot Robotics

Человекоподобным роботам нелегко дается освоение атлетических навыков. Подвижные игры требуют превосходной динамики движений, быстрой реакции и предельной точности. Некоторых роботов удалось обучить таким видам спорта, как настольный теннис или футбол, но их движения оставались ограниченными и далекими от естественных.

Решением стал новый подход к обучению, разработанный в Китае. Система под названием LATENT (Learns Athletic humanoid TENnis skills from imperfect human motioN daTa — Обучение атлетическим навыкам игры в теннис с помощью несовершенных данных о движениях человека) описана в препринте на arXiv. Сложность обучения в ней снижена за счет сбора неполных данных о движениях человека, которые представляют собой лишь фрагменты, фиксирующие базовые элементы игры в теннис — например удар справа, удар слева, приставной или перекрестный шаг.

«Наше главное предположение в том, что, несмотря на свою неидеальность, такие квазиреалистичные данные все же задают априорные ограничения относительно базовых человеческих движений в теннисе. Благодаря последующей коррекции и композиции мы можем выработать политику управления роботом, которая позволяет стабильно отбивать летящие мячи в широком диапазоне условий и направлять их в заданные зоны, сохраняя при этом естественность движений», — пояснили авторы.

Отправной точкой послужили пять часов фрагментов базовых теннисных навыков с участием игроков-любителей. Используя компактную систему захвата движений, на их основе составили латентное пространство действий — оптимизированное представление возможных для робота движений, — которое допускает последующую корректировку при выполнении теннисных задач. Применив обучение с подкреплением и серию обширных симуляций, систему развернули на человекоподобном роботе Unitree G1.

В испытаниях роботы играли против людей. Оценивалась эффективность ударов справа и слева, а также игра в ближней и дальней зонах корта. Результаты усреднены по итогам 10 000 раундов и сопоставлены с предыдущими методами.

Такого робота пока нельзя сравнить с профессиональными теннисистами, но выглядят его достижения впечатляюще. Робот может поддерживать розыгрыши из нескольких ударов с человеком, применяя как удары справа, так и удары слева, и адаптироваться к игре в разных зонах корта. Как в симуляции, так и в реальных тестах LATENT превзошел другие методы по частоте успешных ударов, точности и естественности движений.

В лучшем случае робот достиг 96,5% успешных ударов — под этим понимается процент раундов, в которых ему удавалось направить мяч в зону радиусом 2,5 метра от заданной цели.

«Представленная работа открывает несколько возможных направлений для улучшения. Во-первых, предложенный метод для развертывания в реальном мире полагается на систему захвата движений. Внедрение активного зрения могло бы снять это ограничение. Во-вторых, в текущей постановке задачи робот возвращает мячи, которые появляются в случайном месте с заданной скоростью, — это по-прежнему отличается от реального матча, в котором участвуют два игрока», — поделились планами разработчики.

В перспективе система может быть распространена на другие виды спорта или задачи, где сбор безупречных данных о движениях человека затруднителен.

Подписывайтесь и читайте «Науку» в MAX