Создано машинное зрение, которое работает быстрее человеческого

Международная команда ученых разработала нейроморфную систему машинного зрения, которая благодаря феноменальному быстродействию будет идеальной для обеспечения безопасности автономного вождения.
Задержка реакции машин по сравнению с человеком долгое время оставалась непреодолимым препятствием. Например, беспилотный автомобиль, движущийся со скоростью 80 км/ч, затратит около полусекунды на реакцию на препятствие, в то время как белковому водителю достаточно около 0,15 секунды. Это означает, что за время обработки информации машина успеет проехать дополнительные 13 метров до начала торможения.
Даже самые современные процессоры значительно уступают человеку в скорости анализа высококачественных изображений для определения движущихся объектов и траектории их перемещения. Такая задержка создает фундаментальные риски при использовании роботов, дронов и автономных транспортных средств.
Наконец-то создано машинное зрение, которое работает быстрее человеческого. Статья о разработке вышла в журнале Nature Communications.
Искусственный аналог — лучше оригинала
«Наш подход демонстрирует ускорение в 400%, превосходя производительность человеческого уровня, сохраняя или улучшая точность за счет использования временных признаков. Мы не заменяем полностью существующие камеры, а с помощью аппаратных плагинов позволяем стандартным алгоритмам компьютерного зрения работать в четыре раза быстрее, что имеет большую практическую ценность для инженерных применений», — рассказал один из авторов Гао Шо из Пекинского университета аэронавтики и астронавтики.
В основу технологии положен принцип человеческого зрения, которое при внезапном появлении препятствий реагирует на движущиеся объекты, вместо того чтобы обрабатывать изображение целиком.
Аппаратное обеспечение для реализации такого алгоритма построено на двумерных синаптических транзисторах — по сути, высокочувствительного чипа для детектирования движения. Эти транзисторы обладают тремя ключевыми свойствами: способностью обнаруживать изменения в изображении всего за 100 микросекунд (значительно быстрее человеческого восприятия), удерживать информацию о движении более 10 000 секунд и выдерживать свыше 8000 рабочих циклов без деградации характеристик.
Получив кадр, система игнорирует статичную часть изображения и регистрирует только ключевые изменения, выделяя все «движущиеся объекты», которые затем передаются стандартным алгоритмам для детальной обработки. В статье утверждается, что этот процесс более чем в 10 раз быстрее традиционных подходов.
Новинку тестировали в различных сценариях, включая автономное вождение, навигацию дронов и работу роботизированных манипуляторов. По словам разработчиков, аппаратная часть анализирует данные о движении вчетверо быстрее аналогов, а в идеальных лабораторных условиях даже превосходит возможности человека.
Отмечено улучшение на 213,5% в обнаружении опасностей при вождении и на 740,9% в точности захвата объектов роботизированной рукой.
Испытано в реальных условиях
В реальных испытаниях эффективность несколько ниже, но все равно лучше, чем у предыдущих систем автономного вождения. По оценкам исследователей, выигрыш примерно в 0,2 секунды может сократить тормозной путь на 4,4 метра для автомобиля, движущегося со скоростью 80 км/ч.
«В дорожно-транспортном происшествии эти четыре метра часто определяют, произойдет ли столкновение или все обойдется», — заметил Гао Шо.
Для небольших дронов система помогла сократить время реакции как минимум на треть, значительно повысив выносливость и производительность.
«Данный проект, без сомнения, углубит сотрудничество с китайскими автомобильными компаниями и производителями беспилотников. Мы надеемся оснастить автономные транспортные средства этой системой "аппаратных рефлексов", чтобы они реагировали на внезапные изменения дорожной ситуации быстрее человека, что принципиально повысит безопасность беспилотных систем», — заключил ученый.




