Ученые достигли прорыва в робототехнике, создав гуманоидного робота, способного двигать ртом с почти человеческой точностью. Эта разработка решает давнюю проблему «зловещей долины» – неприятного чувства, которое испытывают люди, когда роботы выглядят почти реальными, но не дотягивают. Ключ к успеху? Позволить роботу учиться на собственном отражении и часах видео с YouTube.

Как робот научился имитировать человеческую речь

Исследователи из Колумбийского университета разработали робота, названного EMO, используя новую систему ИИ «зрение в действие». Это означает, что EMO не полагается на заранее запрограммированные правила; вместо этого он учится переводить то, что видит, в скоординированные физические движения. Процесс начался с того, что EMO смотрел на себя в зеркало. Это позволило роботу понять, как его 26 лицевых моторов – каждый со степенью свободы до 10 градусов – влияют на его гибкие силиконовые губы.

Затем ученые подвергли EMO воздействию тысяч часов человеческой речи из видеороликов на YouTube на 10 разных языках. Робот научился связывать движения моторов с соответствующими звуками, не понимая значения слов. Эта тренировка позволила EMO синхронизировать свои губы со звуковым сопровождением на беспрецедентном уровне.

Тестирование иллюзии: исследования восприятия людьми

Чтобы подтвердить результаты, команда протестировала точность синхронизации губ EMO на 1300 добровольцах. Участникам показывали видео, на которых EMO говорит, сравнивая его движения с идеальным движением губ, а также с двумя другими контрольными методами: основанным на громкости и имитирующим ориентиры. Результаты были впечатляющими: 62,46% добровольцев выбрали движения губ EMO, сгенерированные VLA, как наиболее реалистичные, значительно превзойдя другие методы (23,15% и 14,38% соответственно).

«Большая часть современной гуманоидной робототехники сосредоточена на движении ног и рук… Но лицевая мимика не менее важна для любого роботизированного применения, связанного с человеческим взаимодействием». – Ход Липсон, профессор инженерии Колумбийского университета.

Почему реалистичные лица важны для роботов

Значение этого исследования заключается в том, как люди воспринимают роботов. Исследования показывают, что во время разговоров мы фокусируемся на лицах в 87% случаев, при этом 10–15% этого внимания направлено на рот. Эти сигналы важны не только визуально; они даже влияют на то, что мы слышим. Роботы, которые не имитируют человеческие выражения лица, скорее всего, будут восприниматься как тревожные или ненадежные.

По мере того как роботы с искусственным интеллектом все больше интегрируются в повседневную жизнь, особенно в таких областях, как уход за пожилыми людьми, образование и медицина, реалистичные выражения лица станут критически важными для укрепления доверия и эффективной коммуникации. Исследователи считают, что этот прорыв откроет путь для роботов, способных устанавливать с людьми более глубокую эмоциональную связь.

Способность роботов эффективно имитировать человеческие лицевые сигналы больше не является научной фантастикой; это быстро приближающаяся реальность. Этот сдвиг поднимает вопросы о будущем человеко-роботного взаимодействия, этике создания все более реалистичных машин и о том, как мы определяем подлинность в эпоху продвинутого ИИ.