Os cientistas alcançaram um avanço na robótica, criando um robô humanóide capaz de mover a boca com uma precisão quase humana. Este desenvolvimento aborda o desafio de longa data do “vale misterioso” – a sensação perturbadora que os humanos experimentam quando os robôs parecem quase reais, mas ficam aquém. A chave? Deixar o robô aprender com sua própria reflexão e horas de vídeos no YouTube.
Como o robô aprendeu a imitar a fala humana
Pesquisadores da Universidade de Columbia desenvolveram o robô, denominado EMO, usando um novo sistema de IA de “visão para ação”. Isto significa que a EMO não depende de regras pré-programadas; em vez disso, aprende como traduzir o que vê em movimentos físicos coordenados. O processo começou com EMO se olhando no espelho. Isso permitiu que o robô entendesse como seus 26 motores faciais – cada um com até 10 graus de liberdade – afetam seus lábios flexíveis de silicone.
Em seguida, os cientistas expuseram o EMO a milhares de horas de fala humana a partir de vídeos do YouTube em 10 idiomas diferentes. O robô aprendeu a conectar os movimentos motores aos sons correspondentes sem compreender o significado das palavras. Este treinamento permitiu ao EMO sincronizar seus lábios com o áudio falado em um nível sem precedentes.
Testando a Ilusão: Estudos de Percepção Humana
Para validar os resultados, a equipe testou a precisão da sincronização labial do EMO com 1.300 voluntários humanos. Os participantes assistiram a vídeos de EMO falando, comparando seus movimentos com o movimento ideal dos lábios, e dois outros métodos de controle: abordagens baseadas em volume e imitação de pontos de referência. Os resultados foram surpreendentes: 62,46% dos voluntários escolheram os movimentos labiais gerados pelo VLA do EMO como os mais realistas, superando em muito os outros métodos (23,15% e 14,38%, respectivamente).
“Grande parte da robótica humanóide hoje está focada no movimento das pernas e das mãos… Mas o afeto facial é igualmente importante para qualquer aplicação robótica que envolva interação humana.” – Hod Lipson, professor de engenharia da Universidade de Columbia
Por que rostos realistas são importantes para robôs
O significado desta pesquisa reside em como os humanos percebem os robôs. Estudos mostram que nos concentramos nos rostos 87% do tempo durante as conversas, com 10-15% dessa atenção direcionada para a boca. Essas dicas não são apenas visuais; eles até impactam o que ouvimos. Os robôs que não conseguem imitar as expressões faciais humanas provavelmente serão vistos como perturbadores ou indignos de confiança.
À medida que os robôs alimentados por IA se tornam mais integrados na vida quotidiana, especialmente em áreas como cuidados a idosos, educação e medicina, as expressões faciais realistas tornar-se-ão críticas para promover a confiança e a comunicação eficaz. Os pesquisadores acreditam que esta descoberta abrirá caminho para robôs capazes de se conectar com humanos em um nível emocional mais profundo.
A capacidade dos robôs de imitar com eficácia os sinais faciais humanos não é mais ficção científica; é uma realidade que se aproxima rapidamente. Esta mudança levanta questões sobre o futuro da interação humano-robô, a ética da criação de máquinas cada vez mais realistas e como definimos a autenticidade numa era de IA avançada.
