Vědci dosáhli průlomu v robotice vytvořením humanoidního robota, který dokáže pohybovat ústy s téměř lidskou přesností. Tento vývoj řeší dlouhotrvající problém “uncanny valley” – nepříjemný pocit, který lidé zažívají, když roboti vypadají téměř opravdově, ale nedosahují. Klíč k úspěchu? Nechte robota učit se z vlastního odrazu a hodin videí na YouTube.
Jak se robot naučil napodobovat lidskou řeč
Vědci z Kolumbijské univerzity vyvinuli robota nazvaného EMO, který využívá nový systém umělé inteligence od vidění k akci. To znamená, že EMO se nespoléhá na předem naprogramovaná pravidla; místo toho se učí převádět to, co vidí, do koordinovaných fyzických pohybů. Proces začal tím, že se EMO na sebe podíval do zrcadla. To umožnilo robotovi pochopit, jak jeho 26 obličejových motorů – každý s až 10 stupni volnosti – ovlivňuje jeho pružné silikonové rty.
Vědci poté vystavili EMO tisícům hodin lidské řeči z videí YouTube v 10 různých jazycích. Robot se naučil spojovat motorické pohyby s odpovídajícími zvuky, aniž by chápal význam slov. Toto školení umožnilo EMO synchronizovat rty se soundtrackem na bezprecedentní úrovni.
Testování iluze: Výzkum lidského vnímání
Aby tým potvrdil výsledky, otestoval přesnost synchronizace rtů EMO na 1300 dobrovolnících. Účastníkům byla promítnuta videa mluvící EMO, která porovnávala jeho pohyby s ideálními pohyby rtů a také s dalšími dvěma způsoby ovládání: na základě hlasitosti a napodobování orientačních bodů. Výsledky byly působivé: 62,46 % dobrovolníků zvolilo pohyby rtů EMO generované VLA jako nejrealističtější, výrazně převyšující ostatní metody (23,15 % a 14,38 %).
„Velká část dnešní humanoidní robotiky se zaměřuje na pohyb nohou a paží… Ale výraz obličeje je stejně důležitý pro jakoukoli robotickou aplikaci, která zahrnuje lidskou interakci.“ —Hod Lipson, profesor inženýrství, Columbia University.
Proč jsou pro roboty důležité realistické tváře
Význam této studie spočívá v tom, jak lidé vnímají roboty. Výzkum ukazuje, že se během konverzace soustředíme na tváře 87 % času, přičemž 10–15 % této pozornosti směřuje do úst. Tyto signály nejsou důležité pouze vizuálně; dokonce ovlivňují to, co slyšíme. Roboti, kteří nenapodobují výrazy lidské tváře, budou pravděpodobně vnímáni jako znepokojující nebo nedůvěryhodní.
S tím, jak se roboti s umělou inteligencí stále více začleňují do každodenního života, zejména v oblastech, jako je péče o seniory, vzdělávání a medicína, se realistické výrazy obličeje stanou zásadními pro budování důvěry a efektivní komunikace. Vědci věří, že tento průlom připraví cestu pro roboty, kteří dokážou vytvořit hlubší emocionální spojení s lidmi.
Schopnost robotů efektivně napodobovat lidské obličejové podněty již není sci-fi; to je rychle se blížící realita. Tento posun vyvolává otázky týkající se budoucnosti interakce mezi člověkem a robotem, etiky vytváření stále realističtějších strojů a toho, jak definujeme autenticitu ve věku pokročilé umělé inteligence.

























