Dzisiejsze sieci neuronowe rozwijają się tak szybko, że czasami po prostu nie masz czasu na śledzenie ich postępów. Teraz malują obrazy, potem komponują muzykę, potem tekst brzmią głosem dowolnej osoby - ich osiągnięcia można wymienić na długi czas. Kolejną niesamowitą technologię zademonstrowali nam naukowcy z University of Washington. Udało im się nauczyć sieć neuronową animacji mimiki byłego prezydenta USA Baracka Obamy. Okazało się to bardzo prawdopodobne.
System potrzebuje nagrania audio przemówienia prezydenta Obamy i trochę wolnego czasu na pracę. Naukowcy zasilili sieć neuronową kilkoma godzinami nagrań wideo byłego prezydenta, aby mogła zbadać jego mimikę i zidentyfikować główne punkty do dalszych prac. I voila! Przy wyjściu dostajemy prezydenta Obamę, który przed kamerą wypowiada frazy, które wypowiedział w jakimś talk show lub gdzie indziej. W tym przypadku oczywiście najlepiej zobaczyć to wszystko na własne oczy. Jak wyjaśnić to słowami, nie jest łatwym zadaniem.
Ira Kemelmacher-Schlitserman, adiunkt na Uniwersytecie Waszyngtońskim, wyjaśnia, że technologia może być przydatna w kilku obszarach. Na przykład w rzeczywistości wirtualnej mowa osoby może być prawie idealnie przeniesiona na jej awatar komputerowy. Takie podejście może poważnie ułatwić życie twórcom gier wideo, którzy używają bardzo złożonych i drogich technologii do rejestrowania ludzkiej mimiki. A tutaj wystarczy nagrać głos osoby i przesłać nagranie do sieci neuronowej.
System nadal jest daleki od doskonałości. W końcu najpierw musi dokładnie przestudiować mimikę osoby, a to będzie wymagało kilku godzin nagrań wideo. Jednak twórcy technologii uważają, że w przyszłości proces ten zostanie znacznie uproszczony. Ta technologia zostanie bardziej szczegółowo zaprezentowana publiczności na wystawie SIGGRAPH 2017, która rozpocznie się w przyszłym miesiącu.
Sergey Gray