Sieć Neuronowa Nauczyła Się Generować Filmy Na Podstawie Opisu - Alternatywny Widok

Sieć Neuronowa Nauczyła Się Generować Filmy Na Podstawie Opisu - Alternatywny Widok
Sieć Neuronowa Nauczyła Się Generować Filmy Na Podstawie Opisu - Alternatywny Widok

Wideo: Sieć Neuronowa Nauczyła Się Generować Filmy Na Podstawie Opisu - Alternatywny Widok

Wideo: Sieć Neuronowa Nauczyła Się Generować Filmy Na Podstawie Opisu - Alternatywny Widok
Wideo: Jeśli zobaczysz to na niebie, masz kilka sekund na ukrycie 2024, Może
Anonim

Sztuczna inteligencja tworzy filmy fabularne - na razie krótkie i niewyraźne, ale kiedyś sama zastąpi całe studio filmowe.

Sieci neuronowe są już całkiem dobre (aw wielu przypadkach lepsze od ludzi) w rozpoznawaniu wzorców na obrazie i są w stanie opisać ogólnie całe sceny. Generatywne sieci neuronowe wykonują odwrotną transformację i mogą tworzyć obraz na podstawie jego opisu lub przewidywać następną ramkę na podstawie poprzednich.

Belgijscy programiści poszli jeszcze dalej, łącząc te możliwości w jeden system, który tworzy filmy „z niczego”, w oparciu o własne doświadczenia z uczeniem maszynowym i tekstem scenariusza. Tinne Tuytelaars mówiła o tym na spotkaniu Association for the Advancement of Artificial Intelligence (AAAI), które odbyło się w Stanach Zjednoczonych.

Sieć neuronowa działa w dwóch etapach - zdaniem Tinne, jakby naśladując proces twórczy człowieka: w pierwszym etapie powstaje rozmyty, przybliżony „szkic” każdej klatki, po czym doprecyzowuje się i dodaje szczegóły. Jedną z ważnych części takiego systemu jest dyskryminacyjna sieć neuronowa, która porównuje wynik z „prawdziwymi” filmami pasującymi do danego scenariusza i pozwala ocenić jego jakość, usprawniając pracę generatywnej części systemu.

Sieć neuronowa została przeszkolona w 10 scenach („gra w golfa na trawie”, „kitesurfing w morzu” itp.) I nauczyła się rozdzielać działania i okoliczności od siebie, a także mogła łączyć je w dowolny sposób, tworząc filmy, na przykład „Golf w basenie”:

Image
Image

lub „żeglowanie po śniegu”:

Image
Image

Film promocyjny:

Oczywiście jakość takich animacji jest nadal daleka od akceptowalnej: „filmy” trwające około sekundy składają się tylko z 32 klatek o wymiarach 64x64 piksele.

Ale z takim samym przekonaniem możemy zagwarantować, że te liczby szybko się poprawią, bo jeszcze nie tak dawno samo kino mogło się pochwalić jedynie mętnym, drgającym i głupim obrazem. Jeśli taką sieć neuronową da się zrobić naprawdę szybko i wydajnie, Hollywood może się skończyć: wystarczy wziąć scenariusz i film jest gotowy. Ta okazja będzie przydatna przy generowaniu dużych zbiorów do uczenia innych sieci neuronowych oraz przy tworzeniu nowych algorytmów kompresji i przesyłania strumieniowego wideo.

Sergey Vasiliev

Zalecane: