Naukowcy Wyszkolili Sieć Neuronową, Aby Określić Płeć Osoby Na Podstawie Tekstu Pisanego - Alternatywny Widok

Naukowcy Wyszkolili Sieć Neuronową, Aby Określić Płeć Osoby Na Podstawie Tekstu Pisanego - Alternatywny Widok
Naukowcy Wyszkolili Sieć Neuronową, Aby Określić Płeć Osoby Na Podstawie Tekstu Pisanego - Alternatywny Widok

Wideo: Naukowcy Wyszkolili Sieć Neuronową, Aby Określić Płeć Osoby Na Podstawie Tekstu Pisanego - Alternatywny Widok

Wideo: Naukowcy Wyszkolili Sieć Neuronową, Aby Określić Płeć Osoby Na Podstawie Tekstu Pisanego - Alternatywny Widok
Wideo: e-TechTalk: O PROJEKTACH AI, Piotr Szajowski [zapis live z 16.06.2020] 2024, Może
Anonim

Zespół naukowców z National Research Nuclear University „MEPhI”, Narodowego Centrum Badań „Kurchatov Institute” i Voronezh State University opracował metodę, która uczy komputer rozpoznawania płci osoby z tekstu napisanego przez niego z dokładnością do 80 procent. Rozwój naukowy należy do dziedziny lingwistyki komputerowej. Badania przeprowadzono dzięki grantowi Rosyjskiej Fundacji Nauki. Wyniki zostały opublikowane w czasopiśmie Procedia Computer Science.

Liczne badania naukowe pokazują, że tekst pisany nieuchronnie odzwierciedla cechy jego autora - płeć, cechy psychologiczne, poziom wykształcenia. Mowa jest cennym narzędziem psychodiagnostycznym, z którego korzystają specjaliści ds. Zasobów ludzkich dużych firm, a także służby bezpieczeństwa.

Na podstawie analizy mowy można zdiagnozować występowanie u człowieka pewnych chorób (demencja, depresja) oraz skłonność do zachowań samobójczych. Potrzeba ustalenia cech autora tekstu rośnie również wraz z rozwojem komunikacji internetowej: ważne jest, aby firmy wiedziały, które grupy ludzi lubią ich produkty i usługi.

Pracujący w tym kierunku naukowcy (lingwiści, psycholodzy, informatycy), na podstawie wartości liczbowych różnych parametrów tekstu, budują modele matematyczne do diagnozowania określonych parametrów osobowości.

Zespół specjalistów przeanalizował skuteczność różnych technologii uczenia maszynowego wykorzystujących sieci neuronowe do analizy tekstu.

W toku badań porównali trafność rozwiązania problemu identyfikacji płciowej tekstów w oparciu o dwa podejścia do modelowania opartego na danych: z jednej strony algorytmy uczenia maszynowego (maszyna wektorów wsparcia i zwiększanie gradientu), z drugiej strony sieci neuronowe uczenia głębokiego (konwolucyjne sieci neuronowe i powtarzające się sieci neuronowe z długotrwałą pamięcią krótkotrwałą).

„Wysokie wyniki w określaniu płci autora tekstu osiągnęliśmy dzięki zaawansowanym modelom sieci neuronowych, w warunkach, gdy autor nie ukrywa swojej płci. Następnym zadaniem jest określenie płci pod kątem jej celowego ukrycia”- mówi Alexander Sboev, profesor nadzwyczajny NRNU MEPhI.

Tak więc w poniższych tekstach, które zostały pierwotnie zamieszczone na portalu randkowym, sieć neuronowa z łatwością znajduje haczyk w dziesięciu na dziesięć przypadków, a ponadto autor celowo umieszcza w podpisie imię płci przeciwnej.

Film promocyjny:

Tekst napisała dziewczyna: „Jestem przystojnym, muskularnym mężczyzną 30 lat. Pracuję dla dużej firmy naftowo-gazowej na dobrej pozycji z przyzwoitą pensją. Mieszkam we własnym mieszkaniu w Moskwie. Nieruchomość posiada również mały, ale ładny dom w jednej z wiosek we Włoszech. Lubię sport, w szczególności piłkę nożną. Uwielbiam wychodzić na weekendy, nienawidzę siedzieć w domu. Dziewczyna, która by mi odpowiadała, powinna mieć skromne usposobienie, ładny wygląd i atrakcyjną figurę jak na współczesne standardy. Powinna podzielać moje zainteresowania, nie powinna być zazdrosna i nie powinna próbować wzbudzać we mnie zazdrości. Nie mam zamiaru wspierać dziewczyny, bo uważam, że oboje powinni pracować w rodzinie. Wolę też trzymać budżet osobno. Nie będę tolerował zdrady."

Tekst napisał mężczyzna: „Cześć! Jestem bardzo nieszczęśliwy, niesamowicie! Dlaczego tak się z nami zachowujesz ?! My też jesteśmy ludźmi, wszyscy jesteśmy równi! Czy jesteś seksistą? Nie zniosę tego więcej! Zniszczę cały twój samochód, pomaluję go. Czekaj, nieludzkie. W ten sposób skończę”.

Wyniki tego badania wykazały, że podejście oparte na wykorzystaniu konwolucyjnych sieci neuronowych i metodach głębokiego uczenia do rozpoznawania płci osoby, która napisała tekst, jest najbardziej optymalne.

Obecnie grupa naukowców pracuje nad problemem rozpoznawania wieku.