AI Samodzielnie Nauczyła Się Grać W Szachy Na Nadludzkim Poziomie W Ciągu Jednego Dnia - Alternatywny Widok

AI Samodzielnie Nauczyła Się Grać W Szachy Na Nadludzkim Poziomie W Ciągu Jednego Dnia - Alternatywny Widok
AI Samodzielnie Nauczyła Się Grać W Szachy Na Nadludzkim Poziomie W Ciągu Jednego Dnia - Alternatywny Widok

Wideo: AI Samodzielnie Nauczyła Się Grać W Szachy Na Nadludzkim Poziomie W Ciągu Jednego Dnia - Alternatywny Widok

Wideo: AI Samodzielnie Nauczyła Się Grać W Szachy Na Nadludzkim Poziomie W Ciągu Jednego Dnia - Alternatywny Widok
Wideo: Naucz się grać w szachy w mniej niż 10 minut 2024, Kwiecień
Anonim

Algorytm AlphaZero, bez nauczyciela, opanował szachy i grę w shogi w ciągu 24 godzin, dzięki czemu pokonał inne programy mistrzowskie, które wcześniej bezwarunkowo pokonały ludzi.

Deep Mind, firma opracowująca algorytmy sztucznej inteligencji (AI), opublikowała dane dotyczące wyników przekwalifikowania algorytmu AlphaGo do gry w szachy i shogi. Wcześniej AlphaGo był w stanie pokonać mistrzów świata w grze go. Sztucznej inteligencji udało się jeszcze szybciej opanować nowe gry. Odpowiednia praca jest umieszczana na serwerze preprintów Uniwersytetu Cornell.

AlphaZero wykorzystał metodę uczenia się ze wzmocnieniem. Jest to podtyp głębokiego uczenia maszynowego, który nie wykorzystuje nauczyciela-człowieka, ale wyłącznie gry między dwiema sztucznymi inteligencjami. Choć na początku oba AI grają bardzo słabo, to ze względu na swoją dużą szybkość (w porównaniu z nauczycielem) potrafią rozegrać ogromną ilość gier w krótkim czasie i dobierać sprawdzone ruchy i ich sekwencje w określonych pozycjach na planszy, co daje zdolność algorytmów do niezwykle szybkiego zwiększania ich poziomu.

W tym przypadku AlphaZero osiągnął poziom gry wyższy niż jakikolwiek człowiek w ciągu zaledwie 24 godzin. Potem pozwolono jej grać z najlepszym dostępnym szachistą Stockfishem i Elmoem, najlepszym graczem shogi (wysoce zmodyfikowanym zestawem szachów we wczesnym średniowieczu Japonii).

Pomimo bardzo krótkiego okresu treningowego, AlphaZero pokonał Stockfisha 28 razy i zremisował 72 razy. Udało jej się wygrać z Elmo 90 razy, przegrać 8 razy i 2 razy zremisować. To są niezwykle wysokie wyniki. Zarówno szachy, jak i shogi bardzo różnią się od tego, dla którego AlphaGo zostało pierwotnie stworzone, a także od siebie nawzajem. Na przykład „japońskie szachy” implikują niezwykle egzotyczne możliwości, takie jak granie dowolnymi „zjedzonymi” pionkami wroga. Zwycięstwo algorytmu stworzonego dla Go tylko poprzez zabawę z całkowicie identycznym własnym algorytmem oznacza, że ludzki nauczyciel może osiągnąć

IVAN ORTEGA

Zalecane: