DeepMind AI стала сверхчеловеческим игроком в шахматы за несколько часов, просто для развлячения.
Новая версия программы обыгрвшей в Go чемпиона мира среди людей, разминает свои мышцы в других областях.
Ниже есть продолжение.
...a descendant of the AI program that first conquered the board game Go has taught itself to play a number of other games at a superhuman level. After eight hours of self-play, the program bested the AI that first beat the human world Go champion; and after four hours of training, it beat the current world champion chess-playing program, Stockfish...https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go
...the new AlphaZero is a “more generic version” of the same software, meaning it can be applied to a broader range of tasks without being primed beforehand...
...Новая версия программы обыгрвшей в Go чемпиона мира среди людей, научил себя играть в ряд других игр на сверхчеловеческом уровне. После восьми часов самостоятельной игры программа превзошла AI, котороя первой победила чемпиона мира по Go среди людей; и после четырех часов обучения он обыграл текущую лучшую в мире шахматную программу, Stockfish...
...новый AlphaZero является «более общей версией» того же программного обеспечения, то есть он может применяться к более широкому кругу задач, без получения предварительной информации...
Для получения правильной перспективы, максимальный ELO чемпиона мира по шахматам среди людей Магнус Кальсен - 2882. У Stockfish ELO - 3300. Цитата из Википедии:
Если рейтинги обоих игроков равны, вероятность победы одного из них равна вероятности победы другого из них (что равносильно среднему количеству 0,5 очков за игру).https://ru.wikipedia.org/wiki/Рейтинг Эло
Если различие между двумя игроками составляет 200 пунктов, то сильнейший игрок набирает в среднем около 0,76 очка за игру.
Если различие составляет 400 пунктов, то это среднее примерно равно 0,91.
Различие в 600 пунктов означает, что сильнейший игрок выигрывает «почти» всегда (в среднем около 0,97 очка за игру).
То есть у чемпиона мира по шахматам среди людей нет никаких практически шансов, даже если он играет белым, чтобы конкурировать со Stockfish. А Stocksfish был легко побеждён AlphaZero.
Когда AlphaZero играл белым, результат был 25 побед и 25 ничьих, 0 проигравших.
Когда AlphaZero играли черным, результат был 3 победы, 47 ничьих, 0 проигравших.
Только когда AlphaZero играл черным, у Stockfish был шанс ... сделать ничью.
P.S. Ссылка на оригинальную статъю https://arxiv.org/abs/1712.01815
No comments:
Post a Comment