WikiSort.ru - Шахматы и шашки

ПОИСК ПО САЙТУ | о проекте

AlphaZero — программа для нейронных сетей, разработанная компанией DeepMind, которая использует обобщенный подход AlphaGo Zero. 5 декабря 2017 года коллектив DeepMind выпустил препринт AlphaZero, которая в течение 24 часов достигла сверхчеловеческого уровня игры в шахматы, сёги и го, победив чемпионов мира среди программ, Stockfish, Elmo и трехдневный вариант AlphaGo Zero в каждом случае[1].

Отличия от AlphaGo Zero

AlphaZero (AZ) — это более обобщенный вариант алгоритма AlphaGo Zero (AGZ), который кроме го, умеет также играть в сёги и шахматы. Различия между AZ и AGZ заключаются в том, что:

  • AGZ имеет жёстко заданные правила для установленного поиска гиперпараметров.
  • Нейронные сети обновляются постоянно.
  • Го (в отличие от шахмат) симметрична относительно определённых отражений и поворотов; AGZ был запрограммирован так, чтобы воспользоваться этими симметриями, AZ& — нет.
  • Партии в шахматы и сёги (в отличие от Го) могут закончиться вничью, поэтому AZ должна учитывать возможность ничейного исхода игры.

AlphaZero против Stockfish и Elmo

Рассматривая поиск с помощью дерева поиска Монте-Карло, AlphaZero анализирует лишь 80 000 позиций на секунду в шахматах и 40 000 в сёги, по сравнению с 70 миллионов для Stockfish и 35 миллионов для Elmo. AlphaZero компенсирует низкое количество оценок использованием своих глубоких нейронных сетей, сосредотачиваясь гораздо более избирательно на наиболее перспективных вариантах.

Результаты

Шахматы

В шахматных партиях AlphaZero против Stockfish каждая программа имела по одной минуте времени на ход. AlphaZero имела лучшее компьютерное оборудование относительно Stockfish. Из 100 игр с нормального начального положения AlphaZero выиграл 25 партий белыми, 3 чёрными и свёл вничью оставшиеся 72.[2]

Сёги

В ста играх в сёги против Elmo, AlphaZero выиграл девяносто раз, восемь раз проиграл и две партии завершились вничью.

Го

После 8-и часов самостоятельного обучения игры в го, в матчах против предыдущей версии AlphaZero, AlphaZero выиграл шестьдесят игр и проиграл сорок.

Критика

Некоторые гроссмейстеры, такие как Хикару Накамура и создатель Комодо Ларри Кауфман, подчеркнули, что силу AlphaZero не надо преувеличивать, утверждая, что результаты матча был бы другими, если бы программа имела доступ к дебютным базам (поскольку Stockfish был оптимизирован под этот сценарий)[3]. AlphaZero победила Stockfish, лишив последнего доступа к дебютным базам и эндшпильным таблицам, играя с намного лучшим компьютерным оборудованием, чем у противника.[4][5] Stockfish также была ограничена по времени принятия хода: нетипичный контроль времени, 1 минута на ход, не позволял глубоко задумываться в критических позициях. Кроме того использовалась версия Stockfish 8, вышедшая год назад. Все четыре обстоятельства: нехватка мощности, ограничение по времени, отключение дебютной книги и использование устарелой версии внесли свой вклад в поражение Stockfish.

Сообщество программистов компьютерной игры в сёги также не полностью удовлетворено условиями матча AlphaZero — Elmo.[6][7]

Статья в Science

DeepMind опубликовала в декабре 2018 г. статью в журнале Science[8]. AlphaZero работал не на суперкомпьютере, а на 4 TPU и CPU с 44 ядрами.

Шахматы

Был использован движок Stockfish 8 на компьютерной мощности, аналогичной AlphaZero. Контроль времени — 3 часа плюс 15 секунд на ход. AlphaZero выиграл 155 партий, 6 проиграл, остальные закончились вничью. В серии игр с заданными начальными положениями AlphaZero выиграл 95 партий из 100.

Сёги

AlphaZero выиграл 98,2 % партий чёрными и 91,2 % из всех.

Реакция

Газеты вышли с заголовками, что обучение шахматам заняло только четыре часа: «это было сделано за время чуть большее, чем промежуток между завтраком и обедом»[9]. Wired раскрутили AlphaZero как «первый искусственный интеллект, который является чемпионом многих настольных игр»[10].

«Мне всегда было интересно, как это будет, когда высшие существа приземлятся на землю и покажут нам, как они играют в шахматы», заявил датский гроссмейстер Питер Хайне Нильсен в интервью Би-би-си, «теперь я знаю». Норвежский гроссмейстер Йон Людвиг Хаммер охарактеризовал AlphaZero как «сумасшедшие атакующие шахматы» с глубокой позиционной игрой. Бывший чемпион мира Гарри Каспаров сказал: «это замечательное достижение, даже несмотря на то, что мы уже ожидали нечто подобное после успехов AlphaGo»[11].

Примечания

  1. Silver, David & et al. (5 December 2017), "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm", arΧiv:1712.01815 [cs.AI]
  2. 'Superhuman' Google AI claims chess crown, BBC News (6 December 2017). Проверено 7 декабря 2017.
  3. Google's AlphaZero Destroys Stockfish In 100-Game Match, Chess.com. Проверено 7 декабря 2017.
  4. Knapton, Sarah. Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours (англ.), Telegraph.co.uk (6 December 2017). Проверено 6 декабря 2017.
  5. Vincent, James. DeepMind’s AI became a superhuman chess player in a few hours, just for fun, The Verge (6 December 2017). Проверено 6 декабря 2017.
  6. コンピュータ将棋 レーティング
  7. Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; et al. (5 December 2017), "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm", arΧiv:1712.01815 [cs.AI]
  8. Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (7 December 2018). “A general reinforcement learning algorithm that masters chess, shogi, and go through self-play”. Science. 362 (6419): 1140—1144. DOI:10.1126/science.aar6404. Проверено 7 December 2018.
  9. Badshah, Nadeem. Google’s DeepMind robot becomes world-beating chess grandmaster in four hours, The Times of London (7 December 2017). Проверено 7 декабря 2017.
  10. Alphabet's Latest AI Show Pony Has More Than One Trick, WIRED (6 December 2017). Проверено 7 декабря 2017.
  11. Gibbs, Samuel. AlphaZero AI beats champion chess program after teaching itself in four hours, The Guardian (7 December 2017). Проверено 8 декабря 2017.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии