首页
AlphaZero文章列表
-
2018-12-10 11:48:13
上周末,DeepMind 在《科学(Science)》期刊上发表了一篇通用强化学习算法论文,论文描述了 AlphaZero 如何快速学习三种棋类游戏成为史上最强的棋手。
-
2018-02-01 20:21:57
DeepMind发布了另一篇题为《通过自我强化学习算法掌握国际象棋与将棋》的论文,展示了AlphaGo Zero如何在国际象棋与将棋领域分别击败最强程序StockFish与Elmo。更可怕的是,其整个学习过程是从一窍不通到成为世界上最强的下棋程序,仅用了24个小时。
推荐专题