AlphaZero全新问世八小时击败三大棋类程序_专栏

易百纳技术社区讯 AlphaGo Zero会在对结果进行假设之后对概率进行优化和估算，而新版算法也会考虑到更多的元素。

Deepmind团队最近发表论文表示AlphaZero来袭，其是全新版本的强化学习算法，其比较厉害之处在于能够从零开始，在自我对弈的过程中进行不断学习，从而也会在之后的超越人类，可以说是通用棋类AI。

这种新算法可以在经过八个小时、四个小时以及两个小时的训练之后分别赢过了李世石版AlphaGo、Stockfish以及Elmo，这一全新的算法让大家看到了通用版本的出现。

当然其和之前的AlphaGO Zero还是有一些不同，AlphaGo Zero会在对结果进行假设之后对概率进行优化和估算，而新版算法也会考虑到更多的元素。

比如平局或者其他，然后综合进行估算，而且它也不会对棋盘的位置进行转变来达到数据增强的效果，最重要的是新算法只会对单一的其中一个相关神经网络进行维护，这样该网络进行不断更新，AlphaZero对一致的超参数进行重复使用，因此也不需要另外进行调整。

根据相关资料老看，AlphaGo应当说是第一个成功击败人类围棋的只能程序，主要的使用原理为“深度学习”，去年三月份，知名围棋手李世石就和AlphaGo进行了大战，人工智能最后获得胜利，之后也和多位中日韩三国的棋手进行对战，竟然没有一局输掉，之后和当下世界排名第一的柯洁进行对决，其也是拿下赢得比赛，其在世界的排名也超过了柯洁成为第一。

今年和柯洁对战之后，该团队也表示AlphaGo不会再参与到围棋比赛中，相关团队之后于今年的10月18日研发了该算法的新版本，即为AlphaGo Zero，没有想到仅仅两个月之后就进化成为AlphaZero，这也就表示到目前为止这是最强大的版本，其领域已经不再仅仅是在一个方面，当然人们最为期待的是其在实际生活当中的应用。

易百纳技术社区原创文章未经本网允许,私自转载者本网保留追究其版权责任的权利！

AlphaZero全新问世 八小时击败三大棋类程序

admin

审核成功

审核失败

AlphaZero全新问世八小时击败三大棋类程序