AlphaZero全新问世 八小时击败三大棋类程序

admin 2017-12-09 15:51:40 2354

 

易百纳技术社区讯 AlphaGo Zero会在对结果进行假设之后对概率进行优化和估算,而新版算法也会考虑到更多的元素。


Deepmind
团队最近发表论文表示AlphaZero来袭,其是全新版本的强化学习算法,其比较厉害之处在于能够从零开始,在自我对弈的过程中进行不断学习,从而也会在之后的超越人类,可以说是通用棋类AI

这种新算法可以在经过八个小时、四个小时以及两个小时的训练之后分别赢过了李世石版AlphaGoStockfish以及Elmo,这一全新的算法让大家看到了通用版本的出现。

当然其和之前的AlphaGO Zero还是有一些不同,AlphaGo Zero会在对结果进行假设之后对概率进行优化和估算,而新版算法也会考虑到更多的元素。

比如平局或者其他,然后综合进行估算,而且它也不会对棋盘的位置进行转变来达到数据增强的效果,最重要的是新算法只会对单一的其中一个相关神经网络进行维护,这样该网络进行不断更新,AlphaZero对一致的超参数进行重复使用,因此也不需要另外进行调整。

根据相关资料老看,AlphaGo应当说是第一个成功击败人类围棋的只能程序,主要的使用原理为深度学习,去年三月份,知名围棋手李世石就和AlphaGo进行了大战,人工智能最后获得胜利,之后也和多位中日韩三国的棋手进行对战,竟然没有一局输掉,之后和当下世界排名第一的柯洁进行对决,其也是拿下赢得比赛,其在世界的排名也超过了柯洁成为第一。

 

今年和柯洁对战之后,该团队也表示AlphaGo不会再参与到围棋比赛中,相关团队之后于今年的1018日研发了该算法的新版本,即为AlphaGo Zero,没有想到仅仅两个月之后就进化成为AlphaZero,这也就表示到目前为止这是最强大的版本,其领域已经不再仅仅是在一个方面,当然人们最为期待的是其在实际生活当中的应用。

易百纳技术社区原创文章未经本网允许,私自转载者本网保留追究其版权责任的权利!

声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
admin
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
关于作者
admin

admin

暂无个性签名~

原创473
阅读114.1w
收藏0
点赞1
评论0
打赏用户 0
我要创作
分享技术经验,可获取创作收益
分类专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
admin
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区