纳金网

标题: 柯洁成功复仇腾讯围棋AI [打印本页]

作者: 铁锹    时间: 2018-1-26 09:06
标题: 柯洁成功复仇腾讯围棋AI
原标题:柯洁成功复仇腾讯围棋AI,柯洁:人类棋手与AlphaZero差距不超过三子
q615lqy4cxzph9et!1200.jpg
配图来自柯洁微博
问耕 发自 凹非寺


如果你看到这一篇推送,即使没有号码,也希望你给柯洁老师打电话。
可以热烈一点~
因为,他成功复仇了!
柯洁战胜了不久前刚刚碾压了他的腾讯围棋AI绝艺,而且是以同样碾压的方式漂亮的回敬了一盘!这样的柯洁老师,值得打电话!
昨晚,这位围棋第一人,在微博上发了一篇文章,标题是:《职业棋手与人工智能的差距?》文章的开头是这么写的:

今天执黑和腾讯的AI绝艺下了一盘被让两子(黑贴6.5 大约等于让先倒贴目)赢了一盘。
前几天第一次尝试输了,被大肆报道了一番…今天赢了,却没有任何报道。现在的人呀…真是喜欢搞个大新闻啊…
6606eew9eq2desp2!1200.jpg
柯洁回敬AI一局,怎么能不是大新闻。
事情是这样的。
一周之前,腾讯围棋AI绝艺,让二子战胜了当今围棋第一人柯洁。而且整个战局只进行了77手,可以说柯洁落败的相当快。
ljyany9nu8ztiszl!1200.jpg
△ 配图来自柯洁微博
获胜之后,让二子的绝艺没有收手。从前天到昨天,绝艺让二子对阵职业棋手取得17连胜,可以说是势不可挡了。
直到遇见可以给它三连败的人……
pnoc8lwzi2evk1zd!1200.jpg
首先是北海的早晨(范蕴若六段)挺身而出,范蕴若擅长对阵围棋AI,被野狐围棋玩家们誉为“打狗帮帮主”。前几天终结绝艺14连胜的,就是范蕴若。这一次,双方弈至204手,绝艺认输,范蕴若再次狙击AI成功。
紧接着,柯洁登场。
野狐围棋(微信号:txyhweiqi)这样记述了对弈过程:
柯洁在此处爆发出无愧第一人名号的算路,先是扳、点灭掉白棋眼位,再于千钧一发之际冲断白棋外围为自己延气,最后扳过开始收气。绝艺在黑棋次序井然的招法下无计可施,只能眼睁睁看着自己被快一气吃掉。
上次77手输掉,这次72手复仇。
gfsjdwe6juoj7wnh!1200.jpg
还没完,接着连笑出场再下一城。
绝艺,三连败,达成。
量子位问腾讯:这不是故意让棋吧?

腾讯否认了。
他们说:“下让子棋的版本是去年12月的绝艺挑战赛版,目前的胜率大概在86%(55胜9负)。我们一直在持续训练迭代,提升棋力,并在尝试优化算法解决让子胜率过低导致的问题。”
让子胜率低的问题,上次就讲过了。让子棋对AI来说,是一种胜率过低的极端情况,以绝艺海南挑战赛版本为例,如果要求其以让2子开始对局,则初始胜率为7%,让3子则初始胜率1%,让4子则初始胜率0.1%。
关于围棋AI,正在进行的达沃斯论坛期间,李开复也谈到了AlphaGo以及最新版本AlphaZero。
下面这是前方记者李开复发回的报道:
在昨天的午餐会上,DeepMind的联合创始人Mustafa Suleyman被问到AlphaZero的强化学习是否真的证明可以不要训练数据?除了游戏还有什么应用?(潜台词是,能不能真的“通用”)
Mustafa非常坦诚地说:AlphaZero没有那么神,外界对它有点夸大了。
它要想工作,必须满足三个前提:可预测环境(围棋规则),清晰奖励系统(输赢),无变数(variability) 。也并不是外界说的不受监督,AlphaZero的监督来自于它的结构和训练环境,这些依赖强化学习的具体方法在现实生活中效果不是很好。在现实生活中我们无法提供模拟器,进行巨量训练来形成算法。
不过Deepmind团队正在探索游戏之外的应用,但是初步预测这不太容易,因为真实世界比游戏复杂很多。他预测三五年内,强化学习是完全没法普及应用的,Deepmind团队已经“将目光放到几十年后了”。
Mustafa也提到:AlphaZero本身并不能解决AI对于数据的需求,但在数据生成和模拟上的进步(比如说用真实语音合成、人脸合成、甚至类似Grand theft auto来做自动驾驶的模拟)是有可能在未来自动产生可补充的数据。
回到柯洁对战腾讯AI这件事。
总结两次与绝艺下让子棋,柯洁的感觉是稳着下优势蛮大,第一次输棋有一定的心理因素。那么,到底棋手和AI有多大的差距?
柯洁总结:首先是心态。人类对战AI时,常常“棋未先行心态已崩”。若是能以平常心应对,差距不会有想象中那么大。
“具体有多少差距,我保险点的说,绝对不会超过三子。”
“我不喜欢放空话,我希望登到有AI真的到了alphgo zero的水平的话,我可以放下尊严去下正式的让子棋,给爱好者们看看到底又多大差距。”

柯洁说,他热爱围棋,喜欢下棋。






欢迎光临 纳金网 (http://course.narkii.com/club/) Powered by Discuz! X2.5