在此前的版本中,博米围棋大师用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。
博米围棋AI并不使用快速、随机的走子方法。在此前的版本中,博米围棋大师用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。
相反,新版本依靠地是其高质量的神经网络来评估下棋的局势。
现在“博米围棋大师是通过两个不同神经网络“大脑”合作来改进下棋。
这些“大脑”是多层神经网络,跟那些图片搜索引擎识别图片在结构上是相似的。
刘光然和曹阳站在观察房里面看着对面旳棋手们正在陷入痛苦的挣扎之中,在小黑屋里面,摆放着许多的显示器,上面正在演示着棋手和电脑的对弈局面。
曹阳看了一眼,表示自己看不明白,反正最后只要能看得出谁输谁赢就可以了。
“我们最开始的围棋AI算法,就是从神经网络和深度学习入手,然后通过往数据库当中输入大量的对弈局势,之后从这些对局当中进行学习,来找到更加适合的方法。”刘光然对曹阳说,“当时的这一套方案还是取得了不错的成绩的,至少能够下过一些职业二段和三段的选手。”
在做这个课题之前,其实刘光然自己也不下围棋,但是做完这个课题之后,刘光然不仅仅是一个AI专家,棋艺也是进步神速。
Loading...
未加载完,尝试【刷新】or【关闭小说模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.lengleng.cc
(>人<;)