首页 科技 前瞻 正文

“阿尔法零”人工智能再进化:24小时之内“通杀”3种棋

2017年12月07日 18:49:52  来源:北京晚报  编辑:叶子
举报

英国“深度思维”公司最新发布的论文说,该公司一种通用棋类人工智能“阿尔法零”能从零基础开始强化学习,24小时之内击败了此前最强的国际象棋、日本将棋和围棋人工智能程序,由此前专攻一项技能走向多种技能“通杀”。

冯晨清制图

“深度思维”公司在最新论文中透露,“阿尔法零”从零开始,通过自我对弈强化学习,约2小时击败日本将棋顶级人工智能程序,4小时击败国际象棋顶级人工智能程序,8小时击败战胜韩国棋手李世石的“阿尔法围棋-李”,并在24小时内战胜了通过72小时自我学习训练称王围棋的“阿尔法围棋-零”。

10月,“阿尔法围棋-零”第一次让人工智能在不“学习”任何既定棋谱、只设定规则的情况下,完全“从零开始”、自我对弈取得飞速进步。而此次的“阿尔法零”在此基础上训练了3种独立的程序,其中国际象棋程序自我对弈4400万局,日本将棋程序自我对弈2400万局,围棋对弈了2100万局。

一些人工智能专家表示,人工智能完全依靠自己摸索,意味着人工智能可以更好地进入对它来说本是一片空白的领域;而“阿尔法零”的问世显示人工智能可以向通用化发展,为诸如开发新药这种与棋类游戏一样有明确规则和目标的问题提供发展蓝图。

英国“深度思维”公司最新发布的论文说,该公司一种通用棋类人工智能“阿尔法零”能从零基础开始强化学习,24小时之内击败了此前最强的国际象棋、日本将棋和围棋人工智能程序,由此前专攻一项技能走向多种技能“通杀”。

冯晨清制图

“深度思维”公司在最新论文中透露,“阿尔法零”从零开始,通过自我对弈强化学习,约2小时击败日本将棋顶级人工智能程序,4小时击败国际象棋顶级人工智能程序,8小时击败战胜韩国棋手李世石的“阿尔法围棋-李”,并在24小时内战胜了通过72小时自我学习训练称王围棋的“阿尔法围棋-零”。

10月,“阿尔法围棋-零”第一次让人工智能在不“学习”任何既定棋谱、只设定规则的情况下,完全“从零开始”、自我对弈取得飞速进步。而此次的“阿尔法零”在此基础上训练了3种独立的程序,其中国际象棋程序自我对弈4400万局,日本将棋程序自我对弈2400万局,围棋对弈了2100万局。

一些人工智能专家表示,人工智能完全依靠自己摸索,意味着人工智能可以更好地进入对它来说本是一片空白的领域;而“阿尔法零”的问世显示人工智能可以向通用化发展,为诸如开发新药这种与棋类游戏一样有明确规则和目标的问题提供发展蓝图。

GOOGLE人工智能深度学习有成 人机围棋对决在即

随着技术的演进,AI人工智能再度进化,Google、Facebook相继发展人工智能,不过Google似乎更甚一筹。Google位于伦敦的人工智能团队DeepMind所开发的现代版“佐为”AlphaGo,携深度学习技术,预计从3月9日起,与全球知名的韩国围棋冠军棋手李世石进行5场对弈,藉此向全世界证明一个具有自我学习能力的人工智能,正走向一个新的里程碑。

跟贴 0
参与 0
发贴
网友评论仅供其表达个人看法,并不表明E都市立场。

加载更多评论