《星际争霸2》在近期举办了一场由人工智能与人类的游戏比赛,由于时差关系,本次的比赛许多人无法观看直播,下面就为大家带来具体的战报详解。
笔者在凌晨全程直播了本次人类与AlphaStar对决的比赛过程,并在本文中精编出本次直播中的一些重要内容,供大家快速了解。
[直播内容速记]
1. DeepMind一共研究出了多款AlphaStar,这些AlphaStar最先通过研究上百万份《星际争霸2》玩家天梯录像来学习,接着再通过一种“AlphaStar联赛”的互相训练方式来学习。
2. 今天展示的AlphaStar此前进行了一周的自我对练学习,其中最强的一款AlphaStar在一周内的练习量相当于人类200年的练习量,这一点和围棋的AlphaGo很像。
3. DeepMind团队并没有明确表示AlphaStar是否在自己创造打法,但可以肯定的是在之前的学习中,他们一直让AlphaStar在模仿人类的打法、战术和反制战术。
4. 在多款AlphaStar中因为学习过程的差异,形成了不同难度不同战术风格的分级。
5. 在当天的直播中,共展示出了三款不同的AlphaStar,根据特点可以描述为“普通型”、“操作超越人类胜利极限型”和“拟人化型”。
6. AlphaStar的反应速度300毫秒,其实比人还慢。
7. 直播中的比赛地图和种族对抗都局限在了一种情况下,DeepMind表示选择局限在PvP(神族vs神族)对抗是因为这一种族对抗是相对比较流程固定的对抗,易于技术入手。
8. 直播中公开的所有人类与AlphaStar的对局游戏录像文件都已经在DeepMind官网上开放下载。
9. 在直播结束后,笔者与一位国内同样进行星际争霸人工智能研发的人士进行了一些相关知识的问答,将会写在本文最后。
10. 比赛场间,AlphaStar的第一视角放出,与人类相比,操作方式大致一样。同时被演示出的还有AlphaStar的神经网络示意图,AlphaStar的逻辑为以当前屏幕范围内的原始观测为出发点,通过神经网络来分析和判断空间、优劣势以及下达建造生产等指令。
11.在第一场TLO和AlphaStar的五场对决中,TLO使用了他不擅长的种族神族,而他的神族只有中等业余玩家的水平。在第二场MaNa和AlphaStar的五场录像对决中,MaNa使用了他最擅长的神族,而他的对手AlphaStar则使用了“操作超越人类极限型”。
12.即使“操作超越人类极限型”的AlphaStar的操作是人类几乎无法实现的,但仍然使用了限制APM(每分钟操作数,可理解为手速)的规则,这与大家理解的“脚本操作”是有本质区别的。
13.AlphaStar并没有编队。
14.AlphaStar也会有和人一样的操作失误,比如误伤到自己部队,不小心打自己的建筑。
15. 三款AlphaStar都会作出一些人类不太理解的选择。
16.AlphaStar会使出一些干扰对手的小操作,在一场对决中,“操作超越人类极限型”AlphaStar甚至使用了农民紧贴气矿来干扰对手建造气矿的干扰小操作。
17.“操作超越人类极限型”AlphaStar在比赛中拥有学习调整能力,在与MaNa的五场比赛中,他一直在学习进步优化一些细节。
18.有趣的是,人类也在对决中尝试向AlphaStar学习来改进自己以及适应对手的打法。
19.无论哪款AlphaStar,都会使用不同的开局和战术,“操作超越人类极限型”AlphaStar甚至使用了前置不朽者的大招,并击败了人类。
20.“操作超越人类极限型”AlphaStar在与MaNa的一场对决中用一系列漂亮的三线追猎拉扯操作逆转了比赛,这一系列操作人类几乎无法完成,他需要人类的应激反应和操作容错和杜绝受迫性达到极致,但总结一句,这一系列操作人类基本无法达到,用他的对手MaNa的原话说:“我当时都以为我已经赢了。”
人类几乎无法完成的三线完美拉扯操作
21.中国的神族职业选手MacSed认为三款AlphaStar的运营能力比人类职业选手还强,通俗的说,AlphaStar的执行能力近乎机器人,他们不会有失误,不会有遗忘。
22.MacSed认为AlphaStar已经有了战术判断、宏观大局分析能力。
23.MacSed认为AlphaStar在游戏中距离感、走位判断、兵感(决战前判断能不能打赢)等这种较抽象化、概念化的判断能力已经明显强于人类。
24.AlphaStar很喜欢使用“追猎者”这个兵种,而大多数神族玩家觉得这个兵种很弱。AlphaStar钟爱“追猎者”可能是因为它们有着非常大的操作上限。
25.总体来说,AlphaStar的在对决中使用的战术或者兵种组合并不完全镜像职业比赛,但有些似乎不无道理。
26. AlphaStar为目前的星际2提供了一些新的战术理解吗?有,但以人类的能力驾驭不了。
27.在一些数据处理不是很直观的情况下,AlphaStar的一些选择还不太合理或是显得死板。比如纠结于一个小路口而不是选择绕路选择一个更开阔的路口进攻。
28.目前AlphaStar的强项仍然是操作,而非拥有一定逻辑能力的局势分析和战术创造,但并不代表现在他们没有这个能力。
和人类职业选手一样华丽的操作
29. 总体来说,AlphaStar目前的研发状态和展现出的技战术水平已经非常成熟,就今天的效果来看,未来战胜最强的星际2职业选手不无可能,且恐怕已经为期不远。
30. 在直播结尾,DeepMind提到,AlphaGo通过围棋战胜人类是人工智能AI的一个里程碑。但人类之所以为人类,就是能从不同结果中学习,DeepMind希望找出能和人类一样的自我学习算法。这个长期的计划对于人类在未来意义重大。