人工智能除了人机大战还有什么?
随着新秀机械手系统的结束,OpenAI 趁着余热迎来令人瞩目的人机大战,其实这并不是他们第一次公开试玩,我们应该还记得之前1v1那场让游戏界和科技界都大为震惊的比赛。那么,AI在游戏如何被研究人员训练升级的?AI在游戏中的应用,除了简单的人机对抗,还有哪些应用?
人类在人机大战中再次惨败
继去年AlphaGo打败世界排名第一的围棋选手柯洁后,AI又转向了电子竞技游戏MOBA类游戏。近日,一场在openAI公司内部举办的 Dota2 5 vs 5 巅峰对决拉开帷幕,最终,OpenAI Five队最终以2:1获胜,击败了 Dota 2 世界排名前 1% 的业余玩家,人机大战的里程碑上又刻上了“惨败”的一划。
据了解,本次比赛采用三局两胜制,规则为双方在限定的18名英雄内选出一套阵容用于对战,每人配备一只常规速度的无敌信使,且不能插眼,不能开雾。人类玩家游戏水平均高于99.95%的玩家,队员分别为Blitz、Cap、Fogged、Merlini和MoonMeander,其中有四人是Dota2前职业玩家。
前两局在观众表演赛中,OpenAI Five进退如一、节奏紧凑通过完美的配合轻松压制对手发育击败玩家,让一群天梯高玩连续两局20分钟左右就敲出GG。
第三局临时改制,由观众为OpenAI Five选英雄,最后出现的阵容完全是脆皮阵(小鱼、斯温、斧王、隐刺和痛苦女王)对阵人类的(死灵法、莱恩、飞机、DP和巫妖),人类才得以险胜一局。
OpenAI是如何一步步进化的?
看到此处,相信不少人对OpenAI产生了兴趣。据了解,这是一家由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用,AI在电子竞技游戏的应用,便是这家公司的一大举措。
那OpenAI是如何训练的呢?他们采用了最热门的用来教导机器人玩游戏的方法之一,也就是OpenAI所使用的技术——强化学习,该技术的运作原理是:给机器人一个目标,比如收集硬币,当机器人完成目标时给予它奖励。最初,机器人是随意行动的,直至它明白了该如何完成任务,就像人一样,进行摸索。机器人用来完成任务的动作是同种场景下最优的方法,因而当下一次尝试完成任务时,机器人更有可能继续采用那些动作。经过成百上千甚至上百万次的尝试以