主页 > Y一生活 >【专访】AI 热潮持续发烧:AlphaGo Zero 跳脱思维框架、挑战人类知识 >

【专访】AI 热潮持续发烧:AlphaGo Zero 跳脱思维框架、挑战人类知识

2020-06-12
阅读指数:978
【专访】AI 热潮持续发烧:AlphaGo Zero 跳脱思维框架、挑战人类知识

阅读棋谱是学棋过程中很重要的一环,初学者可以藉由读棋谱,吸收高手的经验与思维,习得自己还未能想到的行棋方式,快速提升应战能力。2016 年以 4:1 击败李世乭的 AlphaGo,正是以此方式训练出前无古人的棋术,它「吸收」人类棋谱、归纳出输赢的模式,再藉由演算法推展出独特的棋艺。但 AlphaGo 风光了一年,就被进化版的 AlphaGo Zero 以 0:100 横扫,也被扫入历史的看板中,由人机对弈所带动的 AI 热潮,则迈入下一个里程。

不像 AlphaGo 先有资料训练的过程,Zero 一开始就用两套程式互相对弈,但这两套程式只有规则知识,没有经验知识,只要不违背基本的规则,例如两个子叠在一起,下棋方法不限;Zero 从每次比赛的输赢,累积经验与修正错误,再经过千千万万次的比赛后,越来越厉害。专精大数据、AI 研究的资策会副执行长余孝先博士,娓娓道来两者本质上的差异。「所以这个学习方式是不藉由前人的知识,Zero 一开始是一张白纸」。

余孝先精通各种棋类,更是围棋三段好手,谈到围棋的博大精深,他认为以人类的思考方式来看,围棋太过複杂。「围棋不像西洋棋,国际上的比赛大概七十手以内就会结束,输赢就分出来了,但围棋通常要好几百手,如果要预测你怎幺下我怎幺回,想到底要想好几百层!」

【专访】AI 热潮持续发烧:AlphaGo Zero 跳脱思维框架、挑战人类知识

资策会副执行长余孝先博士精通各种棋类,更是围棋三段好手。

因此从高手棋谱衍伸出来的棋法,能帮助选手应战。余孝先以象棋作比喻:「当头炮」是最常见也具攻击性的开局方式,也就是先手走中炮,直接威胁对手中兵,而后手则常以炮或马作防守,术语是「炮 8 平 5」或是「马 8 进 7」,这些套招、套式都是前人经验的累积;下围棋也一样,当对手下在某个角时,虽然整个棋盘可以下的点有 360 个位置,但不用把每个点都想过一遍,因为前人已归纳出约几十种的回应方式。

可是当 Zero 完败 AlphaGo,代表 AlphaGo 之前习得的人类知识,有一部分是不正确的,而这个知识就像是框架,把我们的思维限制住。「就好比下象棋,面对当头炮的招数有 10 种,每个人都从其中挑一种,但或许最好的答案是第 11 种,我们却被训练到永远不会去想第 11 种。」余孝先强调 Zero 让我们发现之前人类高手没有想到的招数,当我们一直在学人类高手的技法,反而被侷限了。

AlphaGo Zero 为什幺这幺强?

Zero 背后的技术是「增强式学习」(Reinforcement learning),或称强化学习,来自于心理学的行为主义理论,也就是外界的环境回馈让你去增加对你有利的事情,是自主学习很重要的技术。例如狗看到主人摇尾巴发现有东西吃,就会增强这样的行为,Zero 的设计也是如此。当它发现上次这样下会赢,或许这样的下法比较好,如果上次输了,那就改变方法;再藉由数千万次的对弈,慢慢增加信心,当 100 次比赛赢了 99 次,便可以确定这样的策略比较好。

其实增强式学习也用在人类的棋手身上。「例如有些对弈一路领先,但却在最后下错棋,整个结果大翻盘,这样的结果非常深刻,会一辈子记得,之后遇到相同的状况就不会犯错。」

「话虽然如此,人类一辈子可以下几盘棋?人类不仅学习速度有限制,学习也有高峰,例如世界级的围棋好手都是在 30 岁前达到高峰,之后因为智力体力衰退,成绩会慢慢衰退。」余孝先从自身的经验,分享棋手职涯中所面临生理上的挑战。

【专访】AI 热潮持续发烧:AlphaGo Zero 跳脱思维框架、挑战人类知识

余孝先强调 Zero 让我们发现之前人类高手没有想到的招数。

人类棋手也会受到下棋时心理状态的影响,余孝先观察到李世乭跟 AlphaGo 下第一局时,他一会儿抓头一会儿喝水,可以看得出非常紧张,因为喝水频率高的不寻常。第一局输后李世乭更紧张,而 AlphaGo 胜不骄败不馁稳扎稳打,「所以在情绪上人类就输了,而现在技术上输更多。」

台湾的角色在哪里?

当 Zero 掀起了另一波 AI 话题时,回到台湾的产业现况,我们的角色在哪里?从大环境聚焦回己身,你我的机会又在哪里?

余孝先指出 AI 的产业有两类,第一类是「把 AI 产业化」,提供解决方案给其他厂商,例如沛星科技;第二类是「把产业AI 化」,用 AI 来提升自己的竞争力,台湾的工厂大多是属于第二类,例如製造业导进 AI,以提升製程良率、减少呆料、降低机器设备异常当机现象。「因为(製造业)产业大,面临的使用者多,客户多,所以容易把产业培养起来,是台湾最有机会的产业」,余孝先指出。

「此外金融和医疗照护在不同国家的体系不一样,所以国外的解决方案要直接进来是不容易的,如果我们可以把自己的内部限制解除,可以发展很快,也都是机会。」

零售则是另外一项可发展的产业,「很容易做、技术门槛较低,但困难是台湾的市场太小,我们拥有的数据是人家的千分之一、百分之一,但还是可做,只是需要了解先天上的障碍。」

对于 AI 创业风潮,余孝先建议可以从服务业切入,门槛较低,製造业则最难切入,需要具有丰富的 domain knowledge。若年轻人有志投入金融、医疗或製造等领域,除了进入大公司的内部新创团队外,也可以加入研发法人,因为从法人分拆出来的新创公司,就会有一定的规模基础,此外研发法人长期协助中小企业进行转型,年轻人可从职涯中接触到不同的产业案例,帮助自己累积一定的实绩!

相关阅读: