人機(jī)圍棋大戰(zhàn)已經(jīng)落幕,人類選手李世石九段以 1:4 敗給 Google 人工智能( AI )程序 AlphaGo。
作為過去十年獲得世界冠軍數(shù)最多的職業(yè)圍棋手,李世石的確有資格代表人類頂尖圍棋手應(yīng)戰(zhàn) AI 圍棋手 AlphaGo。但出乎所有人( 尤其是職業(yè)圍棋手 )意料,李世石開賽后就取得三連敗,AlphaGo 也早早地就鎖定了最終的勝果。
面對如此強(qiáng)大又陌生的對手,經(jīng)歷了大風(fēng)大浪的李世石并沒有放棄后兩局的抵抗。人機(jī)圍棋大戰(zhàn)第四番,李世石第 78 手下出妙招,「 神之一手 」讓 AlphaGo 開始出現(xiàn)「 誤算 」,看似無懈可擊的這位 AI 界棋手還是被人類頂尖圍棋手找出了破綻,也就是程序用語中的 Bug( 漏洞 )。AlphaGo 誤判形勢,勝利的天平第一次傾斜到人類選手一方。在此之前,AlphaGo 曾以 5:0 橫掃歐洲冠軍樊麾二段。
雖然在人機(jī)五番棋較量中,李世石只贏了 AlphaGo 這一局比賽,但至少表明人類選手目前依然有可能戰(zhàn)勝頂尖 AI 棋手。如果讓柯潔或者其他目前排名高過李世石的職業(yè)圍棋手與 AlphaGo 對決,勝負(fù)可能依然難料。
有趣的是,在輸給李世石一盤棋后,AlphaGo 終于有了世界排名。在 3 月 14 日的世界職業(yè)圍棋選手排名中,AlphaGo 位列世界第四,僅次于中國的柯潔九段、韓國的樸廷桓九段以及日本的井山裕太九段,韓國棋手李世石九段則位列世界第五。( 注:按照世界職業(yè)圍棋手排名網(wǎng)站 GoRatings.org 的算法,如果一名職業(yè)棋手從未遭受失利,就不會進(jìn)入排名統(tǒng)計。)
1996 年,首次挑戰(zhàn)卡斯帕羅夫的 IBM 超級計算機(jī)深藍(lán),以 2:4 敗給了這位國際象棋冠軍;一年之后,再度挑戰(zhàn)的深藍(lán)以 3:2 的比分艱難擊敗卡斯帕羅夫,而這被認(rèn)作人類計算機(jī)發(fā)展史上的一大里程碑事件。
相比「 上世代 」深藍(lán)與卡斯帕羅夫在國際象棋場展開的激烈對決,十九年后 AlphaGo 與李世石在圍棋盤上進(jìn)行的「 本世代 」人機(jī)大戰(zhàn)早早就失去了懸念。要知道,作為一項延續(xù) 4000 多年的人類智力游戲,圍棋被視作世界上最復(fù)雜的棋盤游戲,也是目前僅有的一項人腦可能戰(zhàn)勝電腦的棋類運動。
雖然理論上還存在人類選手( 例如讓柯潔再戰(zhàn) )戰(zhàn)勝 AI 圍棋手的可能,但以 AlphaGo 為代表的 AI 棋手已經(jīng)或正在攻下圍棋這座曾經(jīng)不可逾越的大山。更為重要的是,理論上來說只要 AlphaGo 等 AI 棋手經(jīng)歷了足夠的訓(xùn)練( 與不同風(fēng)格的人類棋手對戰(zhàn) )以及必要的學(xué)習(xí)( 與人類頂尖棋手過招 ),就能擊敗所有的人類棋手。
AI 是大勢所趨,即使人類選手?jǐn)〗o了 AI 棋手,我們也沒有什么好驚訝的。十九年前,人類選手就已經(jīng)在國際象棋戰(zhàn)場敗給了電腦棋手。與時俱進(jìn),新一代的電腦棋手為何就不能在十九年后戰(zhàn)勝圍棋選手呢?
歸根究底,不少人還是擔(dān)心擁有 AI 的電腦選手會朝著機(jī)器人的終極方向不斷進(jìn)化。在他們看來,電腦越聰明,人腦可發(fā)揮的空間就越小。雖然 AI 現(xiàn)在只是在小小的棋盤上戰(zhàn)勝了人類,但未來愈加強(qiáng)大的 AI 會不會不受人腦控制,甚至與人類在各條戰(zhàn)線大戰(zhàn)三百回合呢?
如同經(jīng)久不衰的世界末日預(yù)言,抵制 AI 的論調(diào)一直存在。而在人類選手再次落敗人機(jī)大戰(zhàn)的背景下,這種杞人憂天的觀點又一次被放大。
圍棋可能是匯集人類最高智慧的博弈游戲,但其簡單的競技規(guī)則并不能代表人類社會規(guī)則的全部。相比之前只會機(jī)械窮算的傳統(tǒng)電腦棋手,新一代 AI 棋手所擁有的「 深度學(xué)習(xí)」能力只是助其成功攻克了圍棋這一曾經(jīng)的碉堡而已。
事實上,AlphaGo 們距離真正的人工智能,還相差十萬八千里。
首先,不管是國際象棋還是圍棋,都是「 完全信息博弈 」,即比賽雙方的所有信息都會呈現(xiàn)在棋盤上。只要機(jī)器記住了所有規(guī)則,并且學(xué)會了所有應(yīng)對之法( AI 棋手可能做到,人類棋手完全做不到 ),就可以在對決中一直處于上風(fēng)。即便被李世石或柯潔們發(fā)現(xiàn)了部分破綻,程序員修復(fù)了這些 bug,即可讓機(jī)器無限逼近完美。
然而,在一些「 非完全信息博弈 」的游戲( 例如撲克或者電子游戲 )中,由于機(jī)器較難獲知所有信息,處于當(dāng)下發(fā)展水平的這些 AI 選手還很難在這些競技游戲領(lǐng)域戰(zhàn)勝人類選手。
其次,此番對戰(zhàn)李世石的 AlphaGo 依然需要研發(fā)團(tuán)隊對其進(jìn)行事先的程序設(shè)定,而不是完全依靠「 后天學(xué)習(xí) 」積累技能。AlphaGo 要想具有更加強(qiáng)大的 AI,首先就需要具備更加徹底的自主學(xué)習(xí)能力。在研發(fā)人員不給其編寫任何圍棋相關(guān)代碼程序的前提條件下,AlphaGo 還能通過「 深度學(xué)習(xí) 」在棋盤上打敗人類選手,或許這才是 AI 圍棋手當(dāng)之無愧的勝利。
最后,從 iPhone 上的 Siri 到 Google 家相對復(fù)雜的 AlphaGo,均屬「 弱人工智能 」,也就是處于發(fā)展早期的人工智能。AlphaGo 在棋盤上戰(zhàn)勝了人類頂尖選手,但其 IQ / EQ 可能連人類新生兒的水平都達(dá)不到。而從全面開花的「 弱人工智能 」到克隆人類的「 強(qiáng)人工智能 」,可能至少需要幾十年的發(fā)展里程。至于科幻片中才有的「 超人工智能 」,在可預(yù)見的未來依然是個遙不可及的構(gòu)想。
從「 弱人工智能 」到「 強(qiáng)人工智能 」,AlphaGo 們需要在認(rèn)知、行為和情感上全面模擬人類。棋盤上的常勝將軍,離開棋盤后可能就是個「 木頭 」。如何把「 木頭 」培養(yǎng)為既能理性思考又有感性思維的「 強(qiáng)人工智能 」,并且能嚴(yán)格遵守「 機(jī)器人三定律 」,或許這才是全人類需要共同深思的宏大議題。
智能界(jwnfls.cn)中國智能科技聚合推薦平臺,秉承“引領(lǐng)未來智能生活”的理念,專注報道智能家居、可穿戴設(shè)備、智能醫(yī)療、機(jī)器人、3D打印、智能汽車等諸多科技前沿領(lǐng)域。聚合品牌宣傳、代理招商、產(chǎn)品評測、原創(chuàng)視頻、FM電臺與試用眾測,深入智能硬件行業(yè),全平臺多維度為用戶及廠商提供服務(wù),致力成為中國最具影響力的智能硬件聚合推薦平臺。
最新評論