周劍銘 柳渝:從AlphaGo與人對棋局的判斷看人、機關系

選擇字號:   本文共閱讀 323 次 更新時間:2019-11-20 19:31:13

進入專題: 智能哲學  

周劍銘|柳渝  

  

   摘要:AlphaGo利用深度神經網絡實現對棋局的判斷,用來指導蒙特卡羅樹搜索,讓有效處理圍棋的巨大而復雜的空間成為可能,從而戰勝人類圍棋高手。一方面,與傳統算法設計的"分析式"估值函數對棋局進行判斷相比,AlphaGo利用機器學習對棋局進行"整體性"判斷;另一方面,與人對棋局直覺判斷的"多樣性"相比,AlphaGo對棋局的判斷具有"單調性",因為贏棋是其唯一目標。人、機之間最大的區別就在于,人是天生的"主體性"學習者,機器則是在人造的"先天性"上才得到自己的"學習"能力的。(注1)

   目錄:

一、前言:"一石激起千層浪"

二、AlphaGo與傳統機器對弈

三、AlphaGo與人對圍棋棋局的判斷

四、AlphaGo與圍棋的棋技,棋藝與棋道

五、結語


一、 "一石激起千層浪"

  

   2016年3月12日,韓國著名圍棋棋手李世石對戰谷歌的人工智能機器阿爾法(AlphaGo),經過4個多小時的對弈,到第176手AlphaGo在棋盤上落下了最后一"石",曾獲多項世界冠軍的九段棋手李世石向AlphaGo認輸,AlphaGo以3比0率先獲勝,"石破天驚",全球嘩然! 

  

   "強人工智能"追求者把這次"人機大戰"看成是人類社會"奇點來臨"(Ray Kurzweil:"The Singularity Is Near")的一個信號:既然機器的智能可以勝過人的智能,機器反過來控制人類和統治世界就是可能的。另一方面,仍然有很多人相信,機器與人具有本質的區別,機器不會具有真正的感情、自我意識、良心、社會責任等人類獨具的能力,遺憾的是現在并沒有看到在理論、邏輯上可以對這種信心做出的有力支持。

  

   哲學家、人類學家、社會學家、文化理論家們似乎尷尬,因為對"智能"、"知識"、"情感"、"自我意識"等等最基本的概念幾千年來幾無定論,人工智能幾乎把由概念和邏輯構成的晦澀、復雜、精致的龐大哲學和抽象理論輕松地推到一邊去了,在人工智能發展的速度難以預測的情況下,所有的人都是哲學家,直接面對人、機關系的思考。


二、AlphaGo與傳統對弈算法

  

   在機器對弈中,所有可能走子序列可以表達為大小為b^d 的搜索樹(b:搜索寬度, d: 搜索深度),對于計算復雜度高的游戲,如象棋(b ≈ 35, d ≈ 80),尤其是圍棋(b ≈ 250, d ≈ 150),窮舉搜索是不可行的,所以需要設計一個最優近似的估值函數對棋局進行判斷,以降低搜索樹的深度和廣度。

  

   國際象棋的棋子具有"個體性",棋子的角色與在盤面上的位置大體決定了棋局的價值,"深藍"設計了分析式估值函數對棋局進行評估,20年前就擊敗了世界冠軍。但圍棋中,圍棋的"棋局"具有一種"整體性"意義,棋局不是由某些棋子與棋盤上的位置關系決定的,而是由每一個棋子與其它所有的棋子組成的"格局"決定的,并且每一棋局的局部與全局具有同樣的關系,因此圍棋的最優解結構非常復雜,"分析式"估值函數難以對棋局進行正確的判斷,所以,對于人工智能來說,圍棋是最具有挑戰性的經典對弈游戲。

  

   AlphaGo使用卷積神經網絡,通過監督學習和強化學習,直接從比賽對弈或自我對弈大數據中訓練出來二個深度神經網絡:"價值網絡"評估棋局的勝率;"策略網絡"博弈取樣 (圖1【1】)。與傳統機器利用"分析式"估值函數對棋局判斷相比,AlphaGo利用機器學習對棋局進行"整體性"判斷。



三、AlphaGo與人對圍棋棋局的判斷 

  

   那么AlphaGo對棋局的"整體性"判斷與人類棋手的"直覺"判斷有什么異同?對此辨析可以幫助深入認識人的學習與機器學習的關系。

  

   圍棋的棋盤是一種簡單的平面直交網格,實際上就是歐氏幾何平面上的坐標系,在此網格上的游戲實質就是對歐氏平面的基本性質甚至是潛在性質的利用和開發。在圍棋中,棋盤上的直交網格的每一位置被賦予非幾何的意義:空或占有、氣和眼、死或活,實現了幾何性和數學性的人為超越結合,賦予了圍棋豐富的內涵。

  

   對于同一個棋局,人類棋手各人所看并不相同,因此圍棋能體現個人的智力直覺,圍棋"易學難精",就是對人的直覺的自然性與自覺性的超越要求,這是圍棋表現為一種高級游戲的原因。

  

   所以,人類棋手在下圍棋時會強調心態、境界,這主要是為了得到對棋局的深度理解,由于圍棋局面的形成是平面幾何空間中的直交網格結構的深度重組,落子就意味著對棋局發展趨勢的決策,是歷史經驗與當前勢態的偶合,因此棋手必須專心致志,凝集精力于直覺(棋感),使個人的棋風在當前不確定性的棋局上產生偶合,以期得到"妙手",使一子之后產生一個全新的局面。

  

   我們于2017年和2019年二次在法國亞眠的科學節上(注2),教完全不懂圍棋的小孩下棋,采用了兩種現場教學方法。第一種是先介紹最基本的下棋規則,然后讓小孩下子,這時參與者每下一子要費周折,第一粒子放在什么地方是很大的困惑;第二種方法是先讓小孩任意下子,然后在教學者的陪練中亦步亦趨地學習可行的落子方法。很明顯,后者不但使事前完全不懂圍棋的小孩能夠馬上下棋,而且基本上知道了什么是圍棋,領會任意落子的奧秘,對圍棋產生了興趣。這個情況引發了我們進一步的思考,從小孩的學習中可以猜測到,圍棋的直覺與人的智力有內在關系。

  

   相對而言,AlphaGo用于棋局判斷的深度神經網絡的輸入并不是簡單的棋盤信息,而是Deepmind按照圍棋規則和他們自己的理解構造的人工特征,共有48個(詳見下圖2【1】),主要刻劃交叉點的"氣"數和變化,因此該網絡的輸入19×19×48,然后輸出一個落子概率向量,即在每個合法位置落子的概率。換句話說,AlphaGo的目標只是贏棋,并沒有對"棋形"的美感、一致性的策略等方面進行表達。可見,AlphaGo對棋局的判斷首先是建立在人賦予的"先天性""看局基礎上的,與人對棋局的"直覺"判斷的"多樣性"相比,AlphaGo對棋局的判斷具有"單調性"。在此意義上,AlphaGo的機器學習是人造的"先天性",并不具有人類棋手"主體性",看局的"多樣性",也就無所謂人的"直覺"。

   "What magical trick makes us intelligent? The trick is that there is no trick. The power of intelligence stems from our vast diversity, not from any single, perfect principle."--Marvin Minsky Source/NotesThe Socie-ty of Mind(1987),p.308

   (到底有什么神奇的訣竅使我們如此智能?訣竅就是根本沒有訣竅。智能的力量來源于我們自身巨大的多樣性,而非來源于某一單個的、完美的準則。--馬文·明斯基 http://china.caixin.com/2016-03-14/100919927.html)

  

   所以,人、機之間最大的區別在于,人是天生的"主體性"學習者,機器則是在人造的"先天性"上才得到自己的"學習"能力。


四、圍棋的棋技,棋藝與棋道

  

   圍棋作為棋琴書畫"四藝"之一,在中國文化中大體是文人雅士的修性、娛情的文化活動,雖然偶爾以兵喻棋("略技"),但非以棋為兵,更沒有爭命的意義,相反,常以棋局喻世態而求超然,與中國特色的"神仙思想"相呼應,人在棋局中,又在棋局外。"爛柯"這個故事的喻意就深得人心,南朝梁任坊的《述異記》和歷代其他一些筆記中均有記述,其大意是,樵夫王質入山伐木,見兩人在松下石臺上對弈,王質觀棋入迷,一人遞了一枚棗子給王質,王質吃后不知肚饑,后來一人提醒王質:"你怎么還不回去?"王質回頭看他的斧頭,斧柄竟已爛掉,當他下山回家時,人間已逾百年。甚至宋徽宗趙括也說"忘憂清樂在棋枰"。

  

   圍棋的"棋藝"并不創造一種具體形象,而是抽象局面的創造,因此與直覺的審美和情感不同,棋藝要求基于幾何性的一種直覺的超層次的理解和創造,這種創造性又是在雙方對抗性的個性與共性中進行的,所以圍棋對弈不僅是技術的較量,更是從感受到對方的氣質、性格、修養的內在性的無言溝通,故稱"手談","坐隱",表達圍棋的棋藝是一種抽象形象的共同創造和互動中的內在交流。

  

圍棋界普遍承認,棋手的人品也就是人的棋品,這是指棋手的修養與棋術的關系,人們普遍地把比賽的臨場心態,對戰略思想、戰術機會的把握等作為高級棋術素質,稱之為"棋道"。實際上,棋藝建立在人品之上,(點擊此處閱讀下一頁)

    進入專題: 智能哲學  

本文責編:sunxuqian
發信站:愛思想(http://www.zvjsub.live),欄目:天益筆會 > 科學精神 > 科學評論
本文鏈接:http://www.zvjsub.live/data/119115.html
文章來源:作者授權愛思想發布,轉載請注明出處(http://www.zvjsub.live)。

1 推薦

在方框中輸入電子郵件地址,多個郵件之間用半角逗號(,)分隔。

愛思想(aisixiang.com)網站為公益純學術網站,旨在推動學術繁榮、塑造社會精神。
凡本網首發及經作者授權但非首發的所有作品,版權歸作者本人所有。網絡轉載請注明作者、出處并保持完整,紙媒轉載請經本網或作者本人書面授權。
凡本網注明“來源:XXX(非愛思想網)”的作品,均轉載自其它媒體,轉載目的在于分享信息、助推思想傳播,并不代表本網贊同其觀點和對其真實性負責。若作者或版權人不愿被使用,請來函指出,本網即予改正。
Powered by aisixiang.com Copyright © 2020 by aisixiang.com All Rights Reserved 愛思想 京ICP備12007865號 京公網安備11010602120014號.
易康網
北京pk10开奖历史记录 黑龙江十一选五 宁夏十一选五一定牛哪里有 湖南快乐10分技巧 吃秀美拍直播主播怎么赚钱 新疆25选7 股票融资协议书 11选5任选8稳赚不赔 捕鱼达人单机版 7m足球比分 彩票平台代理 彩票大赢家 湖北快3和值走势分布图