歡迎來到合肥浪訊網(wǎng)絡科技有限公司官網(wǎng)
  咨詢服務熱線:400-099-8848

建設和運營小而精的網(wǎng)站需從幾個方面入手

發(fā)布時間:2016-02-10 文章來源:  瀏覽次數(shù):3090

作者:劉鋒  計算機博士,互聯(lián)網(wǎng)進化論作者,人工智能學家主編  


”把大象關進冰箱要幾步“涉及的科學漏洞



 


在討論谷歌圍棋AI及其比賽題目之前,我們先看那個聞名的笑話“把大象關進冰箱要幾步“,2000年中國春晚,趙本山、宋丹丹的小品《鐘點工》,曾經(jīng)用到了這個笑話:問“把大象放進冰箱總共分幾步?”答:“三步,第一步把冰箱門打開;第二步把大象放進去,第三步把冰箱門帶上”。


小品中的情景只是一個笑話,從科研角度看,由于故意忽視最為樞紐的第二步,使得這個原本偉大的科學實驗,變成了笑話段子。本文提出谷歌圍棋AI及其比賽有科學欺詐表現(xiàn),根源也在這里。


谷歌圍棋AI在Nature上畢竟說了什么



谷歌在Nature發(fā)表論文闡述了其圍棋AI程序AlphaGo的運行原理,這個原理描述相對專業(yè),這里我們也力爭用通俗易懂的語言描述谷歌畢竟說了什么,谷歌圍棋AI程序AlphaGo在下棋過程中主要通過四步完成工作,它們分別是:


第一步快速判定:用于快速的觀察圍棋的盤面,類似于人觀察盤面獲得的第一反應


第二步深度模仿 :AlphaGo學習近萬盤人類歷史高手的棋局來進行模仿學習,用得到的經(jīng)驗進行判定。這個深度模仿能夠根據(jù)盤面產生類似人類棋手的走法。


第三步自學成長:AlphaGo不斷與“自己”對戰(zhàn),下了3000萬盤棋局,總結出經(jīng)驗作為棋局中的評估依據(jù)。


第四步全局分析:利用第三步學習結果對整個盤面的贏面判定,實現(xiàn)從全局分析整個棋局。


判定欺詐的第一個原因,谷歌的把大象關冰箱題目



Nature論文闡述的AlphaGo基本原理,按照人工智能專家的評價:”其基本原理并沒有新東西“,但核心價值是學習了近萬盤人類歷史高手的棋局,和自我對戰(zhàn)下的3000萬盤棋局總結的經(jīng)驗。


請留意,這個樞紐內容,也就是AlphaGo到底終結出什么圍棋規(guī)律,或者其神經(jīng)網(wǎng)絡的權重值是什么,谷歌并沒有發(fā)表出來。也就是谷歌在”大象關進冰箱要幾步“題目上,說出了如何打開圍棋擊敗人類的冰箱大門,和如何關上圍棋擊敗人類的冰箱大門,但唯獨在第二步 圍棋如何擊敗人類的方法塞進冰箱,同樣做了躲藏。


我們知道,圍棋之所以很難被人工智能攻破,擊敗人類高手,就是其可能的組合數(shù)異常龐大。至于多么異常,2016年1月普林斯頓的研究職員給出了最新研究結果:對于一個19x19的圍棋棋盤而言,一共有361個位置,而每個位置可以單獨放置黑棋、白棋或者留空,理論上所有的可能組合是3^361種。但根據(jù)圍棋規(guī)則,不是所有位置都可正當落子,例如在圍棋術語中沒有氣的位置就不能落子。那么排除掉這些不正當?shù)钠寰趾罂偣策剩多少種呢?


普林斯頓的研究職員給出的19x19格圍棋的精確正當棋局數(shù):208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935


我們給它多分幾行:


2081681993819799846


9947863334486277028


6522453884530548425


6394568209274196127


3801537852564845169


8519643907259916015


6281285460898883144


2712971531931755773


6620397247064840935


不用數(shù)了,一共171位數(shù)! 這個數(shù)字比我們地球所有的沙粒數(shù)目還要多!比人類已知宇宙的所有星球數(shù)目還要多!對比一下,谷歌學習的近萬盤人類棋局是5位數(shù),谷歌自行對戰(zhàn)的3000萬盤是8位數(shù)。而圍棋所有可能的棋局盤數(shù)是171位數(shù)。假如規(guī)避還有可能的重復變化,我們把大頭去掉,那也有70位數(shù)的棋局變化。


第一也就是說谷歌以幼兒園規(guī)模的知識量,就要獲得諾貝爾獎級的知識規(guī)律,這是違反科學發(fā)展規(guī)律和常識的,第二,假如谷歌通過學習和自行對戰(zhàn)學到了超出平常的規(guī)律,或者其神經(jīng)網(wǎng)絡權重值達到新的高度狀態(tài)。但谷歌不愿意公然這個最重要最樞紐的內容,其他研究者就無法真正了解谷歌圍棋的真實水平。在這種情況下,匆忙舉辦獲得巨大貿易利益,沒有第三方真正監(jiān)視,無法洗脫作弊嫌疑的世界冠軍比賽。受到科學欺詐指控也屬必定。


判定欺詐的第二個原因,密室實驗與棋手放水



從科學實驗的嚴謹性說,谷歌在論文中闡述的實驗方法,表現(xiàn)不及格甚至惡劣,我們知道在物理,化學,生物,計算機等領域,進行實驗時,要求實驗對象必需達到一定數(shù)目,并進行多次獨立實驗。才能相對確保結果的不亂性和可靠性。譬如一個受到污染的試管,不管我們重復多少次實驗,其結果也一定是不可靠的。


谷歌在這篇論文中 對其他圍棋程序選取了眾多測試對象,并進行了495次實驗,但對人類測試者,卻只選取了一位曾經(jīng)獲得歐洲圍棋冠軍的棋手,并簽署嚴格的保密協(xié)議,原本可以很輕易邀請更多選手,但卻沒有按照科學規(guī)范進行多次實驗。先不談谷歌和棋手之間有無利益交易,就這一點,谷歌在Nature發(fā)表的論文從實驗角度是分歧格的。


更重要的題目出在與谷歌對戰(zhàn)的歐洲圍棋冠軍樊麾身上,在對戰(zhàn)棋譜宣布后的二個月里,大量職業(yè)圍棋高手蘊藉或公然指出樊麾水平施展變態(tài),或不求進取,或就是放水。


多次擊敗李世石,當前世界最優(yōu)秀的圍棋選手柯潔評價道:“他可能也是好久不下棋了,實力表現(xiàn)非常糟糕”。前北京市高校圍棋冠軍王爍在財新發(fā)布的文章中評價道:“這五局棋下得反而是很平庸。樊麾抵擋不足,五盤棋沒有什么激烈的戰(zhàn)斗,開局、定式、占大場、小規(guī)模接觸戰(zhàn),收官,對抗度很差。”


固然歐洲圍棋冠軍樊麾多次辯解“我施展變態(tài),當時崩潰了“,但更多棋友評價歐洲圍棋冠軍樊麾,“施展有技術變形”,“樊麾的表現(xiàn)只有業(yè)4水準,樞紐地方顯著放水”,“很顯著樊麾是谷歌公司的托,全是50年前的招法極其守舊,不輸才怪”,“對于谷歌,沒有什么假話是不能用1千萬美金解決的”。


除此之外,谷歌也沒有向Facebook那樣把圍棋程序放到互聯(lián)網(wǎng)上,光明磊落的接受大眾的考驗,作為與谷歌AlphaGo原理相同facebook圍棋程序DarkForest,目前水平相稱于業(yè)余5段,與職業(yè)選手依然有巨大的差距。


同時谷歌的論文結論也存在不可重復題目,F(xiàn)acebook圍棋項目負責人田淵棟在評價谷歌圍棋AI最為樞紐的快速走子策略時講到”對此AlphaGo只提供了局部特征的數(shù)量,而沒有說明特征的詳細細節(jié)。我最近也實驗了他們的辦法,達到了25.1%的正確率和4-5微秒的走子速度,然而全系統(tǒng)整合下來并沒有復現(xiàn)他們的水平。我感覺上24.2%并不能完全概括他們快速走子的棋力,由于只要走錯樞紐的一步,局面判定就完全錯誤了“。


從上述情況看,谷歌圍棋實驗刻意違背科學規(guī)范,采用密室孤立實驗,這些題目在3月9日與韓國選手李世石的比賽中沒有消除。人們常說,互聯(lián)網(wǎng)上,你不知道你的對面坐的是人仍是條狗。同樣對于谷歌圍棋比賽,我們完全可以質疑,與李世石對弈的畢竟是程序仍是人?如何保證李世石沒有被利益收買?谷歌即使不贏,實在也是勝了,魯迅的那個故事,乞丐:趙老爺今天打了我。


判定欺詐的第三個原因,過度追求市場影響與進步股價



 


谷歌選擇歐洲圍棋冠軍和前圍棋冠軍李世石進行世界轟動的比賽,而且沒有嚴格的第三方監(jiān)視,排除作弊的可能,表明谷歌并不是追求科學的嚴謹和榮譽,而是在追求品牌和影響力最大化,從而獲得巨大的經(jīng)濟利益。


事實也證實這一點,2016年1月28日曝出了谷歌人工智能圍棋戰(zhàn)勝歐洲冠軍的動靜,隨后是谷歌拿出100萬美元作為獎金挑戰(zhàn)李世石。當日谷歌股價大幅上漲,漲幅4.42%,換算成市值漲了200億美元。從宣傳效果是看,谷歌這次的“廣告”做非常巧妙。2016年2月26日彭博社報道,谷歌旗下人工智能公司DeepMind正推進自身醫(yī)療技術發(fā)展,由于其在圍棋領域的影響,已經(jīng)獲得不菲的訂單。


谷歌的技術期貨路徑和消除欺詐指控的方法



 


西方諺語說”一個動物,假如它走起來像鴨子 叫起來像鴨子 它就是鴨子“,同樣,對于谷歌圍棋Ai及其比賽,假如它回避公然如何從3000萬盤(8位數(shù))棋局獲得171位天文數(shù)字棋局的規(guī)律或神經(jīng)網(wǎng)絡權重值,回避不愿大范圍邀請棋手介入實驗,回避收買選手嫌疑,回避不在互聯(lián)網(wǎng)上公然對戰(zhàn)接受監(jiān)視,那么谷歌的圍棋比賽可以看作一場精心策劃的科學騙局或有欺詐嫌疑。


貿易中有一種做法叫產品期貨,消費者購買商品后,要等到半年或一年后才能拿到,那時技術,原料本錢大幅下降,商家因此獲得利潤。同樣,谷歌的圍棋程序應該獲得一定進展,但遠沒有到達能夠挑戰(zhàn)職業(yè)選手或九段高手的地步,谷歌通過市場和技術手段,拔高其圍棋水平。故意回避公然監(jiān)視或公然大范圍對戰(zhàn)。等待未來水平繼承晉升后,可能會進行公然,這種做法也可以稱作 ”技術期貨路徑。


谷歌可以消除欺詐指控的嫌疑,不是與李世石下棋,而是:


1.完整宣布或開源其利用3000萬盤棋局和學習人類棋譜總結的規(guī)律,或公然其神經(jīng)網(wǎng)絡權重值參數(shù),讓其他實驗者可以重復谷歌的實驗結果,還原谷歌對戰(zhàn)成績。


2.將谷歌圍棋AI程序AlphaGo放在互聯(lián)網(wǎng)上,接受百人,千人的同時對戰(zhàn)。并檢測對戰(zhàn)結果,消除作弊嫌疑。


這兩條谷歌能做出任意一條都可以看作是消除欺詐指控的強有力證據(jù),但在未來一年或更長時間里,谷歌沒有任何動作,那么谷歌將持續(xù)背負有科學欺詐嫌疑,利用科學炒作獲得巨大經(jīng)濟利益的指控。

上一條:個人如何建站與站建好后期...

下一條:使用ASP程序語言創(chuàng)建網(wǎng)...