冰河。
是一款關(guān)于圍棋的人工智能程序。
而這款人工智能為了應(yīng)對(duì)圍棋的復(fù)雜性,結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)。
它通過(guò)訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò),將棋盤(pán)上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成一個(gè)概率分布。
然后,訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè),以 -1(對(duì)手的絕對(duì)勝利)到1(冰河的絕對(duì)勝利)的標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。
這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大,而冰河圍棋將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索中,實(shí)現(xiàn)了它真正的優(yōu)勢(shì)。
在獲取棋局信息后,冰河圍棋會(huì)根據(jù)策略網(wǎng)絡(luò)探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。
在分配的搜索時(shí)間結(jié)束時(shí),模擬過(guò)程中被系統(tǒng)最頻繁考察的位置將成為冰河圍棋的最終選擇。
在經(jīng)過(guò)先期的全盤(pán)探索和過(guò)程中對(duì)最佳落子的不斷揣摩后,冰河圍棋的搜索算法就能在其計(jì)算能力之上加入近似人類(lèi)的直覺(jué)判斷。
而冰河人工智能系統(tǒng),主要由幾個(gè)部分組成:
一、策略網(wǎng)絡(luò)(Policy Network),給定當(dāng)前局面,預(yù)測(cè)并采樣下一步的走棋;
首發(fā)域名m.xsbiquge。la
二、快速走子(Fast rollout),目標(biāo)和策略網(wǎng)絡(luò)一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比策略網(wǎng)絡(luò)快1000倍;
三、價(jià)值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面,估計(jì)是白勝概率大還是黑勝概率大;
四、蒙特卡洛樹(shù)搜索(Monte Carlo Tree Search),把以上這四個(gè)部分連起來(lái),形成一個(gè)完整的系統(tǒng)。
第一大腦:落子選擇器(move-picker)。
第二大腦:棋局評(píng)估器(position-evaluator)。
這些網(wǎng)絡(luò)通過(guò)反復(fù)訓(xùn)練來(lái)檢查結(jié)果,再去校對(duì)調(diào)整參數(shù),去讓下次執(zhí)行更好。
這個(gè)處理器有大量的隨機(jī)性元素,所以人們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練后能讓它進(jìn)化到更好。
除了這些還有一大段,反正關(guān)于人工智能的都寫(xiě)上去了,而且寫(xiě)的特別詳細(xì),就好像這個(gè)東西是夏銘研究出來(lái)的一般。
在場(chǎng)的所有人看到這一份詳細(xì)的資料后,都呆住了,這么多專(zhuān)業(yè)性的詞匯和英語(yǔ)單詞,他們都有些沒(méi)看懂,但是幸好有中文翻譯,這才讓大家大致了解了這個(gè)冰河的工作原理。
李達(dá)康將這份資料完完整整的看完之后,發(fā)出一聲驚嘆,忍不住的感慨道;
“老楊,你這女婿可找的太對(duì)了!真是太優(yōu)秀了,博學(xué)多才啊!”
棋社社長(zhǎng)劉東偉看到這資料之后,也忍不住驚嘆道:
“小夏的腦子里裝的是什么東西啊?他怎么能做出這個(gè)資料的?真是太不可思議了!”
楊立國(guó)看到他們這幅激動(dòng)的表情,笑著說(shuō)道:
“怎么樣?我女婿給我的這份資料不錯(cuò)吧?”
劉東偉看完之后,笑著點(diǎn)點(diǎn)頭說(shuō)道;
“這豈止是不錯(cuò)啊,這真是給我來(lái)一個(gè)天大的助力啊,這小夏分析的太對(duì)了,他已經(jīng)把整個(gè)冰河的運(yùn)作模式告訴我們了。”
此時(shí)袁來(lái)福也走了過(guò)來(lái)笑著說(shuō)道:
“夏銘老師真是太強(qiáng)了,你們看啊,我就說(shuō)這人工智能不可能會(huì)思考吧,這不過(guò)是米國(guó)佬把它給包裝了而已,就是想摧毀我們的心里防線而已,想讓我們誤以為它真的能夠自主思考,其實(shí)它的本質(zhì)還是數(shù)據(jù)處理,只不過(guò)是比傳統(tǒng)的ai更加迅速,更加多元化。”
現(xiàn)在他們終于知道這人工智能冰河不為人知的一面了!
既然已經(jīng)知道了人工智能的工作原理,他們就開(kāi)始思考接下來(lái)的戰(zhàn)略了。