導航:首頁 > 網路問題 > 圍棋ai用的什麼神經網路

圍棋ai用的什麼神經網路

發布時間:2025-01-24 09:53:29

① AlphaGo主要使用的技術是什麼

AlphaGo主要使用的技術是專家系統。

Alphago屬於人工智慧應用領域中的計算機博弈。阿爾法圍棋(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領銜的團隊開發。其主要工作原理是「深度學習」。

2017年7月18日,教育部、國家語委在北京發布《中國語言生活狀況報告(2017)》,「阿爾法圍棋」入選2016年度中國媒體十大新詞。

操作過程

阿爾法圍棋(AlphaGo)為了應對圍棋的復雜性,結合了監督學習和強化學習的優勢。它通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。

然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標准,預測所有可行落子位置的結果。

這兩個網路自身都十分強大,而阿爾法圍棋將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。新版的阿爾法圍棋產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往復。

② 阿爾法圍棋的程序原理

谷歌為AlphaGo設計了兩個神經網路:「決策網路」(policy network)負責選擇下一步走法, 「值網路」(value network)則預測比賽勝利方,用人類圍棋高手的三千萬步圍棋走法訓練神經網路。與此同時,AlphaGo也自行研究新戰略,在它的神經網路之間運行了數千局圍棋,利用反復試驗調整連接點,完成了大量研究工作。

閱讀全文

與圍棋ai用的什麼神經網路相關的資料

熱點內容
別克君越自帶無線網路 瀏覽:572
網路安全設計論文結論 瀏覽:305
iphone蜂窩移動網路變灰色 瀏覽:435
處理網路安全事故的程序 瀏覽:359
成都品牌網路營銷在哪裡做 瀏覽:637
網路安全和遙感科學哪個好 瀏覽:218
wifi和網路電話的區別 瀏覽:315
wifi如何選取網路 瀏覽:124
河南移動網路連接交換機撥不了號 瀏覽:660
5g網路在哪裡運行 瀏覽:733
網路營銷如何包裝自己 瀏覽:880
家庭網路管家暫不支持路由器 瀏覽:320
廣州華為無線網路 瀏覽:994
怎樣給無線網路改昵稱 瀏覽:272
無線分享網路什麼意思 瀏覽:458
網路測速怎麼刪除 瀏覽:626
電腦右下角網路連接圖標為黃色 瀏覽:669
映射網路驅動器的設置規則 瀏覽:518
光貓路由器4c連接不上網路 瀏覽:495
卸載軟體時手機無法連接網路 瀏覽:460

友情鏈接