看評論學象棋:英國科學家嘗試“另類”AI棋類算法
原標題:看評論學象棋,英國科學家嘗試“另類”人工智能棋類算法
讓AI學會下棋,成為“棋類大師”,安居客門店管理系統一直是人工智能領域廣為研究的課題。近日,來自倫敦大學學院的Kamlish等人公布了他們另辟蹊徑的研究試驗——SentiMate,一種采用自然語言處理方法,安居客門店管理系統通過訓練網絡評論文本來學習國際象棋的算法。它通過分析專家解說員的反應,對象棋動作的質量進行評價。
在SentiMate之前,人工智能主要通過不斷地對弈訓練學習圍棋。2016年擊敗圍棋世界冠軍李世石的AlphaGo使用神經網絡,與人類棋手的棋譜進行訓練,學習如何下圍棋。到了2018年,AlphaZero依靠深度神經網絡,通用強化學習算法和蒙特卡洛樹搜索,通過自我對弈進行強化學習。
與Alpha系列采用神經網絡,自我訓練的方法不同,SentiMate嘗試了一條自然語言學習路徑。該團隊首先收集來自網絡的2700條國際象棋游戲評論文本,然后建立了一個分類器,該分類器能夠在大量評論數據集中提取描述象棋動作質量的評論。他們還在象棋評論數據的基礎上訓練了一個情緒分析模型,分析人們通過語言所傳遞出的正向情緒來評估象棋的動作質量,從而指導機器人在棋局中的下一步行動。研究人稱,這兩個模型都達到了90%以上的分類精度。在此基礎上,他們提出了一個象棋引擎sentimate,它基于預先訓練的情緒評估功能來評估象棋的動作。
讓研究人員感到驚訝的是,SentiMate已有能力理解國際象棋的一些基本原則和制定幾個關鍵策略。《麻省理工科技評論》據此評價稱,雖然SentiMate從未戰勝過傳統訓練路徑下的象棋機器人,很難被稱作AlphaGo那樣的“象棋大師”,但這個新路徑展示了利用更少的游戲數據,更低的計算需求,通過語言分析的方法來研究象棋游戲的前景。
“自然語言處理的下一步是將機器學習到的信息轉變為切實的行動,來解決真實世界的任務”,研究人員對《麻省理工科技評論》表示,SentiMate所采用的學習技術還可以用來分析體育賽事,預測金融活動。“畢竟還有大量的書籍,博客和論文都在等待學習”。





