Facebook悄悄參加星際AI大賽,然後輸瞭


量子位 出品 | 公眾號 QbitAI



第八屆星際爭霸AI大賽(StarCraft AI Competition)終於落下帷幕。



這次大賽選用的版本是《星際爭霸:母巢之戰》,開啟戰爭迷霧。所有參賽的AI在16臺虛擬機上,1v1捉對廝殺,為期兩周共進行41580場大戰。按照最終的勝率排定座次。



每局比賽60分鐘,未分高下時得分多者勝出。作弊或者計算超時都會被判出局。





共有28支隊伍參賽,其中有15支屬於獨立戰隊(Independent),其他基本來自大學:



美國哈佛大學、荷蘭代爾夫特理工大學、瑞典皇傢理工學院、荷蘭馬斯特裡赫特大學、巴西米納斯聯邦大學、日本築波大學、加拿大紐芬蘭紀念大學、法國南特大學、法國高等信息工程師學院、日本立命館大學、韓國世宗大學。





還有三個隊伍是量子位格外關註的。



比方說中國團隊。



其中以獨立戰隊身份參賽的“CPAC”,背後是一個Junge Zhang領銜的13人研發團隊,來自中科院自動化研究所;這個星際AI基於Steamhammer bot,然後增加瞭一些新的策略,並通過機器學習的方式訓練瞭一個多層感知網絡來生產戰鬥部隊。



(Steamhammer bot 傳送門:http://satirist.org/ai/starcraft/steamhammer/)



還有一個中國團隊由Tang Zhentao領銜,代號“KillAll”,據推測應該是來自中科院自動化研究所復雜系統管理與控制國傢重點實驗室;不過相關信息實在是太少。



另一個值得關註的隊伍是“CherryPi”(櫻桃派),背後是來自Facebook人工智能研究實驗室的八人團隊。





最終的戰果:不隸屬於任何機構的獨立戰隊們,包攬前三名。



CPAC以71%的勝率排名第四;CherryPi以69.08%的勝率排名第六;KillAll以43%的勝率排名第18。第一名“ZZZKBot”勝率83.11%,平均用時8分鐘。

汽車重低音電容

這幾位AI用的都是蟲族。





Facebook的團隊,在這個大賽中顯得有些異類,畢竟這是唯一有企業背景的選手,而且是一個押註AI已久的科技巨頭。



科技巨頭的AI殺入星際爭霸並不稀奇。今年8月,Google旗下的DeepMind宣佈進軍星際,不過他們選擇的方向是《星際爭霸2》。



看起來,星際爭霸已經成為巨頭爭霸的下一個戰場。



Facebook的人工智能團隊至少已有80餘人,帶領這個團隊的是大名鼎鼎的Yann LeCun,他們已經發表瞭很多研究和論文(其中三篇與星際爭霸有關)。但目前Facebook在人工智能領域還沒有取得AlphaGo那樣的成就。



而這次參賽成績也表明,Facebook還有很長的一段路要走。





Facebook研究科學傢Gabriel Synnaeve表示,他們把CherryPi當做一個基線,以及未來繼續在星際領域進行研究的基礎,“我們想看看它與現有bot相較如何,特別是測試一下是否有需要糾正的缺陷”。



人工智能對於科技公司的重要性已經不言而喻,而星際對於AI研究的重要性和挑戰,不僅僅是指揮戰鬥這麼簡單。與下圍棋這件事相比,《星際爭霸》的復雜性要大得多也要困難得多。



即便DeepMind現在也沒有突破性的進展。(參見量子位之前的報道)



星際2是個實用的基礎AI研究環境,因為遊戲本身復雜多變,且勝利方式不固定。



玩傢想要取勝需要同時做多手準備,比如管理並創造資源、指揮軍事單位和部署防禦結構等操作需要同時進行,逐步完成。此外,玩傢還需預測對手的策略。



這項任務確實不容易,但不是無解。DeepMind和暴雪嘗試將遊戲分為多個“迷你遊戲”,將不同任務分解成“可管理的組塊”,比如建立特定單元、收集資源或在地圖上移動等。



細分是為瞭方便研究人員進行不同任務的測試比較及細化,最終在智能體中組合,從而教會智能體通關整個遊戲。



為啥這個大賽沒用星際2?好像是沒跟暴雪爸爸談好……





回到這次的星際爭霸AI大賽,獨立參賽的隊伍,通常bot背後是程序員制定的規則和策略。比如摘得冠軍的ZZZKBot,背後是澳大利亞的程序員Chris Coxe。他獨自創建瞭這個AI,但其中隻有一些簡單的學習功能,背後更多是各種預先編輯好的策略。



而對於科技巨頭來說,他們更多的依靠機器學習,通過積累大量的遊戲數據,讓AI自己制定相應的遊戲策略。不過據說這次Facebook也沒有把全部研究都註入CherryPi之中。盡管如此,CherryPi還是獲得瞭對手的肯定,獲得第二名的PurpleWave作者就表示,CherryPi對時機的把握讓他印象深刻。



那麼獲勝的隊伍都依靠瞭什麼策略和技術?量子位也簡單介紹一下。



第一名:ZZZKBot



蟲族,單基地Rush佈局:4-Pool,Speedling,Hydra,Muta。使用手工編碼的邏輯,來進行策略選擇。



這個bot其實隻能執行一種單基地Rush戰術,單它的對手現在比較吃這一套。另外,這個bot能在遊戲中學習一些策略,以判斷哪種rush是最有效的。以及,這個bot幾乎沒有掌握任何戰鬥中的微操作。



“這原本隻是想證明一個概念”,作者Chris Coxe自我評價:“源代碼並不是那麼好”。



第二名:PurpleWave



這個bot主要是用Scala寫出來的,作者是美國軟件工程師Dan Gant,他今年一月開始啟動這個項目。



PurpleWave看起來比第一名更為“AI”一點;會微操作,有多種不同的策略。PurpleWave的高級決策被構建為一個任務網絡,它能根據對手以往的比賽情況,選擇不同的對抗策略。

汽車音響電容推薦

第三名:Iron



這是去年的冠軍,作者是法國程序員Igor Dimitrijevic。Iron於2016年開始研發,前身是2015年參賽的Stone。



Iron是一個多智能體系統,每個智能體控制一個單位。整體行為的魯棒性是其主要目標,每個智能體都是高度自主的,可以在25種行為之間切換。每場對決,Iron都采用相同的開局,但對根據對手的情況進行反應和修改策略。



第四名:CPAC



團隊名單:Junge Zhang,Xun Zhang,Qiyue Yin,Dong Zhan,Shihong Deng,Huikai Wu,Peixi Peng,Wenzhen Huang,Jing Kong,Debang Li,Yange Fang,Tairan Zhang,Junliang Xing。



CPAC是首次參賽,整個研發耗時數月。其他情況開頭也介紹過瞭。

汽車音響後級



最後說一下這個大賽的情況。



星際爭霸AI大賽,是加拿大紐芬蘭紀念大學David Churchill組織的年度活動。這個比賽的目的是促進和評估即時戰略遊戲(RTS)對人工智能的意義。



整個比賽使用BWAPI,這是一種可以讓AI程序控制《星際爭霸:母巢之戰》的軟件庫。



另外還有一些基本數據分享一下。比如歷屆選手的種族分佈,2017堪稱蟲族大崛起:





如果你想參與這個競賽,大會官方還提供瞭一個開源項目:UAlbertaBot,包含完整的文檔。不過這隻是一個入門指導,如果你想基於這個開源代碼參賽,必須對其進行重大修改。主辦方也不想一個bot的多個副本展開競爭。



這個開源項目的地址在此:https://github.com/davechurchill/ualbertabot/wiki



期待未來看到大傢制霸全場~



另外,如果你想獲得歷年數據,以及各種bot的相關下載,可以在量子位微信公眾號(QbitAI)對話界面,回復“星際bot”即可獲得。



— 完 —



加入社群



量子位AI社群9群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot3入群;



此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。



進群請加小助手微信號qbitbot3,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    全站熱搜

    zdf539d7n3 發表在 痞客邦 留言(0) 人氣()