阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

DeepMind是一家專門開發人工智慧的公司,被谷歌收購後的它風生水起,推出了他們的得意之作:AlphaGo(常常音譯為阿法狗)。阿法狗一路高歌猛進,甚至擊敗了圍棋世界冠軍珂潔後,名聲徹底出圈,開始向大家展現現代人工神經網路AI的風采。

而在17年左右,DeepMind就把領域觸及到了遊戲界,其19年推出的星際爭霸2特化AI“AlphaStar”一度擊敗多位職業電競選手,就算在被指出擁有AI獨有的精確點選操作和全域性視野而重新訓練後,也輕鬆的打入了大師段位。

問題是,RTS這種比戰略遊戲大家不服AI的好伐?你AI再怎樣都有操作優勢,何況誰還沒被電腦毆打過似得(起碼我基本打不過專家電腦,更別提作弊三了)。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

隨著時間過去,DeepMind和他們的超級AI也逐漸淡出了大家的視線,畢竟不是誰都喜歡看高科技前沿的細枝末節。

然而,就在本月末,DeepMind釋出了新的影片和部落格,向大家宣告:他來了,他來了,他帶著自己的全新遊戲AI,邁著大步走來了!

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

這次他們推出的可不是那種,只會下棋或者只會打星際的“針對特定任務的高度最佳化行為AI”,而是一個更加像玩家一樣,根據經驗規則進行判斷從而進行遊戲和取勝的AI。

據DeepMind稱:雖然舊AI支援圍棋、將棋、國際象棋等多種遊戲,但每個遊戲都需要不同的學習。他們表示:“我們正在尋求一種方法來克服AlphaZero的侷限性並開發適應性強的AI來代替它。”“新開發的AI不僅僅是針對特定任務的。這是朝著開發能夠快速響應不斷變化的AI邁出的重要一步——情況不斷變化,”

而從展示影片來看,他們做到了。

這次開發的AI宗旨在從第一人稱視角操作角色,學會如何在多人遊戲中實現相對簡單的目標。

用於學習和測試的遊戲有多種包括“奪旗遊戲”、“捉迷藏”、“顏色匹配”等等。奪旗模式的目標是「把黃色立方體帶到指定區域」。捉迷藏遊戲的目標是「遠離敵人的視野」或者「保證目標在自己視野內」。顏色匹配遊戲的目標是「接近同色的物體」。”而遊戲本身的地圖是會隨機變化的,也就是說要處理每一局的特殊情況,並不能背板。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

第一個遊戲是捉迷藏,其實就是要從對方的視野裡逃出去。官方給出的影片是從頂部的第三人稱俯視視角,但是AI實際能看到的只有左上角顯示的遊戲角色第一人稱視角。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

可以看到作為“鬼”的AI正在瘋狂追殺逃跑方,一躍而下防止對方脫離視野。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

跳起來抄近道追殺在高臺上的目標。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

紅方AI則抓住了對面沒跳上高臺的機會,甚至把地圖上的板子丟到身後遮擋視野。

更狠的是奪旗遊戲,這個模式下雙方要把目標立方體帶到與他們顏色相匹配的底座上。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

聽起來就是個競速和互相干擾的遊戲對不對?但是開發組在這個遊戲的內容裡增加了一條:“可以利用自己的互動光束來近戰擊殺對方”

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

眾所周知,AI一向擅長找到高效解決問題的方法。而這種時候什麼方法最高效就不用我說了吧?

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

藍方開場方塊都不管的,見面就上去一刀,當場把紅方給蒸發了,然後才去慢悠悠的搬方塊。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

然而還沒來得及跑路,就被複活衝回來的紅方一光束揚了,手裡的方塊飛出去老遠。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

雙方就這樣展開了許久的fps刀戰,最後靠著這波先手優勢。藍方在不斷的搶奪搬運中最後揚了紅方一次,把方塊搬回了自己的坡上,紅方從復活點復活早已為時已晚。

至於標籤嘉年華這個需要不讓其他玩家站在地板上的遊戲就更直球了。

諸如什麼背刺繞背刺,兩面夾攻,甚至還會蹲復活點和搶人頭!

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

而在目標為觸控特定物品的遊戲中,AI更是展現出了驚人的創造力,比如用板子搭斜坡,擊飛其他玩家,踩其他玩家的板子上,還有把目標打下來等等,不知道的還以為是人類一敗塗地PVP現場。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

根據DeepMind官方的說法,他們這次提出了連續幾代AI之間改進的迭代概念,而不是尋求在某個單一目標上最大最佳化。

訓練一個在如此龐大的任務空間中表現出色的智慧體是一項核心挑戰,而在這方面他們發現在固定分佈的訓練任務上進行純強化學習是行不通的。於是DeepMind決定動態地改變訓練任務分佈和訓練目標,使得AI永遠不會停止學習,每一次都會有新的內容學習和調整,而不是在重複作業中找到固定任務的最優解。

這種零樣本泛化的例子包括在捉迷藏、奪旗和標記方面的良好表現。透過分析和手工編寫的探測任務,他們記錄了這些AI的行為,並發現了許多有趣的緊急啟發式行為,例如試錯實驗、簡單的工具使用、選項切換和合作。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

這其實已經非常接近於人類打遊戲時候的狀態了,如果說之前的AI只會打背板音遊或者最優路線速通這種遊戲,現在他們已經會打肉鴿和各種模式下的PVP了,根據所玩遊戲的規則和這把的情況來決定做什麼,並且總結一些有效而優秀的泛用策略,比如什麼驅虎吞狼啊,蹲比啊,卡點啊,繞後啊,守屍啊,伏地起跳魔啊,幹掉競爭玩家啊。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

額,兄啊,你這總結的怎麼都是些老陰比招數啊!

嘶,我記得DeepMind是有和遊戲運營方合作然後悄咪咪把AI匿名投入網路遊戲這種操作的,此子不能留啊!不然指不定哪天在遊戲裡打你黑槍的其實就是尖端科技的超級AI。

阿法狗團隊開發全新老陰比AI 蹲點背刺搶人頭 遊戲手法相當熟練

不過現如今的新遊戲AI還在侷限於內部的對抗學習測試,其開發意義也是要在人工智慧的訓練方向上找到新出口,而非過來遊戲裡欺負本來就已經很難了的玩家們,這種能夠完成複雜任務並且自己進行臨場決策的AI想必將來會在更多領域發揮出作用。

而且往好處想,它們進遊戲後都是高速打進大佬段位和大師PK啊!和我們有什麼關係呢?我已經迫不及待想看大佬被AI蹲死了,GKD!

相關文章