為了讓 AI 不斷打怪升級,DeepMind 打造「宇宙」
作者 雷鋒網 | 發布日期 2021 年 07 月 30 日 8:15 |
DeepMind 又給我們小驚喜。我們都知道,強化學習苦於類化能力差,經常只能針對單個任務從頭學習。
DeepMind之前開發的AlphaZero,儘管可以玩圍棋、西洋棋和日本將棋,但每種棋牌遊戲都只能從頭訓練。類化能力差也是AI一直被詬病為人工智障的一大原因。人類智慧的厲害之處,就在藉鑑之前經驗迅速適應新環境。
但類化能力不是一蹴而就,就像玩遊戲,也是先做簡單任務,逐步升級到複雜任務。《空洞騎士》(Hollow Knight)一開始只需要隨意走動揮刀砍怪,但噩夢級難度的「苦痛之路」關,沒有前面累積的技巧,只能玩寂寞。
多任務宇宙
DeepMind此次採用「課程學習」,讓智慧體於不斷擴展升級的開放世界學習。也就是說,AI新任務(訓練資料)是基於舊任務不斷生成。智慧體可盡情鍛鍊自己,簡單的如「靠近紫色立方體」,複雜點的如「靠近紫色立方體或將黃色球體放在紅色地板」,甚至和其他智慧體玩耍,如捉迷藏──「找到對方,且不要被對方發現」。
每個小遊戲存在世界小角落,千千萬萬個小角落拼成龐大的物理模擬世界,如下圖的幾何「地球」。總體來說這個世界的任務由三個要素構成,即任務=遊戲+世界+玩家,並根據三要素關係,決定任務的複雜度。
複雜度的判斷有四個維度:競爭性、平衡性、可選項、探索難度。
比如「搶方塊」遊戲,藍色智慧體需要把黃色方塊放到白色區域,紅色智慧體需要把黃色方塊放到藍色區域。這兩個目標矛盾,因此競爭性較強;同時雙方條件對等,平衡性比較高;因目標簡單,所以可選項少;DeepMind把探索難度評為中上,可能是因定位區域算較複雜的場景。
再如「球球喜歡和方塊一起玩」遊戲,藍色和紅色智慧體有共同目標,讓相同顏色的球體和方塊放在相近位置。
這時競爭性自然很低,平衡性毋庸置疑很高的;可選項比上面遊戲高很多;探索難度沒有定位區域,智慧體隨便把球體和方塊放哪都行,難度就變小了。
基於這四個維度,DeepMind打造超大規模「宇宙」任務空間,幾何「地球」也只是這宇宙的小角落,是四維任務空間的一點。DeepMind將「宇宙」命名為XLand,包含數十億個任務。
來看XLand的全貌,由一系列遊戲組成,每個遊戲在許多模擬世界進行,這些世界的拓樸和特徵平滑變化。
終生學習
數據有了,接下來得找到合適的算法。 DeepMind發現,目標注意代理(GOAT)可學習更通用的策略。
具體來說,智慧體輸入包括第一視角的RGB圖像、本體感覺以及目標。經過初步處理後,生成中間輸出,傳遞給GOAT模組,會根據智慧體目前目標處理中間輸出的特定部分,邏輯分析目標。
邏輯分析是指,每個遊戲可藉由一些方法,構建另一個遊戲,並限制策略的價值函數的最優值上限或下限。
DeepMind提出一個問題:對每個智慧體,什麼樣的任務是最好的?換句話說,打怪升級時,什麼樣的關卡設置才讓玩家順利升級為「真」高手,而不是一刀9999?
DeepMind的答案是,每個新任務都基於舊任務生成,「不會太難,也不會太容易」。其實恰好是讓人類學習時感覺「爽」的興奮點。
訓練開始時,太難或太容易的任務可能會鼓勵早期學習,但會導致訓練後期的學習飽和或停滯。不要求智慧體某任務非常優秀,而是鼓勵終身學習,即不斷適應新任務。所謂太難、太容易是較模糊的描述。需要量化方法,在新任務和舊任務之間彈性連接。
怎麼不讓智慧體做新任務時不適應而「暴死」?進化學習就提供很好的靈活性。總體來說,新任務和舊任務同時進行,且每個任務有多智慧體參與「競爭」。舊任務適應好的智慧體,會選拔到新任務繼續學習。
新任務中,舊任務的優秀智慧體權重、瞬間任務分佈、超參數都會複製,參與新一輪「競爭」。除了舊任務的優秀智慧體,還有很多新人參與,這就引進隨機性、創新性、靈活性,不用擔心「暴死」問題。
當然,因任務不斷生成、動態變化,一個任務可訓練不同長處的智慧體,並往不同方向演化(隨著智慧體相對性能和強健性進行)。最終每個智慧體都會形成擅長任務的集合,就像春秋戰國時期「百家爭鳴」。說打怪升級顯得格局小,簡直是模擬地球。
DeepMind表示,「這種組合學習系統的特性是,不最佳化有界性能指標,而是更新定義的通用能力範圍,這使智慧體開放式學習,僅受環境空間和智慧體的神經網路表達能力的限制。」
智慧初現
最終這複雜「宇宙」升級、進化、分流的智慧體長成了什麼優秀物種?DeepMind說,智慧體有很明顯的零樣本學習能力,比如使用工具、合圍、數數、合作+競爭等。
來看具體例子。首先智慧體學會臨機應變。目標有三個:
黑色金字塔放到黃色球體旁邊
紫色球體放到黃色金字塔旁邊
黑色金字塔放到橙色地板
AI一開始找到一個黑色金字塔,想拿到橙色地板(目標3),但搬運過程瞄見黃色球體,瞬間改變主意,「我可以實現目標1啦」,將黑色金字塔放到黃色球體旁邊。
第二個例子是,不會跳高,怎麼拿到高台上的紫色金字塔?智慧體需要想辦法突破障礙,取得高台上的紫色金字塔,高台周邊並沒有類似階梯、斜坡的路。
因不會跳高,所以智慧體「掀桌子」,把周邊幾塊豎起來的板子弄倒。然後一塊黑色石板剛好倒在高台邊,「等等,這不就是我要的階梯嗎?」這過程是否體現了慧體的智慧,還無法肯定,可能只是一時幸運。關鍵還是,要看統計數據。
經過5代訓練,智慧體在XLand的4千個獨立世界玩了約70萬個獨立遊戲,涉及340萬個獨立任務,最後一代每個智慧體都經歷2千億次訓練步驟。智慧體已能順利參與幾乎每個評估任務,除了少數即使人類也無法完成的任務。
DeepMind的研究,或許一定程度體現「密集學習」重要性。也就是說,不僅資料量要大,任務量也要大。這也使得智慧體在類化能力有很好表現,如資料顯示,只需對一些新複雜任務進行30分鐘集中訓練,智慧體就可快速適應,而從頭開始用強化學習訓練的智慧體根本無法學習這些任務。
往後我們也期待這「宇宙」更複雜和生機勃勃,AI經過不斷演化,不斷給我們帶來驚喜(細思極恐)的體驗。
資料來源:https://technews.tw/2021/07/30/deepmind_xland/
四維空間定義 在 Microsoft Taiwan Facebook 的最佳解答
🎉本週免費課程精選(2020.8.12)
整理每週三的課程集錦,是小編最愛的三件事之一💞
雖然只是剪貼,但有一種助印佛經做功德的光芒上身(誤)
課程中都有些業界小秘訣,是我整理給大家的呦😇
本週課程有:AI、Azure、NVIDIA、人資 AI 工具、Citrix 等等
請大家努力學習👨🏫
➊ 8/13 【雲端解密課程!Azure 360° Overview】
📌課程簡介:介紹 Azure 最熱門的關鍵服務,一掃你對 Azure 無從下手的困擾
線上報名👉 https://aka.ms/AA97hkf
➋ 8/18 Azure X NVIDIA 【AI 深度學習 與 HPC 商業領袖線上論壇】
📌課程簡介:分享 NVIDIA 如何在 Azure 利用自家 GPU DeepStream IoT 協助製造業導入 AI,微軟則分享高效能運算和 AI 機器學習在製造業的應用
立刻報名👉 https://aka.ms/azurenvwebinar
➌ 8/21 【防疫辦公新對策與遠端 AI 面試新利器】
📌課程簡介:分享微軟 Azure 虛擬桌面(WVD)+Microsoft 365,建構極度安全的遠距辦公環境,同場加映 Lasso 遠端 AI 面試工具
📌活動地點:高雄微軟辦公室(高雄市四維三路 6 號 11 樓 A3)
立刻報名👉 http://aka.ms/AA97kmz
❹ 8/25 【Citrix X Microsoft ── 1+1 未來.大無限】
📌課程簡介:Citrix Workspace+Microsoft Azure 重新定義安全、敏捷的現代數位工作空間,一起來了解安全且彈性的混合工作模式,創造企業大無限
立刻報名👉 https://aka.ms/AA979x3
四維空間定義 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
構築 5G 第 4 維:打造全場景自動駕駛行動網路
來源:C114通信网
自動化正在成為 5G 第 4 維: 5G 商業成功的基石
全球電信商紛紛吹響 5G 的商用號角,各主流手機廠商,也紛紛推出了自己的 5G 手機,不得不說 5G 正處在全面爆發的前夜。
據業界估計,5G 將只需三年就能突破 5 億用戶規模。而同樣的用戶規模,4G 花了 5 年,3G 花了 10 年。這樣的前所未有的「5G」速度其關鍵,就在於前所未有的 5G 極簡。
正所謂「大道至簡」,極簡本質上反映的,是一種內在的修為,是一種化繁雜為神奇的魔力。眾所皆知,5G 包含三大應用場景:包括 eMBB(增強型行動寬頻)、uRLLC(超可靠、低時延通信)和 mMTC(海量機器類通信)。
毫無疑問未來 10 年產業界,都將圍繞 5G 的這三個維度,持續進行技術創新,以及商業創新,也勢必將行動通信產業提升到一個新高度。
但在當下,我們同樣認識到 5G 技術的引入,也將進一步加劇網路的複雜性,進而導致 OPEX 的進一步攀升。因此,如何在 5G 部署伊始,用網路內在的極簡理念,化解持續成長的網路複雜性問題,徹底破除橫亙在電信商面前的 OPEX 難題,成為了影響 5G 產業發展的一個關鍵。
5G時代重大變革:面向服務化架構- 射頻工程師培訓教程
想要破解網路複雜性上升,與 OPEX 同步成長的魔咒,答案就是網路自動化。因此我們創新性的認為,自動化將成為 5G 的第四維,與 eMBB、uRLLC、mMTC 這三個維度,一起推動 5G 的商業成功,成為 5G 網路能力的一個必選項。
自動化能力的引入,一方面能夠幫助電信商解耦 OPEX 於網路複雜性,而且能夠給電信商的業務營運,植入敏捷的基因,大幅降低新業務的 TTM 時間。
面向行業數位化這個新的 5G 剛需市場,電信商在新業務發展初期,顯然需要手伸得更長,試錯成本更低去進行商業創新和市場培育,才有可能實現市場空間的規模擴張。而這就需要電信商變得足夠的敏捷,甚至需要變得跟互聯網企業一樣,具備快速的業務上線,以及敏捷的產品更新能力。
透過架構創新和 Use case 創新突破自動化能力邊界
網路自動化之於 5G 的必要性不言而喻。甚至可以說自動化一直是在電信商心中教堂式的存在。但坦率的說,經過多年的探索,絕大多數的網路自動化程度,仍然處於比較低的水準。那麼如何才能實現自動化能力的真正突破呢?是不是透過某個產品的功能演進就可以實現了呢?答案是否定的。
首先從時間維度上看,網路的自動化是個長期演進的過程,正如汽車自動駕駛 L1 到 L5 的分級一樣,網路的自動駕駛,也是一個基於場景的逐級實現的過程。自動化的價值也可以逐級兌現,實現沿途下蛋。
其次從空間維度上看,網路的自動化是個自頂向下的系統工程,不僅涉及到電信商面向自動化的流程重構,而且更加需要網路系統架構的創新。不僅需要網路設備更加的簡單和智慧,而且更加需要面向場景的 Use case 創新;
對於架構創新,我們拿汽車自動駕駛來看。汽車從被發明一開始,就是圍繞人的操作為中心去定義,整個架構以及部件的設計。而今天,要實現自動駕駛的話,如果還是圍繞人的駕駛行為,把所有的「人-機」交互轉換成「機-機」交互的話,將存在兩方面的問題:
一方面,這樣的轉換過程極其的繁復,另一方面,沒有辦法消除駕駛員個體行為差異性。因此,在面向一輛除了家和辦公室兩點以外,以「第三生活空間」存在的完全自動駕駛汽車而言,必須重新定義汽車的系統架構,以及部件的能力。
而網路的自動駕駛其複雜性更甚,首先,網路的全生命週期從規劃、建設、維護和優化各個環節,都存在大量的專家運維複雜性,且不同運營商的運維流程不盡相同。
其次,行動網路本身是個持續動態變化的系統,話務模型以及無線信道環境,上一秒鐘和下一秒鐘,就有可能變得迥異。再次,行動網路存在著幾千個配置參數,更可怕的是參數之間的依賴關係,已經完全超越專家經驗的可處理範疇。
因為我們不得不去考慮一個問題,如何透過系統架構的創新,去逐層的把實現層面的複雜性,進行封裝與屏蔽,這樣才有可能實現簡單、無損、高效的交互形式。才有可能徹底突破網路自動化的能力邊界,走向網路的完全自動駕駛。
基於這個理念,對岸中國華為在 2018 年,創新性的第一次面向業界發佈了面向行動網路自動駕駛的「Cloud AI-Network AI-Site AI」三層架構,將AI技術和行動網路進行深度結合,從雲端、網路和站點三個層面分層,構築行動網路的自動化與 AI 能力。透過架構上的分層自治,徹底激活網路各個層面的自動化潛力,並在此基礎上透過極簡協同,實現 Network AI 與 cloud AI 之間,以及 Site AI 與 Network AI 的高效閉環。
可以說,面向行動網路「三層架構」的推出,為行動網路全場景自動化的實現了架構上的準備。
實現網路自動化,核心是要實現基於意圖或者策略的 E2E 自動化閉環。也就是說網路層面與上層系統之間的交互,需要從簡單的數據交互、參數交互轉變到策略交互、意圖交互。這種轉變的基礎,就在於要真正實現行動網路的域內自治,即分層自治,垂直協同。
從運營商實現業務自動化(跨域跨廠家)的視角來看,「分層自治,垂直協同」的理念能夠最大化利用運營商與設備商的優勢。運營商能夠更多的從業務工作流的視角,來重構面向自動化的工作流以及靈活編排的能力。
設備商能夠更多從網路視角,實現對域內複雜性的封裝,進而實現自動化能力的高度內聚,來充分釋放網路潛能,並透過場景化能力接口的極簡開放,最終實現基於策略或意圖驅動的網路自治。
圍繞場景定義自動駕駛分層分級,推動 Use Case 創新
如果說架構上的準備,相當於給網路自動化的這一片熱土,真正變成了沃土,但是最終是否能成長為碩果累累的莊園,則依賴於整個行業圍繞網路運維場景,以及業務運營場景的 Use case 探索與創新。
行動通信產業對自動化的探索,如果一定要給一個里程碑時間點的話,可以追溯到 2006 年 NGMN 首次提出了 SON(自組織網路)的概念,其實業界對網路自動化的探索應該更早。
業界從工具輔助人工自動化,到功能定義自動化。時至今日,我們認為之前網路自動化的探索少了一個非常核心的要素:場景。場景可以說是自動化能力,與工作流的一個粘合劑,有且僅有透過場景化,基於流程來串接單點的自動化能力,才有可能最終以一個場景的循環自治,來兌現相對完整的客戶價值。
中國華為,這家已被美國川普正普頭痛的公司,於 2019 年 MWC 倫敦預溝通會上,發佈了系列化的面向行動網路的自動駕駛解決方案,其中就包括管控合一的移動大腦MAE(行動網路自動化引擎)。其兩大核心理念,其一就是圍繞網路運維生命週期的規劃、部署、維護、優化,以及業務發放五大領域的場景化的自動化能力。其二就是自動駕駛網路基於場景的L1到L5的分級演進理念。
例如在站點部署領域,MAE 提供一鍵式的站點部署解決方案,從站點的設計、配置、開通和驗收環節提供端到端的自動化能力,大大縮短了 5G 站點的開通時間。
目前已經在北美、日韓等全球多個局點展開驗證。北美某運營商通過採用自動化的站點部署方案,實現了開站過程中的零人工交互,平均每站點的部署時間從4小時縮減到半小時。
在業務發放領域,MAE 基於 AI 技術實現了無線家寬業務的可放號速率的精準預測與套餐的自動匹配,並透過與上層 IT 系統的無縫對接,實現了在營業廳的WTTx業務,一鍵式放號與套餐生成。
誠然實現行動網路的完全自動駕駛,是一個長期的旅程,但面對 5G 的到來,網路自動化則是時不我待,整個產業都需要行動起來,共同定義清晰的面向自動駕駛的分層分級標準、牽引技術創新並指導落地,及時享受自動化帶來的「分期」紅利,最終擁抱全場景自動駕駛網路帶來的無限可能。
附圖:How will 5G unlock the potential of autonomous driving?
构筑5G第4维:打造全场景自动驾驶移动网络
5G第四維:從三角形到鑽石
透過「分層自治,垂直協同」凝聚產業合力,加速自動化進程
构筑5G第4维:打造全场景自动驾驶移动网络
分層自治,開放協同
The need for speed: is Ireland ready for 5G - the next big thing in ...
Applications - 5G / Mobile Infrastructure | Microsemi
影片:5G Driverless Cars: South Korea tests new network in mock city
資料來源:https://3smarket-info.blogspot.com/2020/03/5g-4.html?m=1&fbclid=IwAR33AfFe2qHxHza9HkHPsxw8usWUSJe72iM3NJzssf1KUJQ_R8bPJ9oSxFk
四維空間定義 在 2023房貸補貼3萬如何線上申請?補助資格、查詢ptt何時發放 的推薦與評價
我國央行去年四度升息,累積升幅2.5碼,房貸利率連帶上漲,對於背負1000萬元房貸、20年期本息均攤的民眾而言,相當於每人每月要多繳3000元。 房貸補貼資格以2023年2月28日 ... ... <看更多>