學習如何使用 Python 寫基因演算法( Genetic Algorithm )的程式,以及如何最佳化機器學習演算法的性能
https://softnshare.com/machine-learning-optimization-using-genetic-algorithm/
同時也有1部Youtube影片,追蹤數超過21萬的網紅PanSci 泛科學,也在其Youtube影片中提到,#科學大爆炸 3月 AlphaGo V.S. 李世乭的世紀圍棋大賽,人工智慧以4:1下贏了天才棋士李世乭,開啟了人工智慧的新里程碑。 究竟AlphaGo厲害在哪裡?第四場為什麼AlphaGo會輸呢?人工智慧比人腦厲害在哪裡?我們真的就從此贏不了電腦了嗎?一起來聽聽台灣紅面棋王周俊勳,和又懂人工智慧...
基因演算法機器學習 在 Facebook 的最讚貼文
「它將改變一切!」
DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子折疊問題。
本週振奮全球AI界的消息:Google旗下人工智能企業DeepMind發布了最新 AlphaFold成果,這是全球AI界無比振奮的重大科研突破。蛋白質存在於我們世界中的所有有機物體及奧妙人體中,全新的AlphaFold 算法揭秘了生物學界50年來試圖破解蛋白質分子折疊的難題,這項AI帶來的重大突破,將幫助科學家弄清某些困擾人們的疾病機制、加速找出新型流行病的具體原因(比如今年的全球新冠大流行),促進新藥設計、幫助農業增產、解析可有效降解廢棄物的嶄新成分、甚至探索為大氣減碳的全新解決方案。
我特別期待 AlphaFold 能為人類健康、環境生活推向更寬廣的可能性。在魔幻2020 最後一個月,這真是一個讓人懷抱希望的全新技術可能性,期待 AlphaFold之後締造更多 AI for Good 落地應用。
以下文章詳盡解釋了這項突破,內容經《機器之心》微信公眾號授權轉載。
▎生物學界最大的謎團之一,蛋白質折疊問題被 AI 破解了。
11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智能技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子折疊問題。
最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 折疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
DeepMind 重大科研突破的消息一出即被《Nature》、《Science》等科學雜誌爭相報導,新成果也立刻獲得了桑達爾 · 皮查伊、伊隆 · 馬斯克等人的祝賀。
科學家們表示,Alphafold 的突破性研究成果將幫助科研人員弄清引發某些疾病的機制,並為設計藥物、農作物增產,以及可降解塑料的「超級酶」研發鋪平道路。
「這是該研究領域激動人心的一刻,」DeepMind 創始人、首席執行官德米斯 · 哈薩比斯說道。 「這些算法今天已經足夠成熟強大,足以被應用於真正具有挑戰性的科學問題上了。」
蛋白質對於生命至關重要,它們是由氨基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質折疊成何種形狀被稱為「蛋白質折疊問題」。在過去 50 年裡,蛋白質折疊一直是生物學領域的重大挑戰。
DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。在今年的國際蛋白質結構預測競賽 CASP 中,DeepMind 開發的 AlphaFold 最新版本擊敗了其他選手,在準確性方面比肩人類實驗結果,被認為是蛋白質折疊問題的解決方案。這一突破證明了 AI 對於科學發現,尤其是基礎科學研究的影響。
在兩年一次的 CASP 競賽中,各組爭先預測蛋白質的 3D 結構。今年,AlphaFold 擊敗了所有其他小組,並在準確性方面與實驗結果相匹配。
對於不熟悉生物領域的人來說,CASP 的大名可能有些陌生——CASP 全稱 The Critical Assessment of protein Structure Prediction,旨在對蛋白質結構預測進行評估,被譽為蛋白質結構預測的奧林匹克競賽。 CASP 從 1994 年開始舉辦,每兩年一屆,目前正在進行的一屆是 11 月 30 日開始的 CASP14。
而 DeepMind 這一突破有什麼影響?
用哥倫比亞大學計算生物學家Mohammed AlQuraishi 在Nature 文章中的話來說,「可以說這將對蛋白質結構預測領域造成極大影響。我懷疑許多人會離開該領域,因為核心問題已經解決。這是一流的科學突破,是我一生中最重要的科學成果之一。」
▎蛋白質折疊問題
蛋白質的形狀與它的功能密切相關,而預測蛋白質結構對於理解其功能和工作原理至關重要。很多困擾全人類的重大問題(如尋找分解工業廢料的酶)基本上都與蛋白質及其扮演的角色有關。
多年以來,蛋白質結構一直是熱門的研究話題,研究者使用核磁共振、X 射線、冷凍電鏡等一系列實驗技術來檢測和確定蛋白質結構。但這些方法往往依賴大量試錯和昂貴的設備,每種結構的研究都要花數年時間。
1972 年,美國科學家 Christian Anfinsen 因「對核糖核酸酶的研究,特別是對其氨基酸序列與生物活性構象之間聯繫的研究」獲得諾貝爾化學獎。在頒獎禮上,他提出了一個著名的假設:從理論上來說,蛋白質的氨基酸序列應該可以完全決定其結構。這一假設引發了長達五十年的探索,即僅僅基於蛋白質的一維氨基酸序列計算出其三維結構。
但這一思路的挑戰在於,在形成三維結構之前,蛋白質的理論折疊方式是一個天文數字。 1969 年,Cyrus Levinthal 指出,如果使用蠻力計算的方式來枚舉一種蛋白質可能存在的構象,要花費的時間甚至比宇宙的年齡還要長。 Levinthal 估計,一種蛋白質大約存在 10^300 種可能構象。但在自然界中,蛋白質會自發折疊,有些只需幾毫秒,這被稱為 Levinthal 悖論。
CASP 14 比賽最新結果:AlphaFold 中位 GDT 高達 92.4
CASP 競賽由 John Moult 和 Krzysztof Fidelis 兩位教授於 1994 年創立,每兩年進行一次盲審,以促進蛋白質結構預測方面的新 SOTA 研究。
一直以來,CASP 選擇近期才經過實驗確定的蛋白質結構,作為參賽團隊測試其蛋白質結構預測方法的目標(有些結構即使在評估時仍然處於待確定狀態)。這些蛋白質結構不會事先公佈,參賽者也必須對其結構進行盲測,最後將預測結果與實驗數據進行對比。正是基於這種嚴苛的評估原則,CASP 一直被稱為預測技術評估方面的「黃金標準」。
CASP 衡量預測準確率的主要指標是 GDT(Global Distance Test),範圍從 0 到 100,可以理解為預測的氨基酸殘基在正確位置閾值距離內的百分比。 John Moult 教授表示,GDT 分數在 90 分左右,即可視為對人類實驗方法具備競爭力。
在剛剛公佈的第14 屆CASP 評估結果中,DeepMind 的最新AlphaFold 系統在所有預測目標中的中位GDT 達到92.4,意味其平均誤差大概為1.6 埃(Angstrom),相當於一個原子的寬度(或0.1納米)。即使在難度最高的自由建模類別中,AlphaFold 的中位 GDT 也達到了 87.0。
歷屆 CASP 競賽自由建模類別中預測準確率中位數的提升情況,度量指標為 BEST-OF-5 GDT。
CASP 競賽自由建模類別中的兩個目標蛋白質示例。 AlphaFold 能夠預測出高度準確的蛋白質結構。
這些令人振奮的結果開啟了生物學家使用計算結構預測作為科研主要工具的時代。 DeepMind 提出的方法對於某些重要的蛋白質類別尤其有用,例如膜蛋白(membrane protein)。膜蛋白很難結晶,因此很難通過實驗方法來確定其結構。
該計算工作代表了在蛋白質折疊這一具備 50 年曆史的生物學問題上的驚人進展,比該領域人士成功預測蛋白質折疊結構早了幾十年。我們將很興奮,它能從多個方面對生物學研究帶來基礎性改變。 ——Venki Ramakrishnan 教授(諾貝爾獎得主,英國皇家學會會長)
▎DeepMind 這樣解決蛋白質折疊問題
2018 年,DeepMind 團隊使用初始版 AlphaFold 參加 CASP13 比賽,取得了最高的準確率。之後,DeepMind 將 CASP13 方法和相關代碼一併發表在 Nature 上。而現在,DeepMind 團隊開發出新的深度學習架構,並使用該架構參加 CASP14 比賽,達到了空前的準確率水平。這些方法從生物學、物理學、機器學習,以及過去半個世紀眾多科學家在蛋白質折疊領域的工作中汲取靈感。
我們可以把蛋白質折疊看作一個「空間圖」,節點表示殘基(residue),邊則將殘基緊密連接起來。這個空間圖對於理解蛋白質內部的物理交互及其演化史至關重要。對於在 CASP14 比賽中使用的最新版 AlphaFold,DeepMind 團隊創建了一個基於注意力的神經網絡系統,並用端到端的方式進行訓練,以理解圖結構,同時基於其構建的隱式圖執行推理。該方法使用進化相關序列、多序列比對(MSA)和氨基酸殘基對的表示來細化該圖。
通過迭代這一過程,該系統能夠較強地預測蛋白質的底層物理結構,並在幾天內確定高度準確的結構。此外,AlphaFold 還能使用內部置信度度量指標判斷預測的每個蛋白質結構中哪一部分比較可靠。
DeepMind 團隊在公開數據上訓練這一系統,這些數據來自蛋白質結構數據庫(PDB)和包含未知結構蛋白質序列的大型數據庫,共包括約 170,000 個蛋白質結構。該系統使用約 128 個 TPUv3 內核(相當於 100-200 個 GPU)運行數週,與現今機器學習領域出現的大型 SOTA 模型相比,該系統所用算力相對較少。
此外,DeepMind 團隊透露,他們準備在適當的時候將這一 AlphaFold 新系統相關論文提交至同行評審期刊。
AlphaFold 主要神經網絡模型架構概覽。該模型基於進化相關的蛋白質序列和氨基酸殘基對運行,迭代地在二者的表示之間傳遞信息,從而生成蛋白質結構。
▎對現實世界的潛在影響
「讓 AI 突破幫助人們進一步理解基礎科學問題」,經過 4 年的研究攻關,現在 AlphaFold 正在逐步實現 DeepMind 初創時的願景,在藥物設計和環境可持續性等領域都產生了重要的影響。
馬克斯· 普朗克演化生物學研究所所長,CASP 評估員Andrei Lupas 教授表示:「AlphaFold 的精確模型讓我們解決了近十年來被困擾的蛋白質結構,重新啟動關於信號如何跨細胞膜傳輸的研究。 」
DeepMind 表示願與其他研究者合作,以進一步了解 AlphaFold 在未來幾年的潛力。除了作用於經過同行評審的論文以外,DeepMind 還在探索如何以最佳的可擴展方式為系統提供更廣泛的訪問可能。
同時,DeepMind 的研究者還研究了蛋白質結構預測如何幫助人們理解一些特殊的疾病。例如,通過幫助識別存在故障的蛋白質,並推斷其相互作用的方式,來理解一些疾病的原理。這些信息能夠讓藥物開發更加精確,從而補充現有的實驗方法,並更快找到更有希望的治療方法。
AlphaFold 是十分卓越的,它在預測結構蛋白質的速度和精度上有著驚人的表現。這一飛躍證明了計算方法對於生物學中的轉換研究,加速藥物研發過程都具有廣闊的前景。
同時許多證據也表明,蛋白質結構預測在未來的大流行應對上是有用的。今年早些時候,DeepMind 使用 AlphaFold 預測了包括 ORF3a 在內的幾種未知新冠病毒蛋白質結構。在 CASP14 中,AlphaFold 預測了另一種冠狀病毒蛋白質 ORF8 的結構。目前,實驗人員已經證實了 ORF3a 和 ORF8 的結構。儘管具有挑戰性,並且相關序列很少,但與實驗確定的結構相比,AlphaFold 在兩種預測上都獲得了較高的準確率。
除了加速對已知疾病的了解,AlphaFold 還具備很多令人興奮的技術潛力:探索數億個目前還沒有模型的數億蛋白質,以及未知生物的廣闊領域。由於 DNA 指定了構成蛋白質結構的氨基酸序列,基因組學革命使大規模閱讀自然界的蛋白質序列成為可能——在通用蛋白質數據庫(UniProt)中有 1.8 億個蛋白質序列。相比之下,考慮到從序列到結構所需的實驗工作,蛋白質數據庫(PDB)中只有大約 170000 個蛋白質結構。在未確定的蛋白質中可能有一些新的和未確定的功能——就像望遠鏡幫助人類更深入的觀察未知宇宙一樣,像 AlphaFold 這樣的技術可以幫助找到未確定的蛋白質結構。
▎開創新的可能
AlphaFold 是 DeepMind 迄今為止取得的最重要進展之一,但隨著後續科學研究的開展,依然有很多問題尚待解決。 DeepMind 預測的結構並非全部都是完美的。還有很多要學習的地方,包括多蛋白如何形成複合體,如何與 DNA、RNA 或者小分子交互,以及如何確定所有氨基酸側鏈的精確位置。此外,在與他方合作的過程中,還需要學習如何以最好的方式將這些科學發現應用在新藥開發以及環境管理方式等諸多方面。
對於所有致力於科學領域中計算和機器學習方法的人而言,像 AlphaFold 這樣的系統彰顯了 AI 作為基礎探索輔助工具的驚人潛力。正如 50 年前 Anfinsen 提出的遠超當時科研能力所及的挑戰一樣,這個世界依然有諸多未知的方面。
DeepMind 取得的這一進展令人們更加堅信,AI 將成為人類擴展科學知識邊界的最有用工具之一,同時也期待未來多年的艱苦工作能夠帶來更偉大的發現。
影片及原文,參考 DeepMind官方部落客 https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
基因演算法機器學習 在 李開復 Kai-Fu Lee Facebook 的最佳解答
近日,我與阿萊克斯·彭特蘭教授(Alex Pentland)展開了一場”AI如何重塑人類社會”的精彩對話。
《連線》雜誌的資深撰稿人威爾·奈特(Will Knight)主持了這場對話。
阿萊克斯·彭特蘭教授任教于麻省理工學院,為全球大資料權威專家之一,現任MIT連接科學研究所主任、MIT媒體藝術與科學教授,擁有“可穿戴設備之父”、《福布斯》“全球七大權威大資料專家”、《麻省理工科技評論》“年度十大突破性科技”兩度桂冠獲得者等頭銜,曾參與創建MIT媒體實驗室,是全球被引述次數最多的計算科學家之一。
對話金句:
李開復:
AI最大的機會蘊藏在與傳統企業的結合中,這種價值的產生極其迅速,只需要幾個月,甚至短短幾周。
未來突破很難預測,對奇點、超級智慧的爭辯,在我看來都過於樂觀了。
小型AI公司與巨頭競爭,我的建議是找准巨頭沒有平臺優勢的細分領域,為某個針對性產業創造價值,不要與巨頭核心業務正面硬碰。
阿萊克斯·彭特蘭:
AI絕非試圖取代人類,而是促進多元文化之間的相互連接、團隊合作,讓人們更好的進行社交和連接彼此。
最困難的其實是說服人們改變商業流程去使用AI,因為大多數人是墨守成規的。
人工智慧有朝一日可以取代人類所有的能力,但是這個過程會非常漫長,可能需要上百年或更久。
我在對話中表示,當我們試圖解決AI問題時,應該用技術來解決技術的問題,可以尋求與監管部門協作,而不只是丟給他們,“新技術會衍生新的問題,我們應該多方嘗試用更進階的技術性解決方案,就像電腦病毒剛出現時,殺毒軟體隨之誕生。”
彭特蘭教授認為,人工智慧的核心,是促進多元文化之間的相互連接。不只是工程師或科學家,連經濟學家、政治家都必須參與進來。“國家之間應該促進合作、制定互通標準,就像TCP/IP互聯網協定那樣,避免AI冷戰。” 我們都贊同,AI發展從來不是單打獨鬥,跨學科思維、跨領域合作尤為重要。 這場對話是麻省理工學院中國創新與創業論壇(MIT-CHIEF) 組織的高峰對話系列活動,主題是《計算與未來: AI與資料科學如何重塑人類社會》。
麻省理工學院中國創新與創業論壇(MIT-CHIEF)由麻省理工學院的中國留學生創立,至今已有十年,是北美歷史最悠久的、由高校學生組織的中國創新創業論壇。系列高峰對話邀請了頂級科學家、投資人及創業者,共同探討科技創新及商業化過程中面臨的挑戰。
以下是我們對話的核心內容,由我的同事整理、分享給大家:
Part I 主題演講
▌李開復:各方應協作,讓AI 更務實
非常榮幸再次受到MIT-CHIEF的邀請,對於人工智慧的看法,這次我主要想講四點。
第一點是我書裡的主題,人工智慧的超能力。我們已經從人工智慧的發明期步入應用期階段,從應用落地層面來說,正迎來了AI發展最大的機遇。
很多科技公司目前已對人工智慧進行了多樣化佈局,從視覺、語言、觸覺和其他感知技術,到自動化機器人、無人駕駛等,對很多領域開啟了深遠的影響。雖然眼下所見的AI應用仍有局限性,但我預測未來的格局會非常龐大,依據統計,各行各業採用AI的程度目前不到5%,AI應用的中長期增長曲線相當可期。
第二點是我很欣喜看到的一點,AI正在和傳統行業深度融合。隨著人們對人工智慧的瞭解越來越多,更多的AI公司湧現出來。
AI最大的機會蘊藏在與傳統企業的結合中,創新工場也正在説明金融、製造、物流、零售、醫療等行業的公司進行AI變革。
作為AI投資人,我認為在這些行業如果找到正確的AI應用方向,就能帶來上千萬的回報。這種商業價值的產生是極其迅速的,通常只需要幾個月,甚至短短幾周就能看到成果。
現在人工智慧在傳統產業的滲透率仍在個位數,仍然有很大的提升空間。然而對於很多公司來說,它們需要的是高度定制化的方案,而非通用型AI方案,所以融合的過程中,不可避免會遇到不少挑戰和痛點。
第三,我早年做過很多科研工作,很高興能看到關於系統一和系統二(System One, System Two)的討論,我們期待人工智慧技術從系統一升級為系統二,即從識別、決策、優化等能力,升級到感知、認知等進階智慧的能力。
有不同的學派都在努力讓人工智慧更接近人類智慧,其中一個流派主張回歸經典的AI理念,甚至重新構建嶄新的模型結構,在深度學習技術的基礎上利用人類的知識。但我更支持另一個理論——深度學習的潛力還沒有完全釋放。
回看人工智慧過去60多年的歷程,最大的突破來自於計算能力和資料量大增而產生的可擴展演算法。我們看到了卷積神經網路(CNN)帶來的喜人成績,還有預訓練自然語言處理模型(Pre-Trained Models for Natural Language Processing)的廣泛運用。
預訓練模型與人類語言學習的模式類似,不管是英語還是中文,在習得這些語言之後,再去學習程式設計、藝術、化學。在無人監督的學習環境中,這種模式比我們想像得還要強大,就像阿爾法圍棋(AlphaGo)一樣。
最後一點我想說的是,如何讓AI變得更務實。
AI有很多問題,例如隱私、資料安全、治理和監管,在此就不一一討論了。當我們試圖解決這些AI難題時,有人認為讓監管部門加強管理是唯一辦法,其實不然,我們是否也可以朝著研發更厲害的技術性解決方案去努力?
就像電腦病毒剛出現時,殺毒軟體隨之誕生;面對千年蟲難題時,也迅速找到了技術應對方案。我們可以通過研發新技術,應對DeepFake深度換臉程式的挑戰;或者通過聯邦學習技術,在保證資料私密性的同時,滿足深度學習訓練需求。
作為握有技術能力的群體,我們需要與監管部門一起協作,而不只是把工作丟給他們。相信有了各方的助力,我們可以讓AI的應用變得更有深度,更加務實,更高效地克服現在面臨的種種問題。
▌阿萊克斯·彭特蘭:國家間應建立互通標準,避免“AI冷戰”
我對當前的深度學習技術不太樂觀。
最為主要原因是,深度學習不僅需要龐大的資料來源,而且要求這些資料長時間恒定不變,以保證模型訓練結果的可靠性,例如人類的面容、語言,就是相對穩定不變的資料來源。
但深度學習卻沒法應對快速變化的真實情況。亞馬遜在新冠疫情蔓延速度暴增時,出現了倉庫貨物緊缺,不得不停止送貨服務。這種經過深度學習高度優化後的系統發生崩潰,就是因為快速變化的疫情,和深度學習對恒定資料來源的需求是矛盾的。
另外,我想談談如何通過聯邦學習,促進資料的流通。
大多數公司沒有足夠豐富的資料,需要聯合不同的資料來源。基於這種需求,出現了很多新商業模式,比如“資料經紀人”——他們不出售資料,而是把資料借出去,作特定需求的使用。
“資料經紀人”業務湧現了很多,他們促進了資料的流通,也加強了資料的隱私性。因此,像聯邦學習這樣的技術和商業策略結合,有效解決了資料在合規性和所有權方面的難題。
聯邦學習也依賴於新的基礎設施建設,為資料應用和深度學習提供基礎環境,比如區塊鏈技術。現在世界上很多國家在做相關系統的建設實驗,新加坡等國家設置了一種相互競爭的區塊鏈系統,來解決支付和物流問題。我們最近也幫助瑞士做了類似的實驗,涉及不同資料的互通性和連貫性問題。
我們仍在研究如何用儘量少的資料,實現人工智慧的目標。少量資料是指不斷更新的短期資料,這些資料能使AI應對迅速變化的情況,並及時做出調整。
我們打算將AI與其他基礎科學結合,例如阿爾法圍棋(AlphaGo)就是這類結合的初步嘗試。這些方法不依賴于大量恒定資料,可能會比深度學習更加強大。
除此之外,我們在探討用AI保障聯邦學習過程中不同資料方的權益,這是實現不同國家之間的互通性、支付信任度、物流運輸等方面合作的關鍵前提。
另一方面,我們探索如何將AI技術應用於加密資料上。我們和大公司以及政府密切合作,找出解決系統入侵和保障網路安全的方法。
我同時花了很多時間研究與政府的合作。政府很多時候不知道如何通過大資料做決策,也不知道如何進行資料優化。而AI能夠幫助政府實現更高的效率,比如聯合國現在已經有了很多可持續發展目標的相關評估指標,世界經濟論壇也可以為會員國提供不同的標準測算。
基於我們已有的多中繼資料庫,現在可以利用AI實現全新的資料優化方式,將貧困、不平等這種之前無法量化的指標,通過可量化的指標進行評估。
同時,要真正實現這個目標,我們還需要制定統一的互通性標準。如果沒有這個標準,國家之間就不會相互信任去合作,就可能出現AI冷戰。
因此我們需要找到促進合作的方式,就像TCP/IP互聯網協議那樣。而之前我提到的,新加坡、瑞士等現在正在嘗試的區塊鏈系統,將有希望解決國家間缺乏互通標準的問題。
Part II 對話
▌ 美國線上教育發展難度更大,只在ZOOM上講課是不夠的
Q1:疫情加速了行業的改變,遠端醫療、線上教育開始蓬勃發展,這只是AI對人類社會產生影響的冰山一角。想請兩位談一談,目前看好AI在哪些領域應用的未來前景?
李開復:疫情的確對整個社會產生了實質性的影響,人們行為習慣發生了很多改變,更願意接受線上學習和工作了。
這種新的行為習慣產生了大量資料流程,為AI應用帶來了更多可能性。比如大健康領域以及遠端醫療中所產生的資料,可以訓練更智慧的模型。同時更多人開始在基因組學、新藥研發方面結合新的AI技術進行研究,因此我相信AI在醫療健康領域的潛能是非常巨大的。
AI與教育的結合也很值得期待。一方面可以説明老師處理重複性的日常事務,例如批改作業,讓老師得以將時間精力投入到更有創造性的事情上,能更悉心地為孩子提供優質教學。另一方面可以提高學生的課堂參與度和積極性,比如設置卡通版AI虛擬老師,讓課程充滿趣味性。
在中國,有很多線上教育公司在疫情之前就已經發展迅速,像創新工場投資的VIPKID,讓國外的純正英語老師線上上教授中國學生。目前,中國的線上教育已經擴展到了更多科目,包括體育、舞蹈、書法等素質教育課程。
相比之下,美國線上教育發展的難度會更大。畢竟只在ZOOM上講課是不夠的,好的線上教育必須要有好的內容。
▌AI核心是增強人際互聯,應注重文化多樣性
阿萊克斯·彭特蘭:李開復博士提到的教育案例,我不是很認同。
MIT大約20年前就在教育中使用AI,重點根本不是內容,我們甚至提倡將內容免費開放給大眾。
AI絕非試圖取代人類的作用,我們更強調用AI增強人與人之間的互動,讓人們更好的社交和連接彼此。比如手機上人工智慧技術,不是要取代你,而是讓你高效地找到最適合的工作、最正確的人,讓你更容易的獲取資訊,並進行創新。
我們可以利用資料激發更強的創新力,培養領導力。只有基於這樣的宗旨,才能促進更有創造力的教育和學習,這比關注教育內容本身重要得多。
在加拿大,有家創業公司正在訓練普通民眾學習AI,比如水管工,教學效果非常不錯。他們的教育方式不是簡單的教授基本知識,而是以一種能夠激發人們互動思考的方式。
我們之前在中國調研了3000多個孵化器,發現創業公司成功的要素裡,第一個是文化多樣性,也就是說創始團隊背景的複雜性和多樣性。第二個是團隊成員專業的多樣性,他們能否發揮自己所長,並很好地進行團隊合作。
1956年,馬文·明斯基 (Marvin Minsky)提出了人工智慧這個詞。但我們對於人工智慧的理解,不應該只停留在“人工”層面,而應擴展到多元文化之間的相互連接、團隊合作,我把它叫做延伸智能(Extended Intelligence)。這也是我想強調的,人工智慧這個名詞有一定的偶然性,但它的核心點是增強人與人之間的互聯性。
▌AI未來突破難預測,奇點、超級智慧過於樂觀
Q2:未來十年AI有沒有可能取得重要突破?比如GPT-3近期展現驚人的能力。兩位認為未來的突破方向是什麼?
李開復:過去60多年來,深度學習是唯一的重大突破。在這之後,卷積神經網路(CNN)和GPT-3等都算是重要的改善,我對於人工智慧的漸進式改善保持樂觀。
對科學家來說,他們更期待著技術上的突破式進展。但我覺得未來十年基礎科研或許不會有大的突破。但模型相對容易,只要有大量的資料,就可以從實驗室進入到行業應用,CNN和GPT-3都是模型加海量資料的成果。
我是務實派的,雖然持有樂觀態度,但並不是一位“未來學家”。未來的突破很難預測,對奇點(Singularity)的爭辯,甚至預測超級智慧的出現,在我看來都過於樂觀了。
阿萊克斯·彭特蘭:我同意李博士的觀點。很多生物機制很難解釋,包括用感知認識事物、理解聲音、尋找食物等,是深度學習演算法做不到的。但深度學習可以研究科學、制定規則、研究理論,並進行實踐。
從務實的角度來說,我最感興趣的就是聯邦學習。就醫療而言,我們有這麼多醫院,在新冠疫情期間做了很多的實驗,為什麼這些實驗資料不能進行聯合呢?
儘管資料有不相容的地方,但這也是一個很好的機會去探究不同的資料之間的關聯性。在未來,我們對資料的需求也許會越來越少,外科醫生或者物理學家或許不需要太多資料,因為他們對規則已經瞭若指掌了。
▌不要墨守成規,要跨領域、跨學科應對挑戰
Q3:人工智慧會有什關鍵挑戰?對於想從事這個行業的人,有什麼是需要瞭解的關鍵點?
李開復:首先,大背景在改變,新科技層出不窮,我們每年都需要學習新的東西。
其次,人工智慧可能引起各種問題,包括偏見、歧視、倫理道德等,是否危害人類的身體健康,無人駕駛技術該何去何從等等。
第三,人工智慧的研發需要深刻地理解技術對社會、生活與人類健康會產生的影響。我非常欣賞斯坦福和MIT這樣的高校,能夠把AI教育擴展到各個學科,讓研發人員及早意識到自己的責任和價值。
阿萊克斯·彭特蘭:是的,我朋友做過一個有關電的趣味類比,電動馬達最初在工廠裡用於生產的時候,並沒有發揮出多大的作用,因為大家並不知道如何改造生產流程。
AI在一些領域發揮的作用是顯著的,但應用到其他領域時,就需要改造流程。很多情況下,最困難的就是說服人們改變商業流程去使用AI,因為大多數人是墨守成規的。
而有意思的是,就像李博士提到的,像MIT和斯坦福這樣的高校確實在認真嚴肅地對待這個問題。
比如,我今天早上正好就這個話題跟G20領導人對話,大家一致認為我們必須從跨領域、跨學科的角度去面對這個問題,不能只是工程師或者社會科學從業者們在做,經濟學家,政治家等等都必須參與進來緊密合作。
隨著AI的應用領域越來越廣,除了必須具備強有力的技巧來建立社會規則,還需要對研究經費、企業投入等進行各種調整。
▌雖然大公司實力不容小覷,但依舊對小公司抱有期待
Q4:AI研究會消耗大量的資源,我們是否應該將資源往學術界平衡?現在已經發生資源的重新分配和平衡了嗎?
李開復:就人才而言,現在已經有重新平衡的跡象了。
過去,頂尖大學的學者基於待遇和種種考量,不少選擇去企業界工作。而近期,曾任職於百度、海爾、位元組跳動等公司的數位優秀AI科學家已經回歸高校。
但像GPT-3這樣的技術,仍然不是大學和小公司能支付得起的。支撐GPT-3運行的電腦是世界算力第五的超級電腦。每進行一次演算法訓練,就要花費460萬美金,只有像騰訊、穀歌、微軟這個級別的公司才能負擔得起如此強大的算力。
我觀察到,近年的AI創業公司已經和5年前截然不同了。它們一般由AI科學家和商業人才共同創建,為了解決特定問題而生,並非紙上談兵做突破性科研,切入的領域也往往是巨頭公司忽略的地方。
例如,為製造業進行AI賦能,不是一件輕鬆的事,需要去工廠實地勘查,瞭解運作方式。大公司因為賺錢很容易,不願意做這些性價比低的苦活累活。這些小公司的努力一旦有了成果,就會給產業界帶來革命性的影響。所以,雖然大公司的實力不容小覷,但我依舊對小公司抱有期待。
阿萊克斯·彭特蘭:大學和公司是一種融合的關係,不僅體現在人才流動上,也會進行資訊資源分享,彼此是整體性的合作態勢。
當然這也不是絕對,產業界的保密需求還是存在的,只是從學校的出發點來說,我們願意毫無保留地為大家提供更好的研究成果,並與企業合作,形成標準化平臺。
▌人工智慧取代人類需要上百年或更久
Q5:兩位認為什麼是AI不能取代的?
李開復:一類是創造力、分析能力、邏輯辯論能力,瞭解自己知道什麼不知道什麼,這些是人工智慧無法取代的。另外一類是同理心,人類之間的信任、友誼,自我認知、意識等。
阿萊克斯·彭特蘭:人工智慧有朝一日可以取代人類所有的能力,但是這個過程會非常漫長,可能需要上百年或更久。
▌AI創業建議I:找到小切入點,不要與巨頭正面硬碰
Q6:李博士提到了AI在小企業中的運用,可否再舉例說明是如何運用的?
李開復:這個問題分兩部分:一個是小型AI公司與巨頭競爭,我的建議是找准巨頭沒有平臺優勢的細分領域,為某個針對性產業創造價值,並且不要與巨頭核心業務正面硬碰。
對於那些中小型非AI、但想應用AI的公司,需要確保有足夠的資料,以訓練與核心商業價值掛鉤的AI模型,並且有願意變革的開放性公司文化。
所以,早期應用AI的公司可能規模較大,因為他們有足夠大的資料,和可相容變革的商業模型。每個例子都不同,不是任何一家公司都要應用AI。
阿萊克斯·彭特蘭:如果我們放寬AI的定義,或許水管工、合同工都有資料,通過一些簡單的分析、整合,AI也可以在很大程度上改進他們的工作。
這些都是很小的切入點,基於簡單的AI分析、機器學習,依舊可以產生巨大的潛力。
▌ AI創業建議II:知曉技術,同時理解商業
Q7:兩位再分享一下最後的建議?
李開復:我們在步入一個AI開始滲透到方方面面的令人振奮的時代,我希望所有的學生們都能參與到這個改革浪潮中。要深刻地理解人工智慧的商業落地,而不僅僅鑽研技術本身。
阿萊克斯·彭特蘭:不要太較真於深度學習或者冗長的演算法,一切始於要解決的現實問題。不要止步於技術本身,要明白資料類型、形態和規律,關注商業流程。
感謝葉樂斐、劉諾、藍萱、張昊、陳冬傑、劉子昂、張梓煜、錢淩寒、水一方、沈雍在校譯和審閱上對本文的貢獻。
基因演算法機器學習 在 PanSci 泛科學 Youtube 的精選貼文
#科學大爆炸 3月 AlphaGo V.S. 李世乭的世紀圍棋大賽,人工智慧以4:1下贏了天才棋士李世乭,開啟了人工智慧的新里程碑。
究竟AlphaGo厲害在哪裡?第四場為什麼AlphaGo會輸呢?人工智慧比人腦厲害在哪裡?我們真的就從此贏不了電腦了嗎?一起來聽聽台灣紅面棋王周俊勳,和又懂人工智慧又下棋的于天立老師怎麼說!
延伸必讀:
AlphaGo 爆冷從李世乭手中拿下首勝。台灣棋王怎麼看?電腦為何辦得到?
https://panx.asia/archives/42998
AlphaGo成為「棋靈王」是有多厲害?人工智慧未來又要怎麼走?
http://pansci.asia/archives/95263
AlphaGo既不是起點也不會是終點,從頭述說人工智慧走過的這70年
http://pansci.asia/archives/94904
人工智慧贏了圍棋,然後呢
http://blog.udn.com/DrVader/45626041
________________
周俊勳 棋士:
臺灣棋院九段、中國圍棋協會三段、職業圍棋棋士,是臺灣1979年成立職業圍棋制度以來第一位職業九段棋手。因右臉有大片紅色胎記,號紅面棋王。
他是世界圍棋棋壇上唯一擁有三個職業圍棋組織(中國圍棋會,中國圍棋協會(中國棋院),臺灣棋院)棋籍的棋手。
https://goo.gl/zU5l6A
于天立 副教授:
任教於台大電機系,研究領域為基因遺傳演算法、 演化計算、機器學習、人工智慧。
俞俐均 棋士:
職業一段,為目前台灣職業圍棋最年輕的女棋士。
http://times.hinet.net/news/18253327