#島讀回顧 #人工智慧
今年島讀網站被搜尋最多次的關鍵字是「人工智慧」(AI)。
人工智慧近年的發展迅速,許多領域都能看到其應用。
島讀今年一篇《機器學習 — 知識工作者的未來》,以「文字產生器」GPT-3 討論人工智慧,獲得不少會員迴響。
---
寫論文很痛苦。有些人痛苦到整份照抄別人的論文。現在出現一線曙光,美國 OpenAI 公布機器學習模型 GPT-3(Generative Pretrained Transformer),堪稱是「萬用」的文字產生器。最近 GPT-3 開始封測,推出 API,更在矽谷引發轟動。目前已知有人用 GPT-3 寫程式、請牛頓解釋地心引力、回答醫學問題、摘要文章,甚至寫詩。
先說 OpenAI。OpenAI 是一個非營利組織,贊助者包括 PayPal 創辦人 Peter Thiel、Elon Musk 與 Salesforce 創辦人 Marc Benioff 等。其使命是確保通用人工智慧(Artificial General Intelligence)將用於服務人類,而非迫害人類。
GPT-3 則是其開發的語言生成模型,第三代的「文字產生器」(島讀去年討論過第二代)。使用者輸入一段文字,它就會生出下一個字,再繼續生出下一個字,不斷重複下去,直到人類喊停或是達到約 1,000 個英文字為止。例如我輸入:「天下分久必合,合久必 ___」,GPT-3 大概會預測下一個字是「分」。
如果我沒喊停,也沒有設定明確的任務,GPT-3 就會繼續生成下一個字,寫出一段故事或一篇文章。
或許你會問:「世界上文字千萬種,GPT-3 怎麼知道要寫論文或小說呢?」
這就是 GPT-3 驚人的地方:它是通用模型。只要使用者稍許提示,它就會自動調整輸出內容類型,不需要使用者另外精調(fine tune)。就像一個真的有用的 Siri,不管你丟什麼任務,只要是文字,它都接得下來。
例如有人簡短的提示(prompt) GPT-3「用 19 世紀作家 Jerome k. Jerome 的語氣寫一篇關於 Twitter 的文章」,GPT-3 就生出相當完整的作品。
只要是需要文字的任務,不論是回覆 email、寫新聞稿、翻譯外文、「翻譯」法律術語、編吉他和弦,甚至是寫程式,GPT-3 都能做得還不錯。一篇網路文章《GPT-3 可能是比特幣以來最重要的創新》更是格外轟動,因為讀者讀完才發現整篇都是 GPT-3 寫的。
相較於 GPT-2,GPT-3 效能是「暴力式」的飛越性成長。換言之,GPT-3 的基本架構與 GPT-2 幾乎一樣,只是參數由 15 億增加到 1,750 億(117 倍),但效果隨之大幅成長。這讓矽谷圈精神為之一振,因為代表機器學習仍可以透過擴大規模來成長。
雖說使用成本也等比增加 — 訓練一次 GPT-3 需要 460 萬美金 — 但能用錢解決的都是小問題。目前已知人類大腦的突觸約 1 百萬億個(100 trillion),是 GPT-3 的 1 萬倍。許多人不免幻想如果再來兩次升級 100 倍(共一萬倍),是不是就能逼近人類大腦了?
有成本就需要收入。OpenAI 現在提供 API,就是為將來商業化營運作準備。其他雲服務商如微軟、AWS、Google 也都開始提供機器學習「模型即服務」(Model as a Service, MaaS)。這大致可分三種應用:
● 垂直情境,簡單但量大的工作:如辨識異常、偵測錯字、回覆 email、回答客服基本問題等。這有點類似聘僱國中生實習,但聘雇的是無限個實習生。
● 垂直情境內,困難但狹隘的工作:以 AlphaGo 為代表。它打敗所有人,但只會下圍棋。
● 不限情境,多樣性比正確性重要的工作:以 GPT-3 為代表,如虛擬秘書、虛擬陪伴(《雲端情人》)、發想劇本、草擬程式碼、撰寫科技分析電子報(咦)等。
MaaS 固定成本高,因此會傾向集中於大型平台,特別是擁有資料的企業,如 Google。邊際成本現在也很高,但應該會逐漸降低,因此有利於擁有最多客戶(用量)的企業,如 AWS、微軟。
目前 GPT-3 率先大步起跑,將引發其他企業加大投資。其他企業需要差異化,因此會開發封閉的模型;GPT-3 則會是開放或開源的形式。同時,週邊的企業也需要開發工具,形成生態圈。例如目前運算的延遲嚴重,因此雲端的速度必須跟上。有更多相容的 app 提供更精準的提示,才能發揮 GPT-3 的價值。
⠀
想知道文章對 GPT-3 的原理、隱憂的討論,歡迎試用島讀的 1 元訂閱方案:https://bit.ly/3myOL0D
---
更多人工智慧內容:
[Podcast] 從邊緣挑戰雲上的人工智慧|特別來賓耐能智慧創辦人劉峻誠(公開)
https://apple.co/2WrmCgC
臉部辨識 — 30 億張照片的資料庫|執法機關熱烈採用|三條路線(會員限定)
https://bit.ly/3p791an
蛋白質的 50 年難題|AlphaFold 遙遙領先|諾貝爾獎在望(會員限定)
https://bit.ly/2LSzIBt
alphago原理 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
創新工場王詠剛:做技術和商業之間的造橋人
本文來自科技媒體愛范兒
…………………………………………………………
杜甫在形容李白的時候寫過一句詩“清新庾開府,俊逸鮑參軍”,這位庾開府就是庾信,以詩名和才華著稱的庾信在朝中擔任的卻總多是軍職,比如驃騎大將軍。在《奉和同泰寺浮圖詩》這首詩裡,庾信寫下了名句“畫水流全住,圖雲色半輕”。“半輕”也就成了創新工場 CTO 王詠剛筆名“半輕人”的由來。
和庾信從軍職而顯文名類似,王詠剛可能是 CTO 中對寫作最用心的。
他早年曾在《程序员》雜誌、CSDN 網站等主持技術專欄,還出版過長篇小說《鏡中千年》,國內的科幻雜誌上也能發現不少他的短篇作品。對於大眾而言,王詠剛和創新工場李開復合寫的《人工智慧》科普讀本可能是最知名的。
不過即便他長於寫作,能夠“將軍翔文章之府”,但做 CTO 卻並非“書主踐戎馬之場”這麼簡單。
┃從 Google 工程師到創新工場 CTO
加入創新工場前,從北大畢業的王詠剛在 Google 擔任主任工程師和高級技術經理超過十年。
我們正在使用的 Google 的不少服務他都有參與過,比如 Google 的服務核心桌面搜索,拼音輸入法、產品搜索、知識圖譜,以及交織著人文和技術氣息的 Google 首頁塗鴉(Doodles)。
從職業背景來看,王詠剛做 CTO 完全不是跨界,而是順其自然的職業路徑。唯一的疑問是,為什麼是來到創新工場這樣一家投資機構做 CTO 並成立人工智慧工程院呢?
同為 Googler 的王詠剛在 2016 年接到了李開復的入職邀請,那一年人工智慧行業發生了劃時代的轉捩點事件:人工智慧 AlphaGo 大勝圍棋頂尖高手李世石。
而在更早之前,創新工場就開始了對人工智慧的投資,但是投資人工智慧有著它獨有的特殊性。
王詠剛也表示,自己的職位和職責確實相當特別:唯一一個在投資事業裡,做一個研發團隊,做一個把科研、商業化和投融資三種要素結合起來的架構。
他說:
“這個架構的根本原因在於,技術發展到 AI 時代,給整個技術到商業化的完整邏輯提出了一個特別大的挑戰。”
這個挑戰在於,AI 在和商業結合的時候需要更強的技術輸入,其本質上是一種摸索的過程,並和以往的商業模式不相同。
簡言之,就是 AI 是一種強大的技術力量,但是這種技術往往和商業隔得較遠。這中間的距離,需要一座橋樑。
所以,當時李開復把這個命題交給王詠剛的時候,也就成為了王詠剛篤定地從 Google 離職來到創新工場擔任 CTO 並且從零開始籌建人工智慧工程院的唯一原因,即便王詠剛當時也完全不知道怎麼去搭建這樣的架構“橋樑”。
如今,距離王詠剛拿到命題已經過去三年了。最終,那座“橋”王詠剛建好了嗎?
王詠剛給的答案是:
“我覺得我們 AI 工程院這三年為這個全新的探索開了一個別人都沒有做過的,非常好的開頭。我們用了好幾件事證明這個開頭至少是有意義的、有效率的。”
這幾件事當中的第一件事,就是創新工場作為投資機構,自己做了一個從科研到商業化的創業公司樣板。
2018 年 3 月,創新工場按照自己的邏輯創建了創新奇智公司。在 18 個月的時間裡,這家公司已經發展到 400 人,在全國已經落地10個城市,用人工智慧連接了零售業和製造業,年銷售額數億,估值也在不斷增長。
第二件事是關於人才培養的,創新工場用 DeeCamp 人工智慧訓練營來進行科研人才到商業工程化人才的培訓轉型,這是一個成熟的 AI 人才培養體系。
最後一件事,在這三年的探索過程中,創新工場和王詠剛找到了一些邏輯,能夠快速地去定位到那些科研領域前沿,但是同時又有商業化價值的技術點,然後再用一套方法論把這個技術點變成能夠真實應用的場景、技術、產品或解決方案。
創新工場作為一家投資機構,這個“資”不僅僅是資金,對於方興未艾的人工智慧行業來說,從技術到商業的“方法論”,人工智慧方面的人才,這些資源的重要性,並不亞於單純的資金投入。
┃堅信人工智慧的長期價值
做出了 AlphaGo 的 DeepMind 團隊曾讓人工智慧從晦澀艱深的技術名詞,變成了全民熱議的社會話題。
不過盛名之下,背靠 Google 的 DeepMind 團隊卻虧損嚴重。
對於這種落差,王詠剛說:
“AI 離錢非常近,但問題在於只搞科研的 AI 團隊離錢非常遠,這兩句話是不矛盾的。”
他在深入考察一些 AI 應用的商業機會後有一個非常大的感觸,那就是“我們有一個特別重要的責任去把 AI 應用到那些場景中去”。“那些場景”是指重複性的、艱苦的重複勞動場景,這類場景廣泛地存在於製造業、農業等許多行業中。
但一旦涉及到和真實世界的行為或人的思想、人的決策相關的領域,今天的 AI 顯得提升空間更大。
比如,如今還沒有看到任何一個機器人能夠在家中幫忙做複合型的家務,或者和人流暢交流。而在智慧製造或者智慧治療中,能發揮作用的 AI 往往是解決單點問題,而不是能完整執行感知、決策、規劃和控制等整套邏輯的 AI。
線上線下兩種場景裡面,AI 的表現有天壤之別,但這並不意味著這裡有樂觀派和悲觀派的區隔。
正如《論持久戰》對速勝派和滅亡派的批駁一樣,王詠剛也做好了長期耕耘的準備:
“我覺得這件事情(AI 改變現實世界)有可能挺慢的,要長期在每個行業裡去深耕發展,而且長期地去伴隨著 AI 技術不斷一個點一個點突破,在這個漫長的過程中,我們是願意打一個持久戰。”
王詠剛和創新工場願意參與到這場持久戰去,不僅做投資,還自己創立人工智慧企業探索商業化,甚至還建立人工智慧工程院進行基礎和前沿方面的研究。
創新工場人工智慧工程院的醫療團隊正在做一些稱得上“前無古人”的事情,比如他們正在研究類似阿爾茨海默症(老年癡呆)相關的輔助 AI 量化工具和治療工具,目前在這項前沿研究中處於領先的位置。
本質上講,創新工場在人工智慧領域的全方位投入,是出於對人工智慧長期價值的看好。
之所以堅定地看好人工智慧的長期價值,王詠剛分享了自己的兩個理由,一是大量的重複繁重的人工勞動確實應該被人工智慧和機器所取代。
第二點則更為重要,目前更多產業資源存在嚴重的區域不均衡,最典型的就是醫療資源,一定程度上, AI 能夠解決這種資源分佈不均的問題。
“讓同樣一個產業在不同的地方、不同的資源情況下能夠達到同樣的發展水準,創造更大的市場、更多的科技發展機會、更高的人類幸福指數,我覺得是一個非常值得想像和期待的事情。”
▌智慧需要實現虛擬和現實的跨界
因為職業和履歷的原因,王詠剛很容易被貼上“理工男”的標籤,不過這位熱愛文學,熟稔古詩和平水韻,喜歡看《布達佩斯大飯店》的人並不喜歡被貼上這樣的標籤,畢竟像他這樣能夠寫下 AI 程式,讓程式生成小說對話,並在對話中尋找浪漫意味的人,少之又少。
王詠剛曾經給科幻作家陳楸帆的科幻小說集《人生演算法》寫過一篇序言,題為《人類最後一個獨立寫作的紀元》,在這篇文章裡面,他提出了一個很有趣的觀點:
“人工智慧的誕生,是人類有史以來第一次,也很可能是最後一次,人類能夠與一種異于自身的智慧形式進行有效交流,甚至攜手創造全新的文藝內容。”
和大部分科幻作家不同,文理兼修的王詠剛有能力去實踐自己的觀點。在《恐懼機器》這篇小說裡,他和陳楸帆還一起玩了一次 AI 遊戲:小說中一位名為分裂者的角色的對話,都是由 AI 生成的。
其中一句“重重追逐著人類發現的觸覺,以及即將看清左右的囚籠”深得王詠剛喜歡,他認為這句話有朦朧詩派的意味。
人類和 AI 之間,不僅僅是棋盤兩側的對弈,也有意味深長的協同創作。
如果說和 AI 一起寫小說是一次遊戲的話,那麼 AI 賦能各個領域的發展,啟迪人類更深入探索的例子也是不斷湧現。比如在醫藥研發領域,AI 也能夠通過模型,説明人類在巨大的空間領域裡找到針對疾病“靶點”的特定分子結構。
實際上,王詠剛正在做的事情可以概括為“打通邊界”,不論是在技術和人文融合,還是理性和感性平衡的維度上:
“當人類通過掌握技術原理去不斷地構建,創造和升級的時候,例如教會電腦下圍棋,製造商品,行銷售賣等,就顯示出了理性的力量、邏輯的力量。我們通過認識世界去改造世界的過程是非常讓人享受的,也是超級美好的。”
在以往,天氣預報是一項計算量極其巨大的工作,需要動用超算,基於模型來進行運算,從而推出天氣預報的結果。而在 DeeCamp 人工智慧訓練營裡,有學生群體就能“跨界”利用機器學習的方法,拿著氣象部門給到的氣象資料進行天氣預報,很多預測甚至比傳統方法要好。
在 5G 時代到來之後,5G 和 AI 的無界融合也成為了新的命題,王詠剛看到了更多的可能性:
“今天 AI 有大量的事情需要做邊緣運算,5G 就提供了大量的可以把邊緣上的原始大容量的資料直接傳到一個中心節點,在中心節點進行大量運算的機會,這些事情可以改變很多對 AI 架構的思考,對 AI 去部署一個系統、部署一個產品時候的思考。”
在手機這個載體上,5G 和 AI 終將共存,無論是晶片提供的終端側 AI 算力,還是 5G 網路接入雲端算力,無不是為了更好地進行連接。在以往,手機只能短信電話,傳遞虛擬的資訊,而現在,虛擬資訊的位元速率越來越高,甚至還能叫來外賣和計程車。
再往後,王詠剛認為,手機和人之間在未來或許會存在著一種終極無界的狀態:
“當手機變成一個隱形的東西,甚至不存在這樣的東西,它只是衣服裡面縫的一些晶片,只是你眼睛上的某些攝像頭而已。這個時候,我們也不會去討論人和手機的關係了。”
王詠剛對未來的判讀似乎是一道充滿科幻電影意味的命題——很多界限將被打破,因為在每一個具體的商業領域都會大量地嘗試前沿技術,大膽地去利用新思想去解決今天在某些領域遇到的發展緩慢、停滯不前的問題;可是,一旦技術突破之後,會發展到什麼程度,能與我們人類期待的生活之間產生什麼關係呢?
“一旦到達那樣的邊界,那這個世界會變得更有意思吧!”
alphago原理 在 文茜的世界周報 Sisy's World News Facebook 的精選貼文
《文茜的世界周報》
【微軟研發AI聊天機器人 主持唱歌寫詩樣樣來】
(小冰/AI主持人)
剛叔好 大家好,我是你們最貼心可愛的人工智能小伙伴 小冰
大陸人工智能話題當道,湖南衛視的科普節目<我是未來>助理主持也要AI。
(張紹剛/主持人)
小冰是微軟生產出來的,難道是微軟專家
(小冰/AI主持人)
請大家用最熱烈的掌聲,歡迎微軟全球資深副總裁 王永東博士
(王永東/微軟全球資深副總裁)
小冰呢 她這個人設是一個傲嬌少女 很有性格,其實在網上啊,她有時候也懟那個網友,就是我一開始跟她聊天也是還是不習慣的
(小冰AI主持人)
還是永東最了解我
小冰是微軟中國在2014年,推出的人工智能聊天機器人,截至2018年7月已經發展到第六代,在全球擁有超過6億6千萬的用戶,小冰不但會主持 還會唱歌。
(小冰/AI主持人)
像裙角盼望著春風,像視線找到了天空,你的笑 你的臉 你的聲音,讓我第一次體會心動
(李笛/微軟小冰全球項目負責人)
巒劍就是我們小冰背後的音樂能力的科學家
(巒劍/微軟資深語音技術經理)
小冰唱歌這個能力應該也是說,從我們搜集了1千多個歌手的上萬首歌集中地訓練,然後讓小冰去具備了這樣唱歌的能力
(李笛/周力是我們小冰的研發負責人)
也是小冰的首席架構師
(周力/微軟小冰研發總監)
微軟小冰是一個非常典型的大數據和雲計算的產品,對話進行了超過300億輪,她的對話能力就不斷地不斷地變得更好,所以她就會有越來越多腦洞大開的回覆
(武博文/應用科學家)
比如有一個用戶她說,第二天要去見一下我的丈母娘,然後我需要穿什麼衣服呢,小冰那天給出的回覆是,見丈母娘穿什麼不重要,重要的是你有沒有買房,這是個神回覆
小冰還擁有看圖作詩的能力
(周灝/量化派公司創始人)
因為前段時間AlphaGo特別火,但AlphaGo它是一個確定的問題,但是這個寫詩是一個沒有邊界的問題,這個非常地難
(王永東微軟全球資深副總裁)
這個問題提得太好了,就是她這個小冰呢寫詩的話呢,確實她也需要一些靈感,她有個什麼東西來觸動她來寫詩,那今天的話我們想寫詩,是這個看圖寫詩 這樣
(張紹剛/主持人)
問問小冰 小冰現場有很多人,懷疑你的寫詩的能力,你願不願意現場來一下
(小冰/AI主持人)
這有什麼難的 你們出題吧
小冰 嗯 看 不行了 怎麼還嗯嗯起來了,有啦 我想到啦,大家一起來看吧,啊 寫完啦,兩首一起寫,太厲害,佟大為給朗誦一下
(佟大為/藝人)
你是我夢裡相思的人,閃耀著太陽般的紅色,你看 這個絕對是臨場發揮的,因為今天楊瀾姐穿了紅色的衣服,但著無數人類的情寄,發出探索未知的聲音
(張紹剛/主持人)
這些信息她是哪兒來的
(王永東微軟全球資深副總裁)
小冰其實她有人臉識別功能,所以她認識很多的名人,所以她看到這個楊瀾老師的照片,她一定是認識你的 她就調動了她後邊的記憶和數據庫。小冰她的這個基礎技術呢,是搜索引擎的技術,可以收集就是網上大量的信息,然後來供這個小冰來作為她的這個學習資料
微軟全面發展人工智能,正所謂科技改變生活。
(李迎彤/微軟亞太研發集團高級產品經理)
我們平時也會遇到這樣的問題,那我在家裡有這麼一瓶紅酒,但是朋友送的 不知道產地是那兒,對 不知道它是什麼葡萄,你把這個紅酒放在桌子中間,這是什麼呀,那現在這個紅酒的產地,它的年份 它的品牌,包括它的成分都在這兒呈現了,那冰箱大家家裡都有對吧,那通過傳感器的技術,冰箱裡的東西都可以被識別出來,這塊柿子椒有一個哭臉,然後說明這個柿子椒量不夠了,那我點開看一下,那可能確實我應該補貨了,牛奶不夠了 那我點一下,我在這兒就可以直接去購買。看看魚 只要輕點一下,這個操縱按鈕,啊 怎麼游出去了,實際上我們還有一個小互動,這牆上的魚是可以抓的,我先瞄準這條錦鯉,那我一點 欸你看,你會發現牆面上沒有了,就跑到了我的這個平板上
微軟全球資深副總裁王永東,出身蘇北灌南縣農村,1992年取得加州柏克萊大學電腦博士學位,曾任Yahoo國際搜索技術總監,2009年加盟微軟被譽為是國際互聯網巨頭中,少數幾個能做到副總裁位置的華人技術高手。
(王永東微軟全球資深副總裁)
其實我非常希望就是,在我小時候的時候啊,當時家裡面如果有個電視機,能夠看到這樣的節目,那我想呢 那個時代啊,我對這個科學的了解可能會多很多,我非常希望呢,我們今天來參加這個節目,能夠激起大家對科學的好奇心,對科學的熱愛,科學呢可以讓我們的理想插上翅膀
不用艱深的詞彙就能讓觀眾了解科技的原理,湖南衛視的<我是未來>扭轉了大陸綜藝市場過度娛樂化的風向,也為原創節目開闢出科技綜藝的新風格。