#島讀回顧 #人工智慧
今年島讀網站被搜尋最多次的關鍵字是「人工智慧」(AI)。
人工智慧近年的發展迅速,許多領域都能看到其應用。
島讀今年一篇《機器學習 — 知識工作者的未來》,以「文字產生器」GPT-3 討論人工智慧,獲得不少會員迴響。
---
寫論文很痛苦。有些人痛苦到整份照抄別人的論文。現在出現一線曙光,美國 OpenAI 公布機器學習模型 GPT-3(Generative Pretrained Transformer),堪稱是「萬用」的文字產生器。最近 GPT-3 開始封測,推出 API,更在矽谷引發轟動。目前已知有人用 GPT-3 寫程式、請牛頓解釋地心引力、回答醫學問題、摘要文章,甚至寫詩。
先說 OpenAI。OpenAI 是一個非營利組織,贊助者包括 PayPal 創辦人 Peter Thiel、Elon Musk 與 Salesforce 創辦人 Marc Benioff 等。其使命是確保通用人工智慧(Artificial General Intelligence)將用於服務人類,而非迫害人類。
GPT-3 則是其開發的語言生成模型,第三代的「文字產生器」(島讀去年討論過第二代)。使用者輸入一段文字,它就會生出下一個字,再繼續生出下一個字,不斷重複下去,直到人類喊停或是達到約 1,000 個英文字為止。例如我輸入:「天下分久必合,合久必 ___」,GPT-3 大概會預測下一個字是「分」。
如果我沒喊停,也沒有設定明確的任務,GPT-3 就會繼續生成下一個字,寫出一段故事或一篇文章。
或許你會問:「世界上文字千萬種,GPT-3 怎麼知道要寫論文或小說呢?」
這就是 GPT-3 驚人的地方:它是通用模型。只要使用者稍許提示,它就會自動調整輸出內容類型,不需要使用者另外精調(fine tune)。就像一個真的有用的 Siri,不管你丟什麼任務,只要是文字,它都接得下來。
例如有人簡短的提示(prompt) GPT-3「用 19 世紀作家 Jerome k. Jerome 的語氣寫一篇關於 Twitter 的文章」,GPT-3 就生出相當完整的作品。
只要是需要文字的任務,不論是回覆 email、寫新聞稿、翻譯外文、「翻譯」法律術語、編吉他和弦,甚至是寫程式,GPT-3 都能做得還不錯。一篇網路文章《GPT-3 可能是比特幣以來最重要的創新》更是格外轟動,因為讀者讀完才發現整篇都是 GPT-3 寫的。
相較於 GPT-2,GPT-3 效能是「暴力式」的飛越性成長。換言之,GPT-3 的基本架構與 GPT-2 幾乎一樣,只是參數由 15 億增加到 1,750 億(117 倍),但效果隨之大幅成長。這讓矽谷圈精神為之一振,因為代表機器學習仍可以透過擴大規模來成長。
雖說使用成本也等比增加 — 訓練一次 GPT-3 需要 460 萬美金 — 但能用錢解決的都是小問題。目前已知人類大腦的突觸約 1 百萬億個(100 trillion),是 GPT-3 的 1 萬倍。許多人不免幻想如果再來兩次升級 100 倍(共一萬倍),是不是就能逼近人類大腦了?
有成本就需要收入。OpenAI 現在提供 API,就是為將來商業化營運作準備。其他雲服務商如微軟、AWS、Google 也都開始提供機器學習「模型即服務」(Model as a Service, MaaS)。這大致可分三種應用:
● 垂直情境,簡單但量大的工作:如辨識異常、偵測錯字、回覆 email、回答客服基本問題等。這有點類似聘僱國中生實習,但聘雇的是無限個實習生。
● 垂直情境內,困難但狹隘的工作:以 AlphaGo 為代表。它打敗所有人,但只會下圍棋。
● 不限情境,多樣性比正確性重要的工作:以 GPT-3 為代表,如虛擬秘書、虛擬陪伴(《雲端情人》)、發想劇本、草擬程式碼、撰寫科技分析電子報(咦)等。
MaaS 固定成本高,因此會傾向集中於大型平台,特別是擁有資料的企業,如 Google。邊際成本現在也很高,但應該會逐漸降低,因此有利於擁有最多客戶(用量)的企業,如 AWS、微軟。
目前 GPT-3 率先大步起跑,將引發其他企業加大投資。其他企業需要差異化,因此會開發封閉的模型;GPT-3 則會是開放或開源的形式。同時,週邊的企業也需要開發工具,形成生態圈。例如目前運算的延遲嚴重,因此雲端的速度必須跟上。有更多相容的 app 提供更精準的提示,才能發揮 GPT-3 的價值。
⠀
想知道文章對 GPT-3 的原理、隱憂的討論,歡迎試用島讀的 1 元訂閱方案:https://bit.ly/3myOL0D
---
更多人工智慧內容:
[Podcast] 從邊緣挑戰雲上的人工智慧|特別來賓耐能智慧創辦人劉峻誠(公開)
https://apple.co/2WrmCgC
臉部辨識 — 30 億張照片的資料庫|執法機關熱烈採用|三條路線(會員限定)
https://bit.ly/3p791an
蛋白質的 50 年難題|AlphaFold 遙遙領先|諾貝爾獎在望(會員限定)
https://bit.ly/2LSzIBt
邊際成本 題目 在 讀書e誌 Facebook 的最讚貼文
去年的七月份讀了MIT 贈送的書 “The business of Platforms", 因為今年出了中文版 “平台策略”,所以揪公司裡面的主管們一起讀起來。其中一位同事讀完之後,覺得很不錯,但認為以平台策略來說,他要介紹我這一本 “Competing in the age of AI" 搭配閱讀。
如果說“平台策略”一書是從現在市場上已知案例中,分析平台生意模式的種類和當中的盲點,那 “Competing in the age of AI” 就是像是告訴你,整個生態和遊戲規則朝著平台模式轉變時,組織該如何調整自己的體質,對於分工的思考,還有對於AI 的期待。之所以講AI 的書籍會跟平台有關,也是因為AI 要真的落實在行業中,也必須是用平台的商業模式才有可能規模化。
兩本書都有講到平台的種類和可能的盲點,例如基本的網路效應 (network effect),叢集(Clustering),跑單 (disintermediation,就是媒合買賣雙方後他們直接聯繫不再需要中間的平台了) 或是多歸屬 (multi-homing ,例如一間餐廳同時使用 Food Panda 和 Uber eats),等等。我喜歡這本新書不只是因為他很務實地分析公司的組織規劃以及IT 系統如何搭配,更是回到一個基本的問題: “公司”,這種近代歷史才有的組織形態,為什麼會存在。而在AI 世代中,公司要如何質變才能持續地帶出預期的價值?
簡單來說,公司的存在除了讓資本運用更有效之外,理論上因著結合許多人分工合作的力量,可以創造出運營模式 (Operating model) 而帶出三個優勢:
(1)Scale 規模
(2)Scope 範疇
(3)Learning 集體學習
在工業革命世代可以看出公司大量生產帶來的經濟規模,以及公司可以觸及的範圍 (想像製造業面對許多不同種類的供應商),並且因著持續運營學習而不斷優化,進而提高競爭的門檻。但是在資訊世代,即使許多行業還是有實體的產品或是服務,其中所產出的資訊也是重要的一環。在資訊化的產業中,複製資訊的邊際成本趨近於領,資訊也讓跨產業變得容易 (谷歌是搜尋引擎還是最大廣告商?),同時AI 當中的機器學習能力更是前所未見的強大,因此要如何體現 scale/scope/learning 的優勢,就需要不同的思維。
書中說到公司組織內部就可以開始用定義 API 的方式,讓團隊之間資訊交換更透明有效率,不想過往Silo的分工方式。同時,真的能夠實現的AI 目前還是屬於 “弱 AI" (weak AI),就是從數據中看出行為模式和極有效做簡單分類與判斷的。而電影中那些超強的虛擬助理,或是能夠真正創作的AI, 屬於 Strong AI,可能還有一段時間是在有限的情境當中使用。書中最後提到 "AI 生產線” 的比喻,真正發揮資訊邊際成本趨近於零的強大威力!
所以人在組織當中的價值是什麼?可以思考邊際成本趨於零的時候,公司的服務或產品到底是如何創造和擷取價值的。可以跨界思考現有的東西會如何與其他領域產生關連。更重要的是,如何定義需要機器學什麼,如何使用AI去嘗試得到新的洞見。
擁抱學習AI才能思考它如何成為你的工具。機器要提供 “正確”的答案不太難,但這個“正確答案”是否有價值,是看那個訂題目的人是否知道怎麼定義問題。
前一本書 "The Business of Platforms" 的中文版:"平台策略:在數位競爭、創新與影響力掛帥的時代勝出"
https://www.books.com.tw/products/0010850360
書評:https://dushuyizhi.net/the-business-of-platforms-平台生意學/
全文與書中示意圖在部落格中👇
https://dushuyizhi.net/competing-in-the-age-of-ai-%e4%ba%ba%e5%b7%a5%e6%99%ba%e6%85%a7%e4%b8%96%e4%bb%a3%e7%9a%84%e5%8b%9d%e5%87%ba%e4%b9%8b%e9%81%93/
#Platform #AI #Businessmodel #OperatingModel. #人工智慧 #平台策略