人類語言雖然有各種型態,但終歸是「人」的語言。許多語言學家從人的基本發聲生理系統指出了語言發音的規則,亦有專家從大腦神經結構的角度出發,探討人類語言形式的腦部科學基礎。
這篇來自【The News Lens關鍵評論】 上轉載自《科學人雜誌》的文章,介紹了語言家的最新研究,讓我們看到許多有趣的例證均指出「語言多樣,卻隱藏普遍性規律」。
----------------------------
最近發表在《科學進展》(Science Advances)的一個研究發現,正是「語言多樣,卻隱藏普遍性規律」的新例證,結果令人意想不到,而且可以知道腦的認知能量在語言資訊傳遞速率上所扮演的角色。
如眾所周知,義大利人說話很快,平均一秒鐘說九個音節,德國人說話就比較慢,一秒鐘只能說五到六個音節。那從表象看,義大利人大腦每秒鐘接收的訊息量,是否會比德國人多呢?
非也,非也。答案是:兩者一樣多,都是39個位元(bit)。
法國里昂大學的裴洛葛瑞諾(Francois Pellegrino)教授和他的同事找來17個不同語言、各10位母語者,請他們朗讀15篇相同文本,再從這17個不同語言的文本朗讀錄音中,以資訊傳輸的計算方法,算出擁有643個不同音節的日語,傳輸密度大概是每一音節有5個位元的訊息,而擁有6949個不同音節的英文,每個音節傳輸的密度就超過7個位元。此外,越語是帶著六個聲調的複雜系統,其每個音節的傳輸密度是8個位元。
看來,音節多寡和語言傳輸速度是有相關的。研究者進一步把傳輸密度乘上每秒鐘發出多少個音節的速率,結果讓他們大吃一驚,17個語言中,無論音節滾動得快(如義大利語)或慢(如德語),每秒鐘所得到的傳輸訊息量都趨近一個常數,即39.15位元。研究者驚喜之餘,不禁大喊:「原來這麼有趣的規律就隱藏在我們眼前,但我們卻視而不見。」
問題是為什麼會有這個常數?答案也許也很簡單──我們腦神經的認知能量就是這麼多。所有語言,不論說得多快、多複雜,都過不了這個理解能力的門檻:39.15位元。也就是說,世界上沒有一個語言能比另一個語言傳遞更多的訊息。
(以上引用網頁原文)
https://www.thenewslens.com/article/135659?fbclid=IwAR1ouNLTFEipBO4w8sJvPNATC1oTh67JD2gU59kkkf07IPDaKBMZUA0J1rM
位元速率計算 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
創新工場王詠剛:做技術和商業之間的造橋人
本文來自科技媒體愛范兒
…………………………………………………………
杜甫在形容李白的時候寫過一句詩“清新庾開府,俊逸鮑參軍”,這位庾開府就是庾信,以詩名和才華著稱的庾信在朝中擔任的卻總多是軍職,比如驃騎大將軍。在《奉和同泰寺浮圖詩》這首詩裡,庾信寫下了名句“畫水流全住,圖雲色半輕”。“半輕”也就成了創新工場 CTO 王詠剛筆名“半輕人”的由來。
和庾信從軍職而顯文名類似,王詠剛可能是 CTO 中對寫作最用心的。
他早年曾在《程序员》雜誌、CSDN 網站等主持技術專欄,還出版過長篇小說《鏡中千年》,國內的科幻雜誌上也能發現不少他的短篇作品。對於大眾而言,王詠剛和創新工場李開復合寫的《人工智慧》科普讀本可能是最知名的。
不過即便他長於寫作,能夠“將軍翔文章之府”,但做 CTO 卻並非“書主踐戎馬之場”這麼簡單。
┃從 Google 工程師到創新工場 CTO
加入創新工場前,從北大畢業的王詠剛在 Google 擔任主任工程師和高級技術經理超過十年。
我們正在使用的 Google 的不少服務他都有參與過,比如 Google 的服務核心桌面搜索,拼音輸入法、產品搜索、知識圖譜,以及交織著人文和技術氣息的 Google 首頁塗鴉(Doodles)。
從職業背景來看,王詠剛做 CTO 完全不是跨界,而是順其自然的職業路徑。唯一的疑問是,為什麼是來到創新工場這樣一家投資機構做 CTO 並成立人工智慧工程院呢?
同為 Googler 的王詠剛在 2016 年接到了李開復的入職邀請,那一年人工智慧行業發生了劃時代的轉捩點事件:人工智慧 AlphaGo 大勝圍棋頂尖高手李世石。
而在更早之前,創新工場就開始了對人工智慧的投資,但是投資人工智慧有著它獨有的特殊性。
王詠剛也表示,自己的職位和職責確實相當特別:唯一一個在投資事業裡,做一個研發團隊,做一個把科研、商業化和投融資三種要素結合起來的架構。
他說:
“這個架構的根本原因在於,技術發展到 AI 時代,給整個技術到商業化的完整邏輯提出了一個特別大的挑戰。”
這個挑戰在於,AI 在和商業結合的時候需要更強的技術輸入,其本質上是一種摸索的過程,並和以往的商業模式不相同。
簡言之,就是 AI 是一種強大的技術力量,但是這種技術往往和商業隔得較遠。這中間的距離,需要一座橋樑。
所以,當時李開復把這個命題交給王詠剛的時候,也就成為了王詠剛篤定地從 Google 離職來到創新工場擔任 CTO 並且從零開始籌建人工智慧工程院的唯一原因,即便王詠剛當時也完全不知道怎麼去搭建這樣的架構“橋樑”。
如今,距離王詠剛拿到命題已經過去三年了。最終,那座“橋”王詠剛建好了嗎?
王詠剛給的答案是:
“我覺得我們 AI 工程院這三年為這個全新的探索開了一個別人都沒有做過的,非常好的開頭。我們用了好幾件事證明這個開頭至少是有意義的、有效率的。”
這幾件事當中的第一件事,就是創新工場作為投資機構,自己做了一個從科研到商業化的創業公司樣板。
2018 年 3 月,創新工場按照自己的邏輯創建了創新奇智公司。在 18 個月的時間裡,這家公司已經發展到 400 人,在全國已經落地10個城市,用人工智慧連接了零售業和製造業,年銷售額數億,估值也在不斷增長。
第二件事是關於人才培養的,創新工場用 DeeCamp 人工智慧訓練營來進行科研人才到商業工程化人才的培訓轉型,這是一個成熟的 AI 人才培養體系。
最後一件事,在這三年的探索過程中,創新工場和王詠剛找到了一些邏輯,能夠快速地去定位到那些科研領域前沿,但是同時又有商業化價值的技術點,然後再用一套方法論把這個技術點變成能夠真實應用的場景、技術、產品或解決方案。
創新工場作為一家投資機構,這個“資”不僅僅是資金,對於方興未艾的人工智慧行業來說,從技術到商業的“方法論”,人工智慧方面的人才,這些資源的重要性,並不亞於單純的資金投入。
┃堅信人工智慧的長期價值
做出了 AlphaGo 的 DeepMind 團隊曾讓人工智慧從晦澀艱深的技術名詞,變成了全民熱議的社會話題。
不過盛名之下,背靠 Google 的 DeepMind 團隊卻虧損嚴重。
對於這種落差,王詠剛說:
“AI 離錢非常近,但問題在於只搞科研的 AI 團隊離錢非常遠,這兩句話是不矛盾的。”
他在深入考察一些 AI 應用的商業機會後有一個非常大的感觸,那就是“我們有一個特別重要的責任去把 AI 應用到那些場景中去”。“那些場景”是指重複性的、艱苦的重複勞動場景,這類場景廣泛地存在於製造業、農業等許多行業中。
但一旦涉及到和真實世界的行為或人的思想、人的決策相關的領域,今天的 AI 顯得提升空間更大。
比如,如今還沒有看到任何一個機器人能夠在家中幫忙做複合型的家務,或者和人流暢交流。而在智慧製造或者智慧治療中,能發揮作用的 AI 往往是解決單點問題,而不是能完整執行感知、決策、規劃和控制等整套邏輯的 AI。
線上線下兩種場景裡面,AI 的表現有天壤之別,但這並不意味著這裡有樂觀派和悲觀派的區隔。
正如《論持久戰》對速勝派和滅亡派的批駁一樣,王詠剛也做好了長期耕耘的準備:
“我覺得這件事情(AI 改變現實世界)有可能挺慢的,要長期在每個行業裡去深耕發展,而且長期地去伴隨著 AI 技術不斷一個點一個點突破,在這個漫長的過程中,我們是願意打一個持久戰。”
王詠剛和創新工場願意參與到這場持久戰去,不僅做投資,還自己創立人工智慧企業探索商業化,甚至還建立人工智慧工程院進行基礎和前沿方面的研究。
創新工場人工智慧工程院的醫療團隊正在做一些稱得上“前無古人”的事情,比如他們正在研究類似阿爾茨海默症(老年癡呆)相關的輔助 AI 量化工具和治療工具,目前在這項前沿研究中處於領先的位置。
本質上講,創新工場在人工智慧領域的全方位投入,是出於對人工智慧長期價值的看好。
之所以堅定地看好人工智慧的長期價值,王詠剛分享了自己的兩個理由,一是大量的重複繁重的人工勞動確實應該被人工智慧和機器所取代。
第二點則更為重要,目前更多產業資源存在嚴重的區域不均衡,最典型的就是醫療資源,一定程度上, AI 能夠解決這種資源分佈不均的問題。
“讓同樣一個產業在不同的地方、不同的資源情況下能夠達到同樣的發展水準,創造更大的市場、更多的科技發展機會、更高的人類幸福指數,我覺得是一個非常值得想像和期待的事情。”
▌智慧需要實現虛擬和現實的跨界
因為職業和履歷的原因,王詠剛很容易被貼上“理工男”的標籤,不過這位熱愛文學,熟稔古詩和平水韻,喜歡看《布達佩斯大飯店》的人並不喜歡被貼上這樣的標籤,畢竟像他這樣能夠寫下 AI 程式,讓程式生成小說對話,並在對話中尋找浪漫意味的人,少之又少。
王詠剛曾經給科幻作家陳楸帆的科幻小說集《人生演算法》寫過一篇序言,題為《人類最後一個獨立寫作的紀元》,在這篇文章裡面,他提出了一個很有趣的觀點:
“人工智慧的誕生,是人類有史以來第一次,也很可能是最後一次,人類能夠與一種異于自身的智慧形式進行有效交流,甚至攜手創造全新的文藝內容。”
和大部分科幻作家不同,文理兼修的王詠剛有能力去實踐自己的觀點。在《恐懼機器》這篇小說裡,他和陳楸帆還一起玩了一次 AI 遊戲:小說中一位名為分裂者的角色的對話,都是由 AI 生成的。
其中一句“重重追逐著人類發現的觸覺,以及即將看清左右的囚籠”深得王詠剛喜歡,他認為這句話有朦朧詩派的意味。
人類和 AI 之間,不僅僅是棋盤兩側的對弈,也有意味深長的協同創作。
如果說和 AI 一起寫小說是一次遊戲的話,那麼 AI 賦能各個領域的發展,啟迪人類更深入探索的例子也是不斷湧現。比如在醫藥研發領域,AI 也能夠通過模型,説明人類在巨大的空間領域裡找到針對疾病“靶點”的特定分子結構。
實際上,王詠剛正在做的事情可以概括為“打通邊界”,不論是在技術和人文融合,還是理性和感性平衡的維度上:
“當人類通過掌握技術原理去不斷地構建,創造和升級的時候,例如教會電腦下圍棋,製造商品,行銷售賣等,就顯示出了理性的力量、邏輯的力量。我們通過認識世界去改造世界的過程是非常讓人享受的,也是超級美好的。”
在以往,天氣預報是一項計算量極其巨大的工作,需要動用超算,基於模型來進行運算,從而推出天氣預報的結果。而在 DeeCamp 人工智慧訓練營裡,有學生群體就能“跨界”利用機器學習的方法,拿著氣象部門給到的氣象資料進行天氣預報,很多預測甚至比傳統方法要好。
在 5G 時代到來之後,5G 和 AI 的無界融合也成為了新的命題,王詠剛看到了更多的可能性:
“今天 AI 有大量的事情需要做邊緣運算,5G 就提供了大量的可以把邊緣上的原始大容量的資料直接傳到一個中心節點,在中心節點進行大量運算的機會,這些事情可以改變很多對 AI 架構的思考,對 AI 去部署一個系統、部署一個產品時候的思考。”
在手機這個載體上,5G 和 AI 終將共存,無論是晶片提供的終端側 AI 算力,還是 5G 網路接入雲端算力,無不是為了更好地進行連接。在以往,手機只能短信電話,傳遞虛擬的資訊,而現在,虛擬資訊的位元速率越來越高,甚至還能叫來外賣和計程車。
再往後,王詠剛認為,手機和人之間在未來或許會存在著一種終極無界的狀態:
“當手機變成一個隱形的東西,甚至不存在這樣的東西,它只是衣服裡面縫的一些晶片,只是你眼睛上的某些攝像頭而已。這個時候,我們也不會去討論人和手機的關係了。”
王詠剛對未來的判讀似乎是一道充滿科幻電影意味的命題——很多界限將被打破,因為在每一個具體的商業領域都會大量地嘗試前沿技術,大膽地去利用新思想去解決今天在某些領域遇到的發展緩慢、停滯不前的問題;可是,一旦技術突破之後,會發展到什麼程度,能與我們人類期待的生活之間產生什麼關係呢?
“一旦到達那樣的邊界,那這個世界會變得更有意思吧!”
位元速率計算 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
TrendForce 發布 2020 年 10 大科技趨勢
作者 TechNews | 發布日期 2019 年 10 月 02 日 14:40 |
全球市場研究機構 TrendForce 針對 2020 年科技產業發展,整理 10 大科技趨勢,內容請見下文。
AI、5G、車用三箭頭,帶動半導體產業逆勢成長
2019 年在中美貿易戰影響下,全球半導體產業呈現衰退。展望 2020 年,儘管市場仍存在不確定性,但在 5G、AI、車用等需求挹注下,將帶動半導體產業逐漸脫離谷底。IC 設計業者將導入新一代矽智財、強化 ASIC 與晶片客製化能力,並加速在 7 奈米 EUV 與 5 奈米的應用。在製造方面,7 奈米節點的採用率增加,5 奈米量產及 3 奈米研發的時程更加明朗,先進製程製造的占比將進一步提升。此外,化合物半導體材料如 SiC、GaN 與 GaAs 等,具備耐高電壓、低阻抗與切換速度快等特性,適合用於功率半導體、射頻開關元件等領域,在 5G、電動車等應用備受重視。最後,由於晶片線寬微縮及運算效能提升,使先進封裝技術逐漸朝向 SiP(系統級封裝)方向發展;相較於 SoC(系統單晶片),SiP 的組成結構更靈活且具成本優勢,更能符合 AI、5G 與車用等晶片的發展需求。
DRAM 往 EUV 與下世代 DDR5 / LPDDR5 邁進,NAND 突破 100 層疊堆技術
現有 DRAM 面臨摩爾定律已達物理極限的挑戰,製程已來到 1X / 1Y / 1Znm,進一步微縮不僅無法帶來大量的供給位元成長,反而成本降低的難度提升。DRAM 廠目前在 1Y 與 1Znm 製程將開始將單顆晶片顆粒的容量由現有主流 8Gb 提升至 16Gb,使得高容量模組的滲透率逐漸升高,並且有機會在 1Znm 開始導入 EUV 機台,逐漸取代現有的 double patterning 技術。以 DRAM 的世代轉換來說,DDR5 與 LPDDR5 將在 2020 年問世,進行導入與樣本驗證,相較於現有的 DDR4 / LPDDR4X 來說,將會更省電、速度更快。
NAND Flash 市場將首次挑戰突破 100 層的疊堆技術,並將單一晶片容量從 512Gb 提升至 1Tb 門檻。主要為因應 5G、AI、邊緣運算等持續發展,除了智慧型手機、伺服器/ 資料中心需要更大的儲存容量外,更要求單一儲存裝置的體積進一步微縮。除了 NAND Flash 晶片的進化,智慧型手機上儲存介面也會從現有 UFS 2.1 規格,升級至更快速的 UFS 3.X 版本。在伺服器 / 資料中心方面,SSD 產品也會導入比 PCIe G3 速度與效能快 1 倍的 PCIe G4 介面。兩樣新產品明年將鎖定高階市場。
5G 商用服務範圍擴大,更多硬體終端問世
2020 年全球通訊產業發展重點仍為 5G,不論晶片大廠高通、海思、三星與聯發科等,亦或設備商華為、Ericsson 與 Nokia 等將推出各種 5G 解決方案搶攻市場。在網路架構發展上以獨立(Standalone,SA)5G 技術為主,包括 5G NR 設備和核心網路需求提升。SA 網路強調無線網、核心網和回程鏈路架構,支援網路切片、邊緣計算等,在上行速率、網路時延、連接數量均符合 5G 規範性能。另外,隨著 2020 年上半年 R16 標準逐步完成,各國電信營運商規劃 5G 網路除在人口密集大城市外,也會擴大服務範圍商用,預計將看到更多 5G 終端或無線基地台等產品問世。
全球 5G 手機滲透率有望突破 15%,中國廠商市占逾半
2020 年智慧型手機的外觀設計重點仍圍繞在極致全螢幕,進而拉升螢幕下指紋辨識搭載比例提高、螢幕兩側彎曲角度加大,以及螢幕下鏡頭的開發。此外,記憶體容量規格提高,以及持續優化鏡頭功能,包含多個後鏡頭、高畫素等,也是開發重點。至於 5G 手機的發展,隨著品牌廠積極研發,以及中國政府推動 5G 商轉,明年 5G 手機的滲透率有機會從今年不到 1%,一躍至 15% 以上,而中國品牌的 5G 手機生產總量預計將取得過半市占。然而 5G 通訊基地台的布建進度、電信營運商的資費方案以及 5G 手機終端定價才是決定 5G 手機是否能吸引消費者購機的關鍵。
高刷新率手機面板需求看增,平板成為 Mini LED 與 OLED 新戰場
在手機面板方面,目前 OLED 或 LCD 面板的規格已經能滿足各類消費者的需求,然而伴隨著 5G 布建展開,其高傳輸效率與低延遲的特性,除了改善手機內容的動態表現,也開創手機在 AR 等其他領域的應用,帶動 90Hz 甚或是 120Hz 面板的需求。
另外,以最熱門的電競應用來看,除了既有的高刷新頻率面板,透過 Mini LED 背光增強對比表現的更高階產品,量產的條件也越來越充裕。而在採用 LCD 多年後,市場也傳出 2020 年的 iPad 可能同步推出採用 Mini LED 背光與 OLED 這類增強畫質表現的面板技術,讓平板成為 OLED 與 Mini LED 另一個發展契機。
顯示器產業供過於求,Micro LED 開創新藍海
從 Micro LED 自發光顯示器進展來看,越來越多面板廠商推出玻璃背板的 Micro LED 方案,但由於良率問題,目前模組最大做到 12 吋,更大尺寸的顯示器則是透過玻璃拼接的方式實現。儘管短期內 Micro LED 的成本仍居高不下,但由於 Micro LED 搭配巨量轉移技術可以結合不同的顯示背板,創造出透明、投影、彎曲、柔性等顯示效果,未來將有機會在供過於求的顯示器產業當中,創造出全新的藍海市場。例如,若結合可摺疊顯示螢幕方案,Micro LED 因為材料結構強健,不需要很多保護層,也不需要偏光處理,或許是一個適合切入的領域。
TOF 方案的 3D 感測模組搭載率提升,有利未來 AR 應用發展
相較於結構光,TOF(Time of Flight)技術門檻較低,且供應商較多元,因此 TOF 模組成為手機後置多鏡頭的選項之一。雖然 2020 年 3D 感測並沒有明顯的新應用出現,但預計會有更多品牌廠商願意增加搭載 TOF 模組的機種,帶動 TOF 的 3D 感測模組在智慧型手機的普及度逐步提高。而隨著 iPhone 在內的智慧型手機開始搭載 TOF 模組,透過提供更精準的 3D 感測和影像定位,強化 AR 效果,將提高消費者使用 AR 應用的動機,並吸引更多開發商推出更多 AR 應用程式,進一步提升對 3D 感測模組的需求。
感測能力與演算法成為物聯網加值關鍵
隨著技術與基礎建設日漸完備,2019 年物聯網在各層面多已邁入商業驗證階段,帶來投資效益。2020 年物聯網在各垂直應用領域將向下扎根,已打底的製造、零售業等持續透過技術以優化流程與加值服務,農業、醫療等也將有更廣泛的產業轉型。在技術方面,將著重於提升感測能力,使其能進行五感偵測並對周遭環境做出更多反應,以及 AI 演算法的突破以進行更多深度學習。此外,物聯網裝置連結數的上升造就大量數據,邊緣運算與 AI 於終端設備之整合將是可期未來,進而帶動軟硬體升級商機。
自動駕駛將落實終端應用,探索更多商業模式
2020 年自動駕駛技術的商業化,以商用車、特定行駛路線和區域性特殊應用為 3 個主要的特色,並且多數鎖定在 SAE Level 4 自駕等級。能在 2020 年看到更多量、更多類型的自動駕駛商用案例,其中一項驅動因素來自各類平台化產品,如 NVIDIA Drive 運用 AI 人工智慧技術的自駕車開發平台,以及百度 Apollo 開放平台提供不同自駕場景的解決方案等,都協助車廠及各級開發商加速將自駕技術落實於產品中。然而,自駕技術的開發成本高,車廠或技術開發商需要找出更多自駕技術的可能性,並且必須可獲利、優化成本和改善問題,因此找到能滿足該可能性的商業模式也是 2020 年的重點。
太陽能模組產品標準化已成歷史,終端產品選擇將優先考量發電性價比
太陽能技術發展不斷更新,2018 年及之前的模組皆為標準 60 片或者 72 片版型排列,電池片也都以完整尺寸呈現。而 2019 年電池片的版型改變與模組端的微型技術發展多樣化,包含半片、拼片、疊片(瓦)、多柵線、雙玻、雙面(電池)模組等多樣技術疊加運用,使得最終模組產品的輸出功率相較於 2018 年增加一到兩個檔次(bin)。然而,模組產品的核心競爭力取決於度電成本。要降低度電成本,就要提升電池效率與模組功率,以創造更大發電量並確保產品長期的可靠性。未來市場產品定價的話語權將不再由製造端掌握,而是以市場需求及買方接受度為依歸。
資料來源:https://technews.tw/2019/10/02/trendforce-releases-2020-top-10-technology-trends/