加速了十年的世界(上)
英國政壇怪俠George Galloway曾說:
「有可能幾十年都沒事,
接著幾星期內就過完了幾十年。」
前陣子的疫情三級警戒
讓大家的生活步調都出現巨大的變化,
待在家的時間比正常情況多,
經歷平常無暇注意或體會的事(不論好壞)
所以大部分的人感覺都是步調慢了下來,
但與此同時,世界的變化卻在飛快的加速,
幾個月的時間內,許多現象都加速了十年,
幾乎完成了一個世代的轉化。
這就是疫情開始之後,
世界趨勢變化的寫照。
《疫後大未來:誰是大贏家?》
這本書的作者Scott Galloway,
(跟前文提到的的Galloway不是親戚)
是紐約大學史登商學院行銷學教授,
是連續創業家,曾創辦過九家公司,
也是另外兩本暢銷書《四騎士主宰的未來》與《世界並不仁慈,但也不會虧待你》的作者。
我很喜歡他立場鮮明、商業實戰經驗豐富、
帶有一點點世故的自大、直爽的風格,
他的書中可以看到很明確直白的論點。
當然,立場人人不同,
他以身在美國的視角出發,
但我相信身在台灣的我們,
一樣可從書中的分析得到很多想法。
跟大家分享幾個我覺得有趣的論點:
一、大加速
二、強者恆強
三、現金為王
四、大分散
五、品牌時代讓位給產品時代
六、紅與藍
七、四巨頭
八、破壞性創新
美國科技巨頭們對全球的巨大影響力,
已經成為我們生活中的現實。
(以前看小說或是動漫,
都曾經看到未來的世界是由企業統治,
從我們現在生活的狀態來看,
這些想像似乎成了神準的預言)
在疫情開始之後,
這些企業對世界的影響甚至有增無減,
作者在書中有很多針對這個現象的探討
身為一個連續創業家,
他有跟這些巨頭們交手的經驗,
所以分享的經驗都是活生生的,
而不是象牙塔裡那種學者氣息與口吻。
接下來我們一起看看上述的論點
一、大加速:
「這場流行疫情影響最深遠的衝擊,是它將
扮演一個加速劑;它會啟動一些變化並改
變一些趨勢方向,不過在此同時,疫情的
主要影響是加速已經存於社會的動力」
加速聽起來很厲害,但值得注意的是,
這個加速的狀態並非對所有人事物都友善,
而是對之前正在成形的社會/商業轉變、
社會趨勢發展中強大的力量、
相對強勢的族群,
帶來更好、更多、更大的推動力量。
但是,
「負面趨勢可能以更高的速率加速」
「每個危機必然存在機會;危機更大、更具
破壞性,機會也就更大。…許多因疫情而
加速的趨勢是負面的,削弱我們在『後疫
時代』復原和發展的能力。」
各種型態的不平等,
包括教育、企業競爭、貧富差距...等,
在這段時間更明顯的被曝露出來。
以工作機會來說,
Covid-19帶來衝擊的前三個月,
美國失去的工作機會(13%)
比起大蕭條時期兩年所失去的(5%)更多,
美國用過去十年創造出兩千萬個工作機會,
卻在十個星期內摧毀四千萬個工作。
而且收入低於四萬美元的家庭受創最嚴重—
2020四月有近40%遭解僱或休無薪假;
相較之下收入超過十萬美元的家庭,
失業的比例只有13%。
為什麼會有這樣的落差?
因為疫情封城或是提高警戒的情況下,
能夠遠距離的工作都是中高端的工作。
有60%超過十萬美元的工作可以在家完成:
相較之下,
只有10%不到四萬美元的工作可以在家進行,
低收入工作者被資遣或放無薪假的機率,
是較高收入工作者的將近四倍。
遠距工作所帶來的好處,
流向原本就過得比較好的那些人。
另外的例子是零售業的變化。
在美國,二○二○年初,
大約有16%的零售業是透過數位管道交易。
二○二○年三月到四月中旬,
疫情出現後的八個星期,這個數字跳增到27%,
而且沒有退潮的跡象。
而且看得更深入,
會發現一個驚人的現象:
電子商務在零售業的比例,
從2000年扎根後大約每年成長1%,
而從2009年到2020年初這十年,
也才成長了10%,
但2020年的短短八個星期就成長了11%!
這就是大加速,幾個星期內,
十年的發展就完成了。
二、強者恆強(汰弱留強的無情殺戮)
蘋果公司花了四十二年的時間達到一兆美元的市值,然後只花了二十個星期從一兆美元加速到達二兆美元(2020年三月到八月)。
同樣在這幾個星期內,特斯拉(Tesla)不只成為全世界最有價值的汽車公司,甚至還比Toyota、Volkswagan、Daimler,以及Honda等公司的總和還有價值。
至於資本市場,在2020疫情爆發期間,
美國股市先是經歷一波巨大的跌幅
(2020年2月下跌到3月低點,
大約下跌了40%),
但隨後也上演一波大反彈,
乍看之下會覺得這是全球最強大市場所展現的韌性,但事實上,這是一幕強者更強的戲,
所謂的「復甦」是少數公司超乎尋常的獲利所造成,特別是科技業巨頭和一些市場的重要參與者,而沒有反映在更廣泛的公開市場上。
我們把公司規模分開來看,2020年1月1日到2020年7月31日,S&P500指數(美國五百大上市公司)維持年度的正成長,
但是中型股下跌了10%,
S&P600小型股指數則衰退15%,
而受創最深的「BEACH」產業—預定(booking)、娛樂(Entertainment)、航空(Airlines)、遊輪(Cruises)、賭場、飯店與休憩(Casinos, Hotel, and Resorts),在這段時日內股價平均下跌50-70%...
媒體被大型科技公司和大型股指數閃亮亮的表現所吸引,
但是,一場汰弱留強的無情殺戮正悄悄進行。
很多過去知名的品牌都在這一波宣佈破產:
服裝品牌J.Crew、Brooks Brothers、True Religion;赫茲租車(Hertz);連鎖健身品牌Gold’s Gym、24 Hour Fitness;健身營養品公司GNC;高級食材超市Dean & DeLuca…名單還有一長串,這真的是會讓人下巴掉下來的名單,因為太多我們認識的百年老店知名品牌,就這樣在疫情期間默默的「確診死亡」,
但是這些企業新聞並沒有引起太多波瀾,
因為大型科技公司的發展吸引了大家的眼球。
針對強者恆強、弱者加速淘汰這樣的狀況,
作者在書裡提到一個務實卻也很心碎的思維:「如果品牌是你最強大的資產,但企業已陷入結構性的衰退,那就該認具思考在企業消亡前充分榨取品牌的利益。儘管我們盡可能把品牌人性化,不過品牌終究不是人—它們是要被變現的資產。一個品牌在消亡之前,沒有把握它的黃金歲月充分利用它的價值,才是唯一的罪過。」
三、現金為王(淘汰賽中存活的關鍵之一)
一家公司的價值是由它提供的「數字」(財務報表、營收獲利...等)和它的「敘事」(在大眾之間傳遞的公司文化、公司歷史,使命...等故事)所呈現的結果。
「目前看來,規模大小給一家公司提供的敘事不
只是能否度過危機,而是它在後疫時代能否蓬
勃發展。擁有現金、擁有債務擔保、擁有高價
值股票的公司,將可以接收陷入困境的競爭對
手的資產,鞏固在市場上的有利位置。
疫情同時也助長「創新」的敘事。被視為創新
者的公司所獲得的估值,反映的將是十年之後
估的現金流,並且以難以想像的低利率折現。
這正是特斯拉的市值如今超越豐田、福斯、戴
姆勒、本田總和的原因所在。儘管,事實上特
斯拉在2020年大約生產四十萬部車,其他四家
汽車公司總共打造出兩千六百萬部車。」
當市場決定亞馬遜、特斯拉、以及其他被看好的公司(也就是市場上的科技巨頭們)是贏家,市場就會降低這些公司的資金成本(讓他們可以更容易而且用更好的條件拿到他們要的錢),增加它們的補償價值(透過股票選擇權),並調升它們獲取本身無法自行建構的東西的能力。
而且,如今有多到難以想像的資金在尋找標的。(低利率、政府振興經濟方案這些寬鬆政策讓市場上有滿滿的錢想要找到好的投資方案或是公司,想當然的這些市場寵兒會是優先被選擇的對象)疫情衝擊之前表現良好的公司,在這場全球危機中將得到驚人的獲利。
過去十年,市場判定一家公司價值的標準,已經用願景和成長取代獲利(舉例:Amazon、Tesla、Netfix…沒賺錢但股價市值卻仍然衝天)。不過在疫情流行期間,畢竟現金是王,成本結構則是新的血氧值,誰有更多現金,就站在更好的長期戰略地位上。(舉例:Costco可望在零售業逆勢攀升,其中一個理由是它坐擁110億美元的銀行帳戶;嬌生公司(Johnson & Johnson)有近200億美元,它的地位也穩如泰山),因為手上有大量現金的企業,可以在競爭對手關門之後,好好挑選它們要變賣的資產跟留下來的客戶,因此在每個產業類別,權力都將更集中於資產負債表最搶眼的二或三家公司。
「如果你的公司收支平衡不良,那現在已經無力為繼;如果你從事的是必需品零售業,那麼你的產品比過去更必需了;如果你在可選擇性零售業,你的產品比過去更顯得可有可無。」
後疫時代損失最慘重的將是有眾多員工、但帳面成績不良的大型公司。比如傳統零售業,如果無法創新並吸引更年輕、更常在線上消費的族群,疫情期間無非雪上加霜。
而餐飲業,特別是餐廳,也面臨艱困的挑戰,因為有大額的固定開支(房租),而且幾乎無能為力改變現況(房東降租是佛心,不降租也無計可施),再加上沒有緩衝的資金可以幫忙度過艱困時刻(大部分餐廳手上保留可以週轉的資金都不高)。紐約時報曾在一篇採訪餐飲界名人張錫鎬(David Chang,在全球有數間餐廳,同時也是Netflix紀錄節目《美食不美》(Ugly Delicious)的主持人)的文章中提到,疫情過後,餐廳或服務業可能消失,「如果政府沒有介入協助,未來服務業將不存在。」儘管當時的政府有與餐飲業代表商談援助計畫,但代表一字排開都是大型連鎖餐飲業者,很可能疫情下能生存的只有連鎖餐廳,David提到其它中小型餐廳時明顯的表現出擔憂。當然,還是有很多具有特色與知名度的餐廳可以生存下來(至少目前為止仍在苦撐),但是餐飲業的變化與整合,已經是進行中的必然,這個產業當然會繼續存在,但是過去很多獨立經營的個性化小店,很可能撐不過這一波衝擊紛紛停業。運動休閒產業也是如此。
很多台灣的餐廳、健身房、個人運動工作室…等等,在三級警戒期間也是一路苦撐,最近陸續聽到自已認識的品牌要結束營業真的很心酸,而且雖然解封了,很多店家其實還沒止血,只是流血流得比較慢而已…即使現在已經陸續補充疫苗供民眾預約施打,但要能恢復到疫情前一切「正常」的生活,依然是無法預測且非常緩慢的過程。
其他的,下次繼續跟大家分享
#jeffmachine #puma #pumataiwan #pumaeveryday #postcovid #faang #大加速
同時也有1部Youtube影片,追蹤數超過0的網紅大頭阿伯,也在其Youtube影片中提到,今天來讓大家的NS 網路變成 TYPE A 主要以中華電信設定為講解 簡單幾步驟如下 把小烏龜以 p880 為例子看一下底部 會有一個串 mac-address. 把第一行的後4碼抄下來,英文大寫轉小寫, 前面加上 p880 如果後4碼是x1ep ,那組合即p880x1ep 而您只要帳號輸入...
速率例子 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
摩爾定律放緩 靠啥提升AI晶片運算力?
作者 : 黃燁鋒,EE Times China
2021-07-26
對於電子科技革命的即將終結的說法,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有的,但這波革命始終也沒有結束。AI技術本質上仍然是第三次科技革命的延續……
人工智慧(AI)的技術發展,被很多人形容為第四次科技革命。前三次科技革命,分別是蒸汽、電氣、資訊技術(電子科技)革命。彷彿這“第四次”有很多種說辭,比如有人說第四次科技革命是生物技術革命,還有人說是量子技術革命。但既然AI也是第四次科技革命之一的候選技術,而且作為資訊技術的組成部分,卻又獨立於資訊技術,即表示它有獨到之處。
電子科技革命的即將終結,一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續,也就意味著資訊技術的整棟大樓建造都將出現停滯,那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有,但這波革命始終也沒有結束。
AI技術本質上仍然是第三次科技革命的延續,它的發展也依託於幾十年來半導體科技的進步。這些年出現了不少專門的AI晶片——而且市場參與者相眾多。當某一個類別的技術發展到出現一種專門的處理器為之服務的程度,那麼這個領域自然就不可小覷,就像當年GPU出現專門為圖形運算服務一樣。
所以AI晶片被形容為CPU、GPU之後的第三大類電腦處理器。AI專用處理器的出現,很大程度上也是因為摩爾定律的發展進入緩慢期:電晶體的尺寸縮減速度,已經無法滿足需求,所以就必須有某種專用架構(DSA)出現,以快速提升晶片效率,也才有了專門的AI晶片。
另一方面,摩爾定律的延緩也成為AI晶片發展的桎梏。在摩爾定律和登納德縮放比例定律(Dennard Scaling)發展的前期,電晶體製程進步為晶片帶來了相當大的助益,那是「happy scaling down」的時代——CPU、GPU都是這個時代受益,不過Dennard Scaling早在45nm時期就失效了。
AI晶片作為第三大類處理器,在這波發展中沒有趕上happy scaling down的好時機。與此同時,AI應用對運算力的需求越來越貪婪。今年WAIC晶片論壇圓桌討論環節,燧原科技創始人暨CEO趙立東說:「現在訓練的GPT-3模型有1750億參數,接近人腦神經元數量,我以為這是最大的模型了,要千張Nvidia的GPU卡才能做。談到AI運算力需求、模型大小的問題,說最大模型超過萬億參數,又是10倍。」
英特爾(Intel)研究院副總裁、中國研究院院長宋繼強說:「前兩年用GPU訓練一個大規模的深度學習模型,其碳排放量相當於5台美式車整個生命週期產生的碳排量。」這也說明了AI運算力需求的貪婪,以及提供運算力的AI晶片不夠高效。
不過作為產業的底層驅動力,半導體製造技術仍源源不斷地為AI發展提供推力。本文將討論WAIC晶片論壇上聽到,針對這個問題的一些前瞻性解決方案——有些已經實現,有些則可能有待時代驗證。
XPU、摩爾定律和異質整合
「電腦產業中的貝爾定律,是說能效每提高1,000倍,就會衍生出一種新的運算形態。」中科院院士劉明在論壇上說,「若每瓦功耗只能支撐1KOPS的運算,當時的這種運算形態是超算;到了智慧型手機時代,能效就提高到每瓦1TOPS;未來的智慧終端我們要達到每瓦1POPS。 這對IC提出了非常高的要求,如果依然沿著CMOS這條路去走,當然可以,但會比較艱辛。」
針對性能和效率提升,除了尺寸微縮,半導體產業比較常見的思路是電晶體結構、晶片結構、材料等方面的最佳化,以及處理架構的革新。
(1)AI晶片本身其實就是對處理器架構的革新,從運算架構的層面來看,針對不同的應用方向造不同架構的處理器是常規,更專用的處理器能促成效率和性能的成倍增長,而不需要依賴於電晶體尺寸的微縮。比如GPU、神經網路處理器(NPU,即AI處理器),乃至更專用的ASIC出現,都是這類思路。
CPU、GPU、NPU、FPGA等不同類型的晶片各司其職,Intel這兩年一直在推行所謂的「XPU」策略就是用不同類型的處理器去做不同的事情,「整合起來各取所需,用組合拳會好過用一種武器去解決所有問題。」宋繼強說。Intel的晶片產品就涵蓋了幾個大類,Core CPU、Xe GPU,以及透過收購獲得的AI晶片Habana等。
另外針對不同類型的晶片,可能還有更具體的最佳化方案。如當代CPU普遍加入AVX512指令,本質上是特別針對深度學習做加強。「專用」的不一定是處理器,也可以是處理器內的某些特定單元,甚至固定功能單元,就好像GPU中加入專用的光線追蹤單元一樣,這是當代處理器普遍都在做的一件事。
(2)從電晶體、晶片結構層面來看,電晶體的尺寸現在仍然在縮減過程中,只不過縮減幅度相比過去變小了——而且為緩解電晶體性能的下降,需要有各種不同的技術來輔助尺寸變小。比如說在22nm節點之後,電晶體變為FinFET結構,在3nm之後,電晶體即將演變為Gate All Around FET結構。最終會演化為互補FET (CFET),其本質都是電晶體本身充分利用Z軸,來實現微縮性能的提升。
劉明認為,「除了基礎元件的變革,IC現在的發展還是比較多元化,包括新材料的引進、元件結構革新,也包括微影技術。長期賴以微縮的基本手段,現在也在發生巨大的變化,特別是未來3D的異質整合。這些多元技術的協同發展,都為晶片整體性能提升帶來了很好的增益。」
他並指出,「從電晶體級、到晶圓級,再到晶片堆疊、引線接合(lead bonding),精準度從毫米向奈米演進,互連密度大大提升。」從晶圓/裸晶的層面來看,則是眾所周知的朝more than moore’s law這樣的路線發展,比如把兩片裸晶疊起來。現在很熱門的chiplet技術就是比較典型的並不依賴於傳統電晶體尺寸微縮,來彈性擴展性能的方案。
台積電和Intel這兩年都在大推將不同類型的裸晶,異質整合的技術。2.5D封裝方案典型如台積電的CoWoS,Intel的EMIB,而在3D堆疊上,Intel的Core LakeField晶片就是用3D Foveros方案,將不同的裸晶疊在一起,甚至可以實現兩片運算裸晶的堆疊、互連。
之前的文章也提到過AMD剛發佈的3D V-Cache,將CPU的L3 cache裸晶疊在運算裸晶上方,將處理器的L3 cache大小增大至192MB,對儲存敏感延遲應用的性能提升。相比Intel,台積電這項技術的獨特之處在於裸晶間是以混合接合(hybrid bonding)的方式互連,而不是micro-bump,做到更小的打線間距,以及晶片之間數十倍通訊性能和效率提升。
這些方案也不直接依賴傳統的電晶體微縮方案。這裡實際上還有一個方面,即新材料的導入專家們沒有在論壇上多說,本文也略過不談。
1,000倍的性能提升
劉明談到,當電晶體微縮的空間沒有那麼大的時候,產業界傾向於採用新的策略來評價技術——「PPACt」——即Powe r(功耗)、Performance (性能)、Cost/Area-Time (成本/面積-時間)。t指的具體是time-to-market,理論上應該也屬於成本的一部分。
電晶體微縮方案失效以後,「多元化的技術變革,依然會讓IC性能得到進一步的提升。」劉明說,「根據預測,這些技術即使不再做尺寸微縮,也會讓IC的晶片性能做到500~1,000倍的提升,到2035年實現Zetta Flops的系統性能水準。且超算的發展還可以一如既往地前進;單裸晶儲存容量變得越來越大,IC依然會為產業發展提供基礎。」
500~1,000倍的預測來自DARPA,感覺有些過於樂觀。因為其中的不少技術存在比較大的邊際遞減效應,而且有更實際的工程問題待解決,比如運算裸晶疊層的散熱問題——即便業界對於這類工程問題的探討也始終在持續。
不過1,000倍的性能提升,的確說明摩爾定律的終結並不能代表第三次科技革命的終結,而且還有相當大的發展空間。尤其本文談的主要是AI晶片,而不是更具通用性的CPU。
矽光、記憶體內運算和神經型態運算
在非傳統發展路線上(以上內容都屬於半導體製造的常規思路),WAIC晶片論壇上宋繼強和劉明都提到了一些頗具代表性的技術方向(雖然這可能與他們自己的業務方向或研究方向有很大的關係)。這些技術可能尚未大規模推廣,或者仍在商業化的極早期。
(1)近記憶體運算和記憶體內運算:處理器性能和效率如今面臨的瓶頸,很大程度並不在單純的運算階段,而在資料傳輸和儲存方面——這也是共識。所以提升資料的傳輸和存取效率,可能是提升整體系統性能時,一個非常靠譜的思路。
這兩年市場上的處理器產品用「近記憶體運算」(near-memory computing)思路的,應該不在少數。所謂的近記憶體運算,就是讓儲存(如cache、memory)單元更靠近運算單元。CPU的多層cache結構(L1、L2、L3),以及電腦處理器cache、記憶體、硬碟這種多層儲存結構是常規。而「近記憶體運算」主要在於究竟有多「近」,cache記憶體有利於隱藏當代電腦架構中延遲和頻寬的局限性。
這兩年在近記憶體運算方面比較有代表性的,一是AMD——比如前文提到3D V-cache增大處理器的cache容量,還有其GPU不僅在裸晶內導入了Infinity Cache這種類似L3 cache的結構,也更早應用了HBM2記憶體方案。這些實踐都表明,儲存方面的革新的確能帶來性能的提升。
另外一個例子則是Graphcore的IPU處理器:IPU的特點之一是在裸晶內堆了相當多的cache資源,cache容量遠大於一般的GPU和AI晶片——也就避免了頻繁的訪問外部儲存資源的操作,極大提升頻寬、降低延遲和功耗。
近記憶體運算的本質仍然是馮紐曼架構(Von Neumann architecture)的延續。「在做處理的過程中,多層級的儲存結構,資料的搬運不僅僅在處理和儲存之間,還在不同的儲存層級之間。這樣頻繁的資料搬運帶來了頻寬延遲、功耗的問題。也就有了我們經常說的運算體系內的儲存牆的問題。」劉明說。
構建非馮(non-von Neumann)架構,把傳統的、以運算為中心的馮氏架構,變換一種新的運算範式。把部分運算力下推到儲存。這便是記憶體內運算(in-memory computing)的概念。
記憶體內運算的就現在看來還是比較新,也有稱其為「存算一體」。通常理解為在記憶體中嵌入演算法,儲存單元本身就有運算能力,理論上消除資料存取的延遲和功耗。記憶體內運算這個概念似乎這在資料爆炸時代格外醒目,畢竟可極大減少海量資料的移動操作。
其實記憶體內運算的概念都還沒有非常明確的定義。現階段它可能的內涵至少涉及到在儲記憶體內部,部分執行資料處理工作;主要應用於神經網路(因為非常契合神經網路的工作方式),以及這類晶片具體的工作方法上,可能更傾向於神經型態運算(neuromorphic computing)。
對於AI晶片而言,記憶體內運算的確是很好的思路。一般的GPU和AI晶片執行AI負載時,有比較頻繁的資料存取操作,這對性能和功耗都有影響。不過記憶體內運算的具體實施方案,在市場上也是五花八門,早期比較具有代表性的Mythic導入了一種矩陣乘的儲存架構,用40nm嵌入式NOR,在儲記憶體內部執行運算,不過替換掉了數位週邊電路,改用類比的方式。在陣列內部進行模擬運算。這家公司之前得到過美國國防部的資金支援。
劉明列舉了近記憶體運算和記憶體內運算兩種方案的例子。其中,近記憶體運算的這個方案應該和AMD的3D V-cache比較類似,把儲存裸晶和運算裸晶疊起來。
劉明指出,「這是我們最近的一個工作,採用hybrid bonding的技術,與矽通孔(TSV)做比較,hybrid bonding功耗是0.8pJ/bit,而TSV是4pJ/bit。延遲方面,hybrid bonding只有0.5ns,而TSV方案是3ns。」台積電在3D堆疊方面的領先優勢其實也體現在hybrid bonding混合鍵合上,前文也提到了它具備更高的互連密度和效率。
另外這套方案還將DRAM刷新頻率提高了一倍,從64ms提高至128ms,以降低功耗。「應對刷新率變慢出現拖尾bit,我們引入RRAM TCAM索引這些tail bits」劉明說。
記憶體內運算方面,「傳統運算是用布林邏輯,一個4位元的乘法需要用到幾百個電晶體,這個過程中需要進行資料來回的移動。記憶體內運算是利用單一元件的歐姆定律來完成一次乘法,然後利用基爾霍夫定律完成列的累加。」劉明表示,「這對於今天深度學習的矩陣乘非常有利。它是原位的運算和儲存,沒有資料搬運。」這是記憶體內運算的常規思路。
「無論是基於SRAM,還是基於新型記憶體,相比近記憶體運算都有明顯優勢,」劉明認為。下圖是記憶體內運算和近記憶體運算,精準度、能效等方面的對比,記憶體內運算架構對於低精準度運算有價值。
下圖則總結了業內主要的一些記憶體內運算研究,在精確度和能效方面的對應關係。劉明表示,「需要高精確度、高運算力的情況下,近記憶體運算目前還是有優勢。不過記憶體內運算是更新的技術,這幾年的進步也非常快。」
去年阿里達摩院發佈2020年十大科技趨勢中,有一個就是存算一體突破AI算力瓶頸。不過記憶體內運算面臨的商用挑戰也一點都不小。記憶體內運算的通常思路都是類比電路的運算方式,這對記憶體、運算單元設計都需要做工程上的考量。與此同時這樣的晶片究竟由誰來造也是個問題:是記憶體廠商,還是數文書處理器廠商?(三星推過記憶體內運算晶片,三星、Intel垂直整合型企業似乎很適合做記憶體內運算…)
(2)神經型態運算:神經型態運算和記憶體內運算一樣,也是新興技術的熱門話題,這項技術有時也叫作compute in memory,可以認為它是記憶體內運算的某種發展方向。神經型態和一般神經網路AI晶片的差異是,這種結構更偏「類人腦」。
進行神經型態研究的企業現在也逐漸變得多起來,劉明也提到了AI晶片「最終的理想是在結構層次模仿腦,元件層次逼近腦,功能層次超越人腦」的「類腦運算」。Intel是比較早關注神經型態運算研究的企業之一。
傳說中的Intel Loihi就是比較典型存算一體的架構,「這片裸晶裡面包含128個小核心,每個核心用於模擬1,024個神經元的運算結構。」宋繼強說,「這樣一塊晶片大概可以類比13萬個神經元。我們做到的是把768個晶片再連起來,構成接近1億神經元的系統,讓學術界的夥伴去試用。」
「它和深度學習加速器相比,沒有任何浮點運算——就像人腦裡面沒有乘加器。所以其學習和訓練方法是採用一種名為spike neutral network的路線,功耗很低,也可以訓練出做視覺辨識、語言辨識和其他種類的模型。」宋繼強認為,不採用同步時脈,「刺激的時候就是一個非同步電動勢,只有工作部分耗電,功耗是現在深度學習加速晶片的千分之一。」
「而且未來我們可以對不同區域做劃分,比如這兒是視覺區、那兒是語言區、那兒是觸覺區,同時進行多模態訓練,互相之間產生關聯。這是現在的深度學習模型無法比擬的。」宋繼強說。這種神經型態運算晶片,似乎也是Intel在XPU方向上探索不同架構運算的方向之一。
(2)微型化矽光:這個技術方向可能在層級上更偏高了一些,不再晶片架構層級,不過仍然值得一提。去年Intel在Labs Day上特別談到了自己在矽光(Silicon Photonics)的一些技術進展。其實矽光技術在連接資料中心的交換機方面,已有應用了,發出資料時,連接埠處會有個收發器把電訊號轉為光訊號,透過光纖來傳輸資料,另一端光訊號再轉為電訊號。不過傳統的光收發器成本都比較高,內部元件數量大,尺寸也就比較大。
Intel在整合化的矽光(IIIV族monolithic的光學整合化方案)方面應該是商業化走在比較前列的,就是把光和電子相關的組成部分高度整合到晶片上,用IC製造技術。未來的光通訊不只是資料中心機架到機架之間,也可以下沉到板級——就跟現在傳統的電I/O一樣。電互連的主要問題是功耗太大,也就是所謂的I/O功耗牆,這是這類微型化矽光元件存在的重要價值。
這其中存在的技術挑戰還是比較多,如做資料的光訊號調變的調變器調變器,據說Intel的技術使其實現了1,000倍的縮小;還有在接收端需要有個探測器(detector)轉換光訊號,用所謂的全矽微環(micro-ring)結構,實現矽對光的檢測能力;波分複用技術實現頻寬倍增,以及把矽光和CMOS晶片做整合等。
Intel認為,把矽光模組與運算資源整合,就能打破必須帶更多I/O接腳做更大尺寸處理器的這種趨勢。矽光能夠實現的是更低的功耗、更大的頻寬、更小的接腳數量和尺寸。在跨處理器、跨伺服器節點之間的資料互動上,這類技術還是頗具前景,Intel此前說目標是實現每根光纖1Tbps的速率,並且能效在1pJ/bit,最遠距離1km,這在非本地傳輸上是很理想的數字。
還有軟體…
除了AI晶片本身,從整個生態的角度,包括AI感知到運算的整個鏈條上的其他組成部分,都有促成性能和效率提升的餘地。比如這兩年Nvidia從軟體層面,針對AI運算的中間層、庫做了大量最佳化。相同的底層硬體,透過軟體最佳化就能實現幾倍的性能提升。
宋繼強說,「我們發現軟體最佳化與否,在同一個硬體上可以達到百倍的性能差距。」這其中的餘量還是比較大。
在AI開發生態上,雖然Nvidia是最具發言權的;但從戰略角度來看,像Intel這種研發CPU、GPU、FPGA、ASIC,甚至還有神經型態運算處理器的企業而言,不同處理器統一開發生態可能更具前瞻性。Intel有個稱oneAPI的軟體平台,用一套API實現不同硬體性能埠的對接。這類策略對廠商的軟體框架構建能力是非常大的考驗——也極大程度關乎底層晶片的執行效率。
在摩爾定律放緩、電晶體尺寸微縮變慢甚至不縮小的前提下,處理器架構革新、異質整合與2.5D/3D封裝技術依然可以達成1,000倍的性能提升;而一些新的技術方向,包括近記憶體運算、記憶體內運算和微型矽光,能夠在資料訪存、傳輸方面產生新的價值;神經型態運算這種類腦運算方式,是實現AI運算的目標;軟體層面的最佳化,也能夠帶動AI性能的成倍增長。所以即便摩爾定律嚴重放緩,AI晶片的性能、效率提升在上面提到的這麼多方案加持下,終將在未來很長一段時間內持續飛越。這第三(四)次科技革命恐怕還很難停歇。
資料來源:https://www.eettaiwan.com/20210726nt61-ai-computing/?fbclid=IwAR3BaorLm9rL2s1ff6cNkL6Z7dK8Q96XulQPzuMQ_Yky9H_EmLsBpjBOsWg
速率例子 在 河西羊的健聲房 Facebook 的最讚貼文
在工作坊時,我會談到麥克風的調音對聽覺的影響,當Bass(低頻)增加時,合適於藝文類的演說;而當Treble(高頻)增加時,則對數理類的教學、演說比較有利。
而在語速上也是有異曲同工的效果,語速的快慢對於藝文類與數理類的理解助益是不同,那麼語速快或慢所受益的內容類別是什麼呢?
我的經驗是語速快對數理類,推論型的內容會有益;而語速慢則對藝文類,包含心靈宗教方面的內容傳遞會有幫助。
這個效果的出現我覺得與大腦處理速度無關,而是處理的狀態。
怎麼說與大腦的處理速度無關呢?
照理來說需要大量推論的數理類內容,大家可能會覺得應該要講慢一點,否則聽眾的思考會有跟不上的問題。相反的藝文心靈類的內容,則可以語速快一點,也不會影響到內容的吸收。
但實際上,若我們放慢語速,似乎大腦會切換模式,變得放鬆、緩慢,邏輯推理的速率會減緩,反而不利於“理解”。而當語速加快時,緊張感反而使大腦進入高速運轉模式,覺察能力上升、警察性提高。
可是即使如此,可能聽眾的大腦運算速度還是跟不上這複雜的數理內容呀!那要怎麼辦呢?
我想這問題並不在語速,而在內容的反覆重申上,有句話說“重要的事要講三次”,但不是叫大家直接覆誦“很重要“、“很重要“、“很重要“,而是相同的內容舉三個例子來強化記憶,或是重覆的三次推論來強化。
在記憶的強化上,重覆才是至高的關鍵因素。
所以,大家不妨試看看在語速上變化看看,看駕馭的了這快與慢的程度為何,也儘可能令自己的語速能快能慢,具有彈性,能適時的切換模式。令聽眾的大腦適時的加速、減速,保持長時間的專注力。
※ 一對一視訊個人課,請私訊
Line ID: joseyang9287
速率例子 在 大頭阿伯 Youtube 的最讚貼文
今天來讓大家的NS 網路變成 TYPE A
主要以中華電信設定為講解
簡單幾步驟如下
把小烏龜以 p880 為例子看一下底部
會有一個串 mac-address.
把第一行的後4碼抄下來,英文大寫轉小寫,
前面加上 p880
如果後4碼是x1ep ,那組合即p880x1ep
而您只要帳號輸入cht ,密碼輸入x1ep 即能再登入
p880後台.
※真的不知道怎樣查看
請聯絡中華電信窗口正常都不會說
登入中華電信路由器
設定靜態IP給NS
設定該靜態IP給DMZ區(一定要設置)
※阿伯講得很爛Orz
若有講錯的地方請各位大大在下方留言歐~~
參考資訊
https://goo.gl/qdpvGW NAT WIKI百科
https://goo.gl/ALvy2v 轉換網速說明
https://goo.gl/JAzbeL 轉換網速說明
https://goo.gl/a5wJTL 網速轉換速率工具
https://goo.gl/mHHztp 中華電信路由器速度上限討論
https://goo.gl/bw42gi 小烏龜帳號密碼
🌈阿伯的遊戲ID🌈
NS: 7226-5771-7800
PSN:soulstormzhang
拍攝器材:I7Plus、GoPro Hero 6 Black
擷取盒:GC550
收音器材:Rode VideoMic,羅技H800 藍芽麥克風
剪接軟體:Adobe Premiere
=======歡迎訂閱追蹤 阿伯=====
動動你的小指頭~
您的訂閱或是跟隨~
對阿伯來說都是一種動力!!
🎉YouTube Channel:https://reurl.cc/zzQK7
🎉訂閱Youtube:https://reurl.cc/Xk2Q7
❤️YouTube LIVE:https://reurl.cc/Q32V5
❤️Twitch:https://www.twitch.tv/joe690811/
❤️FB/大頭阿伯:https://fb.me/BigHeadUncle
=============================