創新工場和BCG咨詢合作的「+AI改造者」系列: 看看多面手鎂伽如何由點到面,用機器人和自動化賦能生命科學、製造和零售業。
改造者系列:將核酸檢測提效40倍的自動化變革推手 -- 本文来自BCG微信公眾號,經授權轉載。
近期,創新工場聯合BCG波士頓咨詢旗下亨德森智庫,推出「AI融合產業:『改造者』如何促進AI普惠」系列研究。人工智能在大陸有著明確的落地應用場景,大量的AI企業活躍於這些垂直場景中,我們定義這些企業為「改造者」。「改造者」通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸。
作為擅於趨勢前瞻的TechVC,創新工場長期看好AI領域,深入佈局,至今已經投出了7隻AI獨角獸。在系列研究中,我們采訪了數家創新系AI企業,通過這些「改造者」的視角,探究傳統企業擁抱AI的範式與路徑。
創新工場投資的鎂伽是大陸領先的高科技公司,成立於2016年,專注于機器人和人工智能技術的研發並將其深度融合于行業應用,提供從終端到雲端的產品與服務,賦能生命科學、先進製造等領域的智能變革,同步探索在智能零售等場景的創新應用。疫情期間,鎂伽為核酸檢測的應用需求提供了一系列高通量病毒核酸檢測解決方案,全程無人工參與,「樣品進、結果出」的全自動化,最大化保證結果的準確,效率相比人工提升40倍以上,最大可能降低了人工實驗過程中的感染風險。
2021年,鎂伽正式宣佈其自主研發的中國首家通用型智能自動化生物實驗室——鎂伽鯤鵬實驗室一期在北京正式落成,同時也在上海、蘇州開始佈局滿足不同功能的自動化生物實驗室,預計於2022年陸續投入使用。鯤鵬實驗室將專注于細胞基因編輯、高通量藥物篩選、合成生物學等領域的研究,致力於打造次世代的生命科學基礎設施,提高生命科學研發和生產效率,賦能行業融合創新,引領即將到來的生物學革命。
在采訪中,鎂伽認為AI應用企業要從垂直行業的實際問題出發,通過儲備和培養大量複合型人才,做到「比客戶更懂業務」。以下:
■系列導讀
本系列由BCG亨德森智庫與創新工場董事長兼首席執行官李開復博士帶領的創新工場團隊共同推出,圍繞「AI融合產業:『改造者』1如何促進AI普惠」的課題,我們致力於探究傳統企業在應用AI過程中的關鍵要素與合作夥伴,以及傳統企業擁抱AI的範式與路徑。
在上篇中,我們接觸了提供端到端AI醫藥平臺的英矽智能,在今天的文章中,我們將進一步瞭解在生命科學、先進製造與智能零售等創新領域提供智能自動化技術與產品的高科技公司,即「改造者」——鎂伽科技。
1 「改造者」通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸,充當產業中傳統企業應用AI的橋樑。「改造者」包括AI企業與成功轉型AI的傳統企業。
鎂伽是中國大陸領先的高科技公司,憑藉卓越的智能自動化技術與產品,實現行業創新突破和深度融合,致力於構建智能社會,賦能生命科學、先進製造等領域的智能變革,同步探索在智能零售等場景的創新應用。
■對談實錄
Q1:鎂伽為生命科學、零售和製造業提供AI解決方案,三個行業跨度很大,鎂伽如何進行賽道選擇?在發展過程中如何增進行業理解?
鎂伽:鎂伽是以機器人和自動化技術起家的,但在服務客戶的過程中,我們發現客戶需要的不只是機器人本體或自動化設備,還要結合行業需求痛點的解決方案。生命科學和線下零售都是市場容量很大、增速很快的行業,但自動化和智能化的滲透程度還很低,急切地需要提升生產力,因此我們選擇進入這些賽道。
這三個賽道看似跨度很大,但其實底層技術是相通的。比如人工智能技術可以用於晶圓的缺陷檢測,也可以用在藥物篩選實驗中的細胞培養和克隆挑選。鎂伽開發了許多通用的基礎底層技術作為支撐,比如IntellVega通用視覺平臺已經應用於工業領域線上視覺檢測以及生命科學領域的藥物篩選,鎂伽還有一個技術中台MegaCloud,集合了跨行業的後臺數據,能夠支援鎂伽在不同領域的各項業務。
當然,對於一線業務來說,使用人工智能或者自動化的形態是完全不同的。鎂伽通過儲備和培養大量複合型人才做到「比客戶更懂他的業務」,以體現鎂伽的專業性和技術領先性。以生命科學領域為例,鎂伽不只有人工智能算法科學家,還有包括幹細胞、類器官、合成生物學、免疫學、病毒學等方向的科學家,既有來自CRO、IVD和藥企的專業人才,也有懂市場營銷的專家。由於團隊的多樣性和複合性,鎂伽內部也建立了充分的互相培訓機制,加強團隊之間的磨合與學習。
同時,現代生物學現在已經成了大數據科學,人工智能的應用是大勢所趨。鎂伽在助力生命科學領域轉型的過程,通過智能自動化技術,説明客戶把非常複雜的生物學實驗標準化、自動化和數字化。鎂伽在兩個方面説明生命科學的客戶,一是用行業領先的高效自動化系統説明客戶快速產生海量的多維度實驗數據;二是用鎂伽人工智能平臺説明客戶對生物數據進行模型構建和關聯性分析,進而指導實驗的持續優化。
另外,鎂伽也是少有的在生命科學領域搭建了完整的生物學自動化實驗室的企業,能夠融合我們自己的自動化和人工智能技術。客戶親眼看到我們的實驗室之後都會很受震撼,認識到我們做的事情非常前沿,他們也很想加入。這就使得鎂伽和其他生命科學領域的硬件設備廠家區分開來。
鎂伽甚至發現,從過去幾年到如今,有不少AI技術公司找到我們,希望借鑒我們的垂直行業經驗。這些團隊往往有很強的AI算法能力,但是缺乏數據、缺乏應用數據的方式。以藥物篩選為例,鎂伽可以做到在實驗室設計方案之初就考慮到收集哪些關鍵數據並使其很好地滿足機器學習算法的要求,從而在實驗過程中自動採集證據以證明細胞安全且來源單一,滿足監管的要求。這是鎂伽相比於其他AI公司的獨到優勢。
在開發解決方案的過程中,鎂伽一直堅持從業務問題出發,首先找到高價值的應用點,再把點串成線,由線鋪到面。
Q2:就鎂伽的觀察而言,傳統企業應用AI有哪些共性問題?鎂伽是如何解決的?
鎂伽:傳統企業首先對AI技術能夠解決什麼問題比較模糊,也不太能理解AI是如何解決問題的。例如對AI如何能替代人工檢查、或者提升產品良率都不理解,因此很難提煉他們對AI的需求。鎂伽需要引導傳統企業的決策者來梳理業務流程,明確行業的特定痛點,從而制定解決方案,並計算和衡量自動化和AI能夠為企業帶來的經濟價值。
同時,傳統企業往往也缺乏高質量的數據,或者有數據但並未標記、數據不標準,無法有效地投入AI應用。傳統企業還缺乏AI人才,自動駕駛和視頻監控行業的人才和技術可能相對更多,但在傳統製造、生物醫藥這些行業,AI人才和技術是較為欠缺的。鎂伽建立了高效的數據獲取、自動化模型訓練和高精度上線部署的AI閉環,軟硬件團隊和測試團隊也做了充分的磨合,可以極大地提升傳統企業研發應用AI的效率。否則,從模型搭建、數據清洗到模型訓練、結果分析部署等等諸多環節,對傳統企業而言都是費時費力甚至難以為繼的。
鎂伽還會幫傳統企業搭建懂AI的團隊和建立完整的數據體系,包括説明傳統企業的團隊理解如何提煉數據、要采集並標注什麼數據等等。幫助傳統企業建立一支懂得AI應用的團隊有利於傳統企業的持續AI賦能。鎂伽內部建立了一個共有技術平臺,以機器人控制、2D和3D視覺、深度學習為核心的IntellVega平臺,及為用戶提供物聯網、SaaS線上集群服務和大數據分析等核心的 MegaCloud平臺,通過專業的開發團隊為客戶提供高效、智能化的整體解決方案,而傳統企業只需要提煉他們自身對產品工藝、質量的要求就可以了。
■要點回顧
1、「改造者」需要從垂直行業的業務問題出發,打造複合型團隊(既懂AI又懂垂直行業的專業人才),並加強團隊融合,實現「比客戶更懂業務」。
2、一流的「改造者」不只是提供產品和解決方案而已,還應當幫助傳統企業驅動變革管理,幫助識別和定義問題和需求,驅動認知轉變並提高員工技能,從而使AI應用在長期可持續。
■本期內容來自BCG對話鎂伽首席科學家王承志博士、首席技術官丁新宇先生、研發副總裁段金瑞博士、人工智能算法科學家蒯多傑博士和孫新先生。
同時也有1部Youtube影片,追蹤數超過18萬的網紅公視新聞網,也在其Youtube影片中提到,國內首度出現半導體廠員工快篩陽性,國內疫情升溫,也讓半導體廠繃緊神經。八吋晶圓代工廠世界先進桃園廠,一名員工快篩陽性,已先進行隔離,等PCR核酸檢驗出爐,才知是否確診。 詳細新聞內容請見【公視新聞網】 https://news.pts.org.tw/article/527202 - 由台灣公共電...
晶 宇 核酸 在 文茜的世界周報 Sisy's World News Facebook 的最佳解答
0610新加坡聯合早報
*【韓國考慮優先讓晶片和電子公司員工接種疫苗】
韓國疾病控制和預防機構(KDCA)的一位官員說,韓國正在考慮為包括晶片和電子公司在內的關鍵企業的工人接種疫苗的計畫,以防止生產中斷。
https://www.zaobao.com.sg/realtime/world/story20210610-1154255
*【消息:美國未來兩年向100國捐贈5億輝瑞疫苗】
美國拜登政府計畫在未來兩年向近100個國家捐贈5億劑輝瑞冠病疫苗。消息人士說,美國今年可能捐贈2億劑疫苗,明年上半年再分發3億支給92個低收入國家和非洲聯盟。這些捐贈將通過由世界衛生組織和全球疫苗和免疫聯盟(GAVI)領導全球冠病疫苗獲取機制(COVAX)計畫執行。該項目向中低收入國家發放冠病疫苗。GAVI沒有回應評論請求。
https://www.zaobao.com.sg/realtime/world/story20210610-1154243
*【泰產阿斯特捷利康疫苗 本月料無法如期交付馬國 接種進度將受影響】
馬來西亞冠病疫苗接種計畫協調部長凱利表示,馬國本月預料將無法如期接收泰國生產的英國阿斯特捷利康疫苗。這意味著馬國冠病免疫計畫進度將受影響。
https://www.zaobao.com.sg/news/sea/story20210610-1154173
*【法國總理與冠病患者密切接觸須自我隔離】
法國總理卡斯泰因被列為冠病確診病例的密切接觸者,從週三(9日)起開始自我隔離。法國總理府消息指出,法國總理卡斯泰的夫人確診感染冠病病毒。卡斯泰本人當晚接受冠病病毒檢測,結果呈陰性。根據防疫規定,卡斯泰作為密切接觸者開始為期七天的自我隔離。
https://www.zaobao.com.sg/realtime/world/story20210610-1154259
*【美英兩國同意探討開放兩國邊界】
英國政府一份聲明聲明說,拜登於週三抵達英國,進行他作為總統的首次海外訪問。拜登將在週五開始的七國集團領導人會議前,於週四在康沃爾與強森會面。兩國首腦預計將在會面時針對開放旅行邊界進行討論。
https://www.zaobao.com.sg/realtime/world/story20210610-1154245
*【歐洲議會批准7月啟用冠病通行證】
歐洲議會全會9日正式批准“冠病通行證”,該通行證將於今年7月1日正式啟用,其包含疫苗接種證明、核酸檢測陰性或冠病康復等資訊,旨在促進歐盟成員國公民在歐盟境內自由流動。
https://www.zaobao.com.sg/realtime/world/story20210609-1154117
*【亞洲獅感染冠病死亡 印度檢測28頭象】
印度南部泰米爾納德邦真奈市動物園一隻稀有的亞洲獅本月因感染冠狀病毒而死亡,印度官員今天宣佈,為安全起見,已對邦內一個森林保育區的28頭大象進行采檢。
https://www.zaobao.com.sg/realtime/world/story20210609-1154119
*【臉書允許更多員工在疫情後遠端辦公】
臉書正加大該企業彈性工作制政策的力度。該公司宣佈從6月15日開始,公司各級員工都可以在疫情之後後申請繼續遠端全職工作。
https://www.zaobao.com.sg/realtime/world/story20210610-1154252
*【佐科威:印尼7月起每日接種劑量須增至100萬劑】
印尼冠病確診病例繼續激增,總統佐科威下令加速疫苗接種,該國的疫苗接種率本月必須增至每天70萬劑,而7月份開始每日的接種劑量須增至100萬劑。
https://www.zaobao.com.sg/realtime/world/story20210609-1154108
*【泰普吉7月開放旅遊 推1美元酒店住宿吸客】
泰國政府將於下月1日起對外開放普吉島,為配合開放旅遊措施,泰國政府推出“一晚一美元”住宿計畫,當地酒店每晚平均費用約1000至3000泰銖,而旅客只需支付1美元,即可入住一晚酒店,政府負責補貼差價。
https://www.zaobao.com.sg/realtime/world/story20210609-1154107
*【日本連續兩天新增確診病例低於2000起】
近日日本新增冠病確診病例數呈下降趨勢,截至8日連續兩天新增確診病例低於2000起,而最近10天只有一天新增確診病例超過3000起。
https://www.zaobao.com.sg/realtime/world/story20210609-1154104
*【以泡泡圈隔開選手與隨團人員 日本東奧期間防疫手法遭質疑】
東京奧運會即將登場,日本政府正在加快為市民施打疫苗,在這同時也要以“泡泡圈”,把近10萬名到來的外國選手與隨團人員隔開。日本輿論對這一安排高度質疑,認為日本這麼一個購物天堂,怎能鎖住人心,不上街買東西?
https://www.zaobao.com.sg/news/world/story20210610-1154187
*【韓國航空泡泡最快7月啟動 初期開放給完成接種疫苗者】
韓國政府昨日正式宣佈推進“航空泡泡”方案,最快7月起有限制開放跟團出境旅遊,並已與新加坡、臺灣、泰國、關島、塞班等防疫狀況良好的地區進行初步討論。
https://www.zaobao.com.sg/news/world/story20210610-1154184
*【與加墨英歐盟成立專家組 美國探討安全重啟國際旅行】
美國正同加拿大、墨西哥、歐盟和英國合作組建多個專家工作組,以探討如何在實施防疫限制措施長達15個月後,安全地重啟國際旅行。不過,由於專家組需要時間來完成工作,預計美國不會很快就取消針對世界大部分國家旅客的入境限制。
https://www.zaobao.com.sg/news/world/story20210610-1154186
*【研究:疫情爆發前兩年半裡 武漢有近5萬隻野生動物出售】
一項研究顯示,在2019年武漢出現首批冠病病例之前的兩年半時間裡,武漢地區的市場售出超過4萬7000只活體野生動物。發表在期刊《科學報告》上的一篇論文稱,2017年5月至2019年11月期間,武漢17個市場上出售的動物種類多達38個,其中包括31種野生保護動物。
https://www.zaobao.com.sg/news/china/story20210610-1154194
*【美國防部將加快對華威懾工作】
美國國防部長奧斯汀發佈了一項指令,要求加快發展軍隊和軍事能力,以威懾被視為美國主要威脅的中國。
https://www.zaobao.com.sg/realtime/china/story20210610-1154248
*【拜登簽署行政令撤銷微信和TikTok禁令】
美國總統拜登簽署了一項行政令,撤銷美國對中國社群軟體TikTok和微信的禁令。白宮當天在一份聲明說,拜登政府不會禁止這些流行應用,但會對“由外國控制的互聯網應用採用一個基於標準的決策框架和嚴格循證分析”,來應對其風險。
https://www.zaobao.com.sg/realtime/world/story20210610-1154242
*【報告:美多個聯邦機構誤判 未分享情報導致國會山莊遭襲】
美國國會參議院6月8日就今年1月發生的國會山莊騷亂事件發佈調查報告,認為多個聯邦機構嚴重誤判且未充分分享所截獲的相關情報,是導致騷亂事件發生的重要原因。
https://www.zaobao.com.sg/news/world/story20210610-1154176
*【應對中國經濟和戰略挑戰 美參院高票通過創新與競爭法案】
參議院多數黨領袖舒默稱,這是參議院近年來最重要的跨黨派成就之一,將為美國在今後一個世紀的領導地位奠定基礎。拜登對法案獲得參議院通過表示鼓舞:“我們正處於成為21世紀贏家的競賽中,起跑槍已經響起。”
https://www.zaobao.com.sg/news/world/story20210610-1154182
*【今年全球經濟增長預測 世界銀行上調至5.6%】
世界銀行把2021年全球經濟增長預期上調至5.6%。比1月時的預估值高1.5個百分點,這將成為80年來全球在經濟衰退後的最快增速。世界銀行前天發佈最新一期《全球經濟展望》報告指出,全球經濟將得益於美國振興經濟支出和中國經濟增長加快等少數幾個主要經濟體強勁反彈支撐,但增長將受冠病疫苗分配不均所限。
https://www.zaobao.com.sg/news/world/story20210610-1154178
*【涉挪用2.5億美元 納吉繼子被一馬公司起訴】
馬來西亞前首相納吉的繼子里扎阿茲因涉嫌挪用一馬公司2.5億美元資金而被一馬公司起訴。一馬公司(1MDB)5月7日入稟吉隆玻法庭,這是一馬公司針對摩根大通和德意志銀行等個人和公司提出的多起訴訟之一,以追回一馬公司逾230億美元的資產。
https://www.zaobao.com.sg/news/sea/story20210610-1154175
*【有高眼壓遺傳傾向者 攝取咖啡因或增青光眼風險】
英國倫敦大學學院公佈的研究顯示,那些具有高眼壓遺傳傾向的人,如果每天攝入較多咖啡因,可能會增加青光眼的患病風險。青光眼和眼壓高有密切的關聯。美國芒特西奈伊坎醫學院、英國倫敦大學學院等機構的學者分析了咖啡因攝入對青光眼以及眼壓的影響,研究成果已刊登在最新一期《眼科學》上。
https://www.zaobao.com.sg/news/world/story20210610-1154181
*【韓國光州市拆遷樓倒塌致九死八傷】
據韓國消防部門9日消息,位於韓國光州市東區鶴洞的一處五層樓建築當天下午4時22分許在拆除時突然倒塌,導致一輛巴士和兩輛乘用車被埋,目前為止已正式有九人喪命,另有八人重傷。
https://www.zaobao.com.sg/realtime/world/story20210609-1154112
*【比特幣成為薩爾瓦多法定貨幣】
中美國家薩爾瓦多(El Salvador)6月9日通過立法,成為全球首個採用比特幣作為法定貨幣的國家。
https://www.zaobao.com.sg/realtime/world/story20210609-1154110
*【神舟十二號將擇機發射 將三名宇航員送入空間站】
據《中國航太報》報導,神舟十二號載人飛船與長征二號F遙十二運載火箭組合體在中國酒泉衛星發射中心完成技術區相關工作後,6月9日垂直轉運至發射區,將擇機實施飛行任務。
https://www.zaobao.com.sg/realtime/china/story20210610-1154258
晶 宇 核酸 在 Facebook 的最佳解答
「它將改變一切!」
DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子折疊問題。
本週振奮全球AI界的消息:Google旗下人工智能企業DeepMind發布了最新 AlphaFold成果,這是全球AI界無比振奮的重大科研突破。蛋白質存在於我們世界中的所有有機物體及奧妙人體中,全新的AlphaFold 算法揭秘了生物學界50年來試圖破解蛋白質分子折疊的難題,這項AI帶來的重大突破,將幫助科學家弄清某些困擾人們的疾病機制、加速找出新型流行病的具體原因(比如今年的全球新冠大流行),促進新藥設計、幫助農業增產、解析可有效降解廢棄物的嶄新成分、甚至探索為大氣減碳的全新解決方案。
我特別期待 AlphaFold 能為人類健康、環境生活推向更寬廣的可能性。在魔幻2020 最後一個月,這真是一個讓人懷抱希望的全新技術可能性,期待 AlphaFold之後締造更多 AI for Good 落地應用。
以下文章詳盡解釋了這項突破,內容經《機器之心》微信公眾號授權轉載。
▎生物學界最大的謎團之一,蛋白質折疊問題被 AI 破解了。
11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智能技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子折疊問題。
最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 折疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
DeepMind 重大科研突破的消息一出即被《Nature》、《Science》等科學雜誌爭相報導,新成果也立刻獲得了桑達爾 · 皮查伊、伊隆 · 馬斯克等人的祝賀。
科學家們表示,Alphafold 的突破性研究成果將幫助科研人員弄清引發某些疾病的機制,並為設計藥物、農作物增產,以及可降解塑料的「超級酶」研發鋪平道路。
「這是該研究領域激動人心的一刻,」DeepMind 創始人、首席執行官德米斯 · 哈薩比斯說道。 「這些算法今天已經足夠成熟強大,足以被應用於真正具有挑戰性的科學問題上了。」
蛋白質對於生命至關重要,它們是由氨基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質折疊成何種形狀被稱為「蛋白質折疊問題」。在過去 50 年裡,蛋白質折疊一直是生物學領域的重大挑戰。
DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。在今年的國際蛋白質結構預測競賽 CASP 中,DeepMind 開發的 AlphaFold 最新版本擊敗了其他選手,在準確性方面比肩人類實驗結果,被認為是蛋白質折疊問題的解決方案。這一突破證明了 AI 對於科學發現,尤其是基礎科學研究的影響。
在兩年一次的 CASP 競賽中,各組爭先預測蛋白質的 3D 結構。今年,AlphaFold 擊敗了所有其他小組,並在準確性方面與實驗結果相匹配。
對於不熟悉生物領域的人來說,CASP 的大名可能有些陌生——CASP 全稱 The Critical Assessment of protein Structure Prediction,旨在對蛋白質結構預測進行評估,被譽為蛋白質結構預測的奧林匹克競賽。 CASP 從 1994 年開始舉辦,每兩年一屆,目前正在進行的一屆是 11 月 30 日開始的 CASP14。
而 DeepMind 這一突破有什麼影響?
用哥倫比亞大學計算生物學家Mohammed AlQuraishi 在Nature 文章中的話來說,「可以說這將對蛋白質結構預測領域造成極大影響。我懷疑許多人會離開該領域,因為核心問題已經解決。這是一流的科學突破,是我一生中最重要的科學成果之一。」
▎蛋白質折疊問題
蛋白質的形狀與它的功能密切相關,而預測蛋白質結構對於理解其功能和工作原理至關重要。很多困擾全人類的重大問題(如尋找分解工業廢料的酶)基本上都與蛋白質及其扮演的角色有關。
多年以來,蛋白質結構一直是熱門的研究話題,研究者使用核磁共振、X 射線、冷凍電鏡等一系列實驗技術來檢測和確定蛋白質結構。但這些方法往往依賴大量試錯和昂貴的設備,每種結構的研究都要花數年時間。
1972 年,美國科學家 Christian Anfinsen 因「對核糖核酸酶的研究,特別是對其氨基酸序列與生物活性構象之間聯繫的研究」獲得諾貝爾化學獎。在頒獎禮上,他提出了一個著名的假設:從理論上來說,蛋白質的氨基酸序列應該可以完全決定其結構。這一假設引發了長達五十年的探索,即僅僅基於蛋白質的一維氨基酸序列計算出其三維結構。
但這一思路的挑戰在於,在形成三維結構之前,蛋白質的理論折疊方式是一個天文數字。 1969 年,Cyrus Levinthal 指出,如果使用蠻力計算的方式來枚舉一種蛋白質可能存在的構象,要花費的時間甚至比宇宙的年齡還要長。 Levinthal 估計,一種蛋白質大約存在 10^300 種可能構象。但在自然界中,蛋白質會自發折疊,有些只需幾毫秒,這被稱為 Levinthal 悖論。
CASP 14 比賽最新結果:AlphaFold 中位 GDT 高達 92.4
CASP 競賽由 John Moult 和 Krzysztof Fidelis 兩位教授於 1994 年創立,每兩年進行一次盲審,以促進蛋白質結構預測方面的新 SOTA 研究。
一直以來,CASP 選擇近期才經過實驗確定的蛋白質結構,作為參賽團隊測試其蛋白質結構預測方法的目標(有些結構即使在評估時仍然處於待確定狀態)。這些蛋白質結構不會事先公佈,參賽者也必須對其結構進行盲測,最後將預測結果與實驗數據進行對比。正是基於這種嚴苛的評估原則,CASP 一直被稱為預測技術評估方面的「黃金標準」。
CASP 衡量預測準確率的主要指標是 GDT(Global Distance Test),範圍從 0 到 100,可以理解為預測的氨基酸殘基在正確位置閾值距離內的百分比。 John Moult 教授表示,GDT 分數在 90 分左右,即可視為對人類實驗方法具備競爭力。
在剛剛公佈的第14 屆CASP 評估結果中,DeepMind 的最新AlphaFold 系統在所有預測目標中的中位GDT 達到92.4,意味其平均誤差大概為1.6 埃(Angstrom),相當於一個原子的寬度(或0.1納米)。即使在難度最高的自由建模類別中,AlphaFold 的中位 GDT 也達到了 87.0。
歷屆 CASP 競賽自由建模類別中預測準確率中位數的提升情況,度量指標為 BEST-OF-5 GDT。
CASP 競賽自由建模類別中的兩個目標蛋白質示例。 AlphaFold 能夠預測出高度準確的蛋白質結構。
這些令人振奮的結果開啟了生物學家使用計算結構預測作為科研主要工具的時代。 DeepMind 提出的方法對於某些重要的蛋白質類別尤其有用,例如膜蛋白(membrane protein)。膜蛋白很難結晶,因此很難通過實驗方法來確定其結構。
該計算工作代表了在蛋白質折疊這一具備 50 年曆史的生物學問題上的驚人進展,比該領域人士成功預測蛋白質折疊結構早了幾十年。我們將很興奮,它能從多個方面對生物學研究帶來基礎性改變。 ——Venki Ramakrishnan 教授(諾貝爾獎得主,英國皇家學會會長)
▎DeepMind 這樣解決蛋白質折疊問題
2018 年,DeepMind 團隊使用初始版 AlphaFold 參加 CASP13 比賽,取得了最高的準確率。之後,DeepMind 將 CASP13 方法和相關代碼一併發表在 Nature 上。而現在,DeepMind 團隊開發出新的深度學習架構,並使用該架構參加 CASP14 比賽,達到了空前的準確率水平。這些方法從生物學、物理學、機器學習,以及過去半個世紀眾多科學家在蛋白質折疊領域的工作中汲取靈感。
我們可以把蛋白質折疊看作一個「空間圖」,節點表示殘基(residue),邊則將殘基緊密連接起來。這個空間圖對於理解蛋白質內部的物理交互及其演化史至關重要。對於在 CASP14 比賽中使用的最新版 AlphaFold,DeepMind 團隊創建了一個基於注意力的神經網絡系統,並用端到端的方式進行訓練,以理解圖結構,同時基於其構建的隱式圖執行推理。該方法使用進化相關序列、多序列比對(MSA)和氨基酸殘基對的表示來細化該圖。
通過迭代這一過程,該系統能夠較強地預測蛋白質的底層物理結構,並在幾天內確定高度準確的結構。此外,AlphaFold 還能使用內部置信度度量指標判斷預測的每個蛋白質結構中哪一部分比較可靠。
DeepMind 團隊在公開數據上訓練這一系統,這些數據來自蛋白質結構數據庫(PDB)和包含未知結構蛋白質序列的大型數據庫,共包括約 170,000 個蛋白質結構。該系統使用約 128 個 TPUv3 內核(相當於 100-200 個 GPU)運行數週,與現今機器學習領域出現的大型 SOTA 模型相比,該系統所用算力相對較少。
此外,DeepMind 團隊透露,他們準備在適當的時候將這一 AlphaFold 新系統相關論文提交至同行評審期刊。
AlphaFold 主要神經網絡模型架構概覽。該模型基於進化相關的蛋白質序列和氨基酸殘基對運行,迭代地在二者的表示之間傳遞信息,從而生成蛋白質結構。
▎對現實世界的潛在影響
「讓 AI 突破幫助人們進一步理解基礎科學問題」,經過 4 年的研究攻關,現在 AlphaFold 正在逐步實現 DeepMind 初創時的願景,在藥物設計和環境可持續性等領域都產生了重要的影響。
馬克斯· 普朗克演化生物學研究所所長,CASP 評估員Andrei Lupas 教授表示:「AlphaFold 的精確模型讓我們解決了近十年來被困擾的蛋白質結構,重新啟動關於信號如何跨細胞膜傳輸的研究。 」
DeepMind 表示願與其他研究者合作,以進一步了解 AlphaFold 在未來幾年的潛力。除了作用於經過同行評審的論文以外,DeepMind 還在探索如何以最佳的可擴展方式為系統提供更廣泛的訪問可能。
同時,DeepMind 的研究者還研究了蛋白質結構預測如何幫助人們理解一些特殊的疾病。例如,通過幫助識別存在故障的蛋白質,並推斷其相互作用的方式,來理解一些疾病的原理。這些信息能夠讓藥物開發更加精確,從而補充現有的實驗方法,並更快找到更有希望的治療方法。
AlphaFold 是十分卓越的,它在預測結構蛋白質的速度和精度上有著驚人的表現。這一飛躍證明了計算方法對於生物學中的轉換研究,加速藥物研發過程都具有廣闊的前景。
同時許多證據也表明,蛋白質結構預測在未來的大流行應對上是有用的。今年早些時候,DeepMind 使用 AlphaFold 預測了包括 ORF3a 在內的幾種未知新冠病毒蛋白質結構。在 CASP14 中,AlphaFold 預測了另一種冠狀病毒蛋白質 ORF8 的結構。目前,實驗人員已經證實了 ORF3a 和 ORF8 的結構。儘管具有挑戰性,並且相關序列很少,但與實驗確定的結構相比,AlphaFold 在兩種預測上都獲得了較高的準確率。
除了加速對已知疾病的了解,AlphaFold 還具備很多令人興奮的技術潛力:探索數億個目前還沒有模型的數億蛋白質,以及未知生物的廣闊領域。由於 DNA 指定了構成蛋白質結構的氨基酸序列,基因組學革命使大規模閱讀自然界的蛋白質序列成為可能——在通用蛋白質數據庫(UniProt)中有 1.8 億個蛋白質序列。相比之下,考慮到從序列到結構所需的實驗工作,蛋白質數據庫(PDB)中只有大約 170000 個蛋白質結構。在未確定的蛋白質中可能有一些新的和未確定的功能——就像望遠鏡幫助人類更深入的觀察未知宇宙一樣,像 AlphaFold 這樣的技術可以幫助找到未確定的蛋白質結構。
▎開創新的可能
AlphaFold 是 DeepMind 迄今為止取得的最重要進展之一,但隨著後續科學研究的開展,依然有很多問題尚待解決。 DeepMind 預測的結構並非全部都是完美的。還有很多要學習的地方,包括多蛋白如何形成複合體,如何與 DNA、RNA 或者小分子交互,以及如何確定所有氨基酸側鏈的精確位置。此外,在與他方合作的過程中,還需要學習如何以最好的方式將這些科學發現應用在新藥開發以及環境管理方式等諸多方面。
對於所有致力於科學領域中計算和機器學習方法的人而言,像 AlphaFold 這樣的系統彰顯了 AI 作為基礎探索輔助工具的驚人潛力。正如 50 年前 Anfinsen 提出的遠超當時科研能力所及的挑戰一樣,這個世界依然有諸多未知的方面。
DeepMind 取得的這一進展令人們更加堅信,AI 將成為人類擴展科學知識邊界的最有用工具之一,同時也期待未來多年的艱苦工作能夠帶來更偉大的發現。
影片及原文,參考 DeepMind官方部落客 https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
晶 宇 核酸 在 公視新聞網 Youtube 的最讚貼文
國內首度出現半導體廠員工快篩陽性,國內疫情升溫,也讓半導體廠繃緊神經。八吋晶圓代工廠世界先進桃園廠,一名員工快篩陽性,已先進行隔離,等PCR核酸檢驗出爐,才知是否確診。
詳細新聞內容請見【公視新聞網】 https://news.pts.org.tw/article/527202
-
由台灣公共電視新聞部製播,提供每日正確、即時的新聞內容及多元觀點。
■ 按讚【公視新聞網FB】https://www.facebook.com/pnnpts
■ 訂閱【公視新聞網IG】https://www.instagram.com/pts.news/
■ 追蹤【公視新聞網TG】https://t.me/PTS_TW_NEWS
#公視新聞 #即時新聞
-
看更多:
■【P sharp新聞實驗室】全媒體新聞實驗,提供新一代的新聞資訊服務。 (https://newslab.pts.org.tw)
■【PNN公視新聞議題中心】聚焦台灣土地環境、勞工司法、族群及平權等重要議題。 (https://pnn.pts.org.tw)