什麼是新創最需要的幫助?
我認為對新創團隊來說,資金跟辦公空間都還好處理,但是如果要做突破性的技術,往往會受到規模不夠的限制。
因為新創講求快速反應,常以短小精悍的團隊來運作。可是如果遇到較大的計畫,需要投入很高的開發成本時,就會讓新創團隊退卻。
這次科技部釋出的AI語音數據庫就是令人讚賞的作法
在開發AI語音時,必須搭配完整的語音資料庫來訓練模型,重複地校準、修正,來提升語音辨識的精確度。
可是過去在這一塊,市場缺少完整充裕的中文資料庫,且現有的多以中國為主,不但與台灣的腔調不同,也缺乏穿插台語的使用習慣。因此想開發台灣自己的語音AI,就必須要先建立一個龐大的語音資料庫。可惜的是一般民間機構很難大到像國外一樣成立數據科學團隊,這樣的前期投入,就成了新創的一大障礙。
科技部釋出的語音資料庫不但長達400小時,並且經過人工校對精確標記,可以縮短資料訓練時間,降低語音技術發展門檻,可以說是政府直接提供了民間槍砲彈藥阿!
日前在座談會上我也有提到,科技部的AI中心不應該將自己限縮為一個學術機構,用論文數作為KPI。而是從社會需求中發掘題目,讓自己成為新創的大腦中樞。
科技部投資數百億成立的四個AI中心,應該成為類似 Kaggle 這樣的平台,讓民間來提供數據以及問題,再由AI中心協助找出答案!
像是:
「計程車的浮動費率如何達成供需平衡?」
「哪篇內容農場文是機器人產出的惡意攻擊?」
「如何提升乳房攝影片的乳癌判斷準確率?」
這些都是與社會高度相關,也需要AI中心的技術支援。語音資料庫的作法令業界精神一振,包括我在內的好多科技人,都躍躍欲試地想看能玩出什麼新點子!期待之後的AI中心,能夠化身台灣版的Kaggle,成為民間新創的大腦中樞!
「kaggle資料庫」的推薦目錄:
- 關於kaggle資料庫 在 蕭新晟 港湖科技人 Facebook 的精選貼文
- 關於kaggle資料庫 在 蕭新晟 港湖科技人 Facebook 的最佳解答
- 關於kaggle資料庫 在 【Star Rocket】實作機器學習做資料分析(零基礎初學者) 的評價
- 關於kaggle資料庫 在 台灣人工智慧同好交流區| 【Kaggle】一個資料學科競賽平台 的評價
- 關於kaggle資料庫 在 kaggle資料集2023-精選在臉書/Facebook/Dcard上的焦點新聞 ... 的評價
- 關於kaggle資料庫 在 kaggle資料集2023-精選在臉書/Facebook/Dcard上的焦點新聞 ... 的評價
kaggle資料庫 在 蕭新晟 港湖科技人 Facebook 的最佳解答
什麼是新創最需要的幫助?
我認為對新創團隊來說,資金跟辦公空間都還好處理,但是如果要做突破性的技術,往往會受到規模不夠的限制。
因為新創講求快速反應,常以短小精悍的團隊來運作。可是如果遇到較大的計畫,需要投入很高的開發成本時,就會讓新創團隊退卻。
這次科技部釋出的AI語音數據庫就是令人讚賞的作法
在開發AI語音時,必須搭配完整的語音資料庫來訓練模型,重複地校準、修正,來提升語音辨識的精確度。
可是過去在這一塊,市場缺少完整充裕的中文資料庫,且現有的多以中國為主,不但與台灣的腔調不同,也缺乏穿插台語的使用習慣。因此想開發台灣自己的語音AI,就必須要先建立一個龐大的語音資料庫。可惜的是一般民間機構很難大到像國外一樣成立數據科學團隊,這樣的前期投入,就成了新創的一大障礙。
科技部釋出的語音資料庫不但長達400小時,並且經過人工校對精確標記,可以縮短資料訓練時間,降低語音技術發展門檻,可以說是政府直接提供了民間槍砲彈藥阿!
日前在座談會上我也有提到,科技部的AI中心不應該將自己限縮為一個學術機構,用論文數作為KPI。而是從社會需求中發掘題目,讓自己成為新創的大腦中樞。
科技部投資數百億成立的四個AI中心,應該成為類似 Kaggle 這樣的平台,讓民間來提供數據以及問題,再由AI中心協助找出答案!
像是:
「計程車的浮動費率如何達成供需平衡?」
「哪篇內容農場文是機器人產出的惡意攻擊?」
「如何提升乳房攝影片的乳癌判斷準確率?」
這些都是與社會高度相關,也需要AI中心的技術支援。語音資料庫的作法令業界精神一振,包括我在內的好多科技人,都躍躍欲試地想看能玩出什麼新點子!期待之後的AI中心,能夠化身台灣版的Kaggle,成為民間新創的大腦中樞!
kaggle資料庫 在 台灣人工智慧同好交流區| 【Kaggle】一個資料學科競賽平台 的推薦與評價
【Kaggle】一個資料學科競賽平台,相關資訊如下: Kaggle案例实战公开课part 1: ... 而台灣身為華文世界,最自由、民主、包容的社會,我們的資料庫,顯然就不會像很多 ... ... <看更多>
kaggle資料庫 在 kaggle資料集2023-精選在臉書/Facebook/Dcard上的焦點新聞 ... 的推薦與評價
從頭開始學習資料科學和機器學習,得到聘用,並在Udemy 的最現代、最新的資料科學課程(我們使用最新版本的Python、Tensorflow 2.0 和其他程式庫)的道路上 ... ... <看更多>
kaggle資料庫 在 【Star Rocket】實作機器學習做資料分析(零基礎初學者) 的推薦與評價
Contribute to StarRocket/Machine-learning-starter-with-kaggle-data ... 人才;同時,也透過內容產製跟資料庫的建立,追蹤紀錄創新故事,啟發人們踏入創新航道。 ... <看更多>