成立宗旨
隨著資訊科技產業的蓬勃發展,各種計算與儲存的資料正快速地產生與累積,此龐大的資料量已非傳統運算方法與儲存技術所能直接處理,而大數據裡的豐富訊息也遠超乎傳統數學與統計建模所能涵蓋。如何充分掌握不斷變動的各種大量非結構化資料,如: 文字、圖片、影像與交易資料等特性,以及如何釐清數據間錯綜複雜的關聯與因果,如: 基因體與臨床數據,環境與生態資料等,深入探討資料科學學理,開發並更新資料分析的方法與策略,從資料中發掘有價值的知識,並為相關專業領域或決策單位提供更具前瞻性、高明、即時且更能提升各種效益的方略,乃為此新興領域資料科學的核心價值。
資料科學是一門跨領域的學問,基本上由三大面向所構成:資訊科學、數學與統計學和領域知識。本學程可提供卓越的教學研究環境和跨領域的研發技術,培育大量優秀的資料科學高階人才,以促進資料科學學理與技術應用的研發,並輔助相關專業領域或產業的發展與保持知識與技術的領先,以達經世濟民的終極目的。
臺灣大學和中央研究院在資料科學領域的研究和教學,早已深具國際社群影響力。相關團隊於近年曾於資料探勘領域最重要的國際競賽ACM KDD CUP,獲得七座冠軍,為全球各單位的第一名;所研發的LIBSVM,為目前全球最受歡迎的資料分析工具之一,Google Scholar 引用數超過40000次;線上資料科學相關中文MOOCs 課程,成功吸引全球超過四萬人註冊學習。在學理上數學與統計學研究成果已是國際一流;專業領域上則有自然、生命與社會科學的尖端實驗與實證所產生的本土巨量資料可供研發。依據臺灣大學和中研院雙方的強項,促成互補性的合作,由雙方參與學程的師資共同規劃,共同參與培育學生,進而產生優異的加乘效果。