先借一個網站 https://reurl.cc/oQKWdv 小弟先前在紐西蘭某政府機關擔任資料科學主管,因為常有國內外不同交流, 常常簡報我們在做甚麼,所以我常引用網站裡面的那張圖 另外Data Science在近十年火熱的原因一部分也來自傳統Business Intelligence的 Rebranding,尤其是大企業很多都是在BI的基礎上再擴充, 畢竟追根究柢沒有強大完整的資料倉儲做後盾要談機器學習和人工智慧都是畫大餅 這幾年MLOps (https://en.wikipedia.org/wiki/MLOps) 崛起 理由就是以前大幅仰賴太學術性的資料科學人才造成實際上整個流程太過複雜 要去優化DS和軟體開發的整合才能增加企業的優勢 因此很多ML平台像是DataRobot,H2O越來越受歡迎,做資料科學現在有點像手機開發 工具都在那邊,只要資料準備好上千個模型平台幫你跑好跑滿 這樣企業能把焦點資源放在資料本身, 其實研究顯示所有ML專案超過60%的時間都在資料本身 如果是中小企業那DS通常要更十八般武藝樣樣俱全,分工太細一方面代表成本太高 實際上也不會比較有效率,再來還要看企業文化對資料科學的需求 比較要避免的就是名字叫資料科學結果進去全部都在做傳統報表或視覺化 要不然就是比較不成熟的環境,公司想要這個那個但是連資料倉儲都搞不定 被召聘進去變成Data Engineer或是跟Business Analyst沒兩樣... 不過說實在的,個人還是覺得這是一個挑戰性很高的領域 會做模型是一回事,會寫程式是一回事,做出來的東西能不能用才是重點 很多時候要做的東西也沒甚麼前例可以參考,從錯中學是常態 最近離開政府機關回到前東家,六周內跑了38個專案,1,297個模型最後選了三個上線 Training Data都有15~20%優化但是能不能幫公司多賺+15%老實說我也不知道哇哈哈 有興趣的歡迎到LinkedIn交個朋友 https://www.linkedin.com/in/minghsuanlee/ -- ※ 發信站: 批踢踢實業坊(web-ptt.org.tw), 來自: 121.99.177.32 (紐西蘭) ※ 文章網址: https://web-ptt.org.tw/Soft_Job/M.1662940225.A.A0A ※ 編輯: pelicanper (121.99.177.32 紐西蘭), 09/12/2022 07:51:40
jass87987: 推分析 09/12 08:43
miroase: 推詳細 原po笑起來好帥XD 09/12 09:28
NTUTM04: 推 09/13 08:40
geraldliu98: 推 好文 09/24 14:08