2018年12月中才繳完資料科學的作業......
作業內容:
1. 網頁爬蟲(抓取分析資料) 來源可以是各大電商網站,BBS站,政府的公開資料網,國外的Kaggle(上有獎金的競賽,高達萬元美金以上)
2. 資料預處理-處理掉Null值和NAN值...並做資料轉換
3. 資料聚合(群組統計)與樞紐分析(XY軸的分類和數值分析)
4. 統計分析(標準差,中位數,四分位數,平均值,最大值,最小值)
5. 主次因分析: 80/20法則,分析的資料中,那幾個是主要的影響資料和因素
6. 視覺化- 用matplotlib和dataframe畫圓餅圖,長條圖,主次因分析圖
7. K-means分群與簡單線性回歸與分析報告
不過上禮拜終於拿到證書.....通過第一階段的考核,收到證書時,辛苦總算有了代價
------------------------------------------------------------------------------------------------------
由去年12月中到2019年1月中上課的內容是:
1. 人工智慧導入與環境安裝
2. 分類與迴歸,線性迴歸與正規化
3. Kaggle介紹
4. 整體學習(Ensemble Learning)/監督式學習
5. 非監督式學習-分群/降維
6. 深度學習方法
還有兩週的課和月底的作業要交........怎麼感覺時間不太夠啊........
不過這兩天去誠品買書,無論是雜誌和是我的書(有圖有真相),都顯示2019年是資料科學和AI的應用發展年度......
資料科學 => 可用在大數據的基礎分析(電商分析,製造業流程分析,工廠品質與效能分析)
機器學習 => 可用在預測和建立模型(比較小量的資料),如商業模型,地區的房價,客戶分類,進階的(電商分析,製造業流程分析,工廠品質與效能分析...)模型件立
深度學習 => 可用在多維度及複雜的AI應用(如: 語音辨識即時翻譯, 人工智能語音助理, 圖形和人臉辨識, Google的ALPHAGO, IBM的華生)
未來有不少工作將被AI所取代,但也有更多的工作將和AI應用結合再一起.......大陸現在由國中就開始上AI的基本概念課,因此如果要提升自己未來的競爭力,請記得持續的進修... 呼,真是有趣的世界啊
留言列表