課程簡介
數(shù)據(jù)是信息時代的“新能源”。從金融到零售,從電商到體育,數(shù)據(jù)科學都成為成功決策的基礎(chǔ),廣泛應用在營銷優(yōu)化、風險控制、客戶關(guān)系等商業(yè)領(lǐng)域。 【CDA數(shù)據(jù)分析周末集訓班-python方向】以CDA數(shù)據(jù)分析師標準等級大綱要求出發(fā),從數(shù)據(jù)獲?。≒ython爬蟲、Mysql數(shù)據(jù)庫)—統(tǒng)計學理論方法—數(shù)據(jù)分析與軟件應用(Python)—數(shù)據(jù)挖掘和機器學習(Python)—數(shù)據(jù)可視化(Matplotlib,Seaborn等)整套數(shù)據(jù)分析流程技術(shù)系統(tǒng)講解,還將結(jié)合量化投資、金融、銀行、電信等行業(yè)真實需求出發(fā)全部用實際案例教學來使所學項目課程更能符合企業(yè)要求。
學習目標
使用Python爬蟲獲取網(wǎng)絡數(shù)據(jù),使用Mysql進行數(shù)據(jù)的存儲和查詢
掌握數(shù)據(jù)分析基礎(chǔ)理論和常用分析法,使用統(tǒng)計分析方法進行驗證
結(jié)合機器學習方法進行預測并清晰傳達你的洞察
使用可視化方法Matplotlib,Seaborn,Pyecharts等發(fā)現(xiàn)數(shù)據(jù)中的模式規(guī)律
掌握使用Python進行數(shù)據(jù)分析全流程
學習對象
學生、轉(zhuǎn)行欲從業(yè)人士
在職數(shù)據(jù)分析師
對Python數(shù)據(jù)分析和挖掘感興趣的業(yè)界人士
學習前有統(tǒng)計基礎(chǔ)**
課程大綱
**階段:Python編程基礎(chǔ)與Pandas數(shù)據(jù)分析(線下)
1.數(shù)據(jù)分析的武器庫
2.數(shù)據(jù)分析工具Python介紹
3.Python的基本數(shù)據(jù)類型與數(shù)據(jù)結(jié)構(gòu)
4.Python的程序控制
5.Python的函數(shù)與模塊
6.使用Pandas讀取結(jié)構(gòu)化數(shù)據(jù)
7.描述性統(tǒng)計與探索型數(shù)據(jù)分析
8.Pandas高級:分組匯總及交叉表
9.使用Python繪制統(tǒng)計圖形
10.Pandas數(shù)據(jù)整合與數(shù)據(jù)清洗
第二階段:Mysql數(shù)據(jù)庫基礎(chǔ)(線上)
1.Mysql數(shù)據(jù)庫知識介紹
2.Mysql數(shù)據(jù)庫的基本操作
3.Mysql數(shù)據(jù)表的基本操作
4.數(shù)據(jù)類型和約束條件
5.數(shù)據(jù)的CRUD操作之增加、刪除、修改數(shù)據(jù)表
6.SQL數(shù)據(jù)庫單表查詢和聯(lián)合查詢
7.SQL操作符和函數(shù)
8.SQL綜合案例:彩票數(shù)據(jù)核對練習
9.SQL綜合案例:電商數(shù)據(jù)查詢練習
第三階段:數(shù)據(jù)分析之統(tǒng)計學基礎(chǔ)(線上)
1.數(shù)據(jù)分析行業(yè)與知識簡介
2.概率論基礎(chǔ)知識
3.描述性統(tǒng)計分析
4.統(tǒng)計量與抽樣分布
5.參數(shù)估計:點估計和區(qū)間估計
6.假設檢驗方法
7.方差分析的基本原理和操作
第四階段:使用Python進行網(wǎng)絡爬蟲(線下)
1.網(wǎng)絡爬蟲基礎(chǔ)知識
2.網(wǎng)絡請求及響應-requests庫
3.HTML文檔解析-BeautifulSoup庫
4.常見反爬蟲機制及應對
5.網(wǎng)絡爬蟲 VS 網(wǎng)絡數(shù)據(jù)抓取
6.實戰(zhàn)1:批量**頭像
7.實戰(zhàn)2:抓取豆瓣書籍簡介
8.實戰(zhàn)3:模擬瀏覽器selenium抓取電商商品信息及評論
第五階段:Python進行統(tǒng)計分析和回歸分析(線下)
1.使用Python SQL進行數(shù)據(jù)整合
2.使用Python進行描述性統(tǒng)計分析
3.使用Python進行數(shù)據(jù)清洗
4.使用Python進行數(shù)據(jù)分組與抽樣
5.使用Python進行統(tǒng)計推斷
6.使用線性回歸做客戶價值預測
7.使用邏輯回歸構(gòu)建初始信用評級
8.案例1:RFM分析方法獲取客戶消費行為信息
9.案例2:轉(zhuǎn)化漏斗與A/B Test
第六階段:Python進行降維分析(線下)
1.連續(xù)變量關(guān)系和探索變量壓縮:主成分因子分析
2.對應分析方法
3.多維尺度分析方法
4.案例1:經(jīng)濟數(shù)據(jù)降維與聚類分析
5.案例2:用戶特征與消費行為對應分析
6.案例3:美國城市地理位置分析
7.案例4:iris數(shù)據(jù)聚類-結(jié)合降維與數(shù)據(jù)預處理
第七階段:Python時間序列和綜合案例分析(線下)
1.時間序列分析簡介
2.時間序列模型介紹-AR和MA
3.平穩(wěn)的時間序列模型-ARMA
4.非平穩(wěn)的時間序列模型-ARIMA
5. BOX-JENKINS建模流程
6.案例:量化投資行業(yè)時間序列分析
7.尋找**模型
8.干預分析模型-ARMAX
9.企業(yè)案例1:電信公司網(wǎng)絡咨詢電話呼入人數(shù)預測
10.企業(yè)案例2:Google 關(guān)鍵字之Python 趨勢預測
第八階段:Python數(shù)據(jù)可視化(線上)
1.繪圖思想的基本原理
2.Python數(shù)據(jù)可視化包-Matplotlib介紹
3.使用Matplotlib進行基本的圖形繪制
4.使用Python數(shù)據(jù)處理包Pandas做可視化
5.Python數(shù)據(jù)可視化包-Seaborn與圖形繪制
6.Python數(shù)據(jù)可視化包-Pyecharts與圖形繪制
7.使用Python進行地圖繪制-Pyecharts
第九階段:期中項目作業(yè)與答辯(線下)
課題1:電商客戶價值預測
課題2:網(wǎng)站流量數(shù)據(jù)分析
課題3:信用卡客戶流失預警
課題4:銀行電話營銷響應分析
以上課題僅供參考
第十階段:Python數(shù)據(jù)挖掘基礎(chǔ)及數(shù)據(jù)前處理技術(shù)(線下)
1.R語言數(shù)據(jù)挖掘簡介
2.數(shù)據(jù)挖掘方法論CRISP-DM介紹
3.數(shù)據(jù)挖掘技術(shù)概述
4.數(shù)據(jù)前處理方法
5.關(guān)鍵變量發(fā)掘技術(shù)
第十一階段:Python實現(xiàn)預測型數(shù)據(jù)挖掘技術(shù)(線下)
1.初級分類器KNN算法與Python實現(xiàn)
2.樸素貝葉斯分類算法原理與實現(xiàn)
3.決策樹建模思路與原理
4.高級分類器-支持向量機算法
5.神經(jīng)網(wǎng)絡算法原理與實現(xiàn)
6.集成學習:Bagging、Boosting、隨機森林
7.案例1:使用決策樹進行初始信用評級
8.案例2:使用神經(jīng)網(wǎng)絡預測銷量高低
9.案例3:使用支持向量機進行水色圖像的水質(zhì)評價
第十二階段:Python進行描述性數(shù)據(jù)挖掘技術(shù)(線下)
1.聚類算法的概述
2.聚類算法基本概念
3.案例:通信客戶業(yè)務使用偏好聚類
4.關(guān)聯(lián)規(guī)則的一些基本概念
5.關(guān)聯(lián)規(guī)則Ariori算法的原理與Python實現(xiàn)
6.關(guān)聯(lián)規(guī)則FP-growth算法
7.序列模式的簡介與概念
8.序列模式AprioriAll算法與Python實現(xiàn)
9.基于用戶和商品的的協(xié)同過濾算法
第十三階段:期末項目作業(yè)與答辯(線下)
課題1:銀行客戶聚類分析
課題2:房貸客戶進件違約風險預測
課題3:零售業(yè)客戶忠誠預測
課題4:電信業(yè)營銷響應預測模型
以上課題僅供參考
**認證
** 經(jīng)管之家CDA LEVELⅢ數(shù)據(jù)科學家認證證書,行業(yè)頂尖人才認證,已獲得IBM大數(shù)據(jù)大學,中國電信,蘇寧,德勤,獵聘,CDMS等企業(yè)的認可。
專業(yè) CDA認證是根據(jù)商業(yè)數(shù)據(jù)分析專業(yè)崗位設立的一套體系化、科學化、正規(guī)化的人才標準。全國統(tǒng)考、專家命題、評分公平、流程嚴格,更具含金量。
權(quán)益 持證人享有系列特殊權(quán)益。證書皆綁定考生真實身份,可在CDA**查詢,確保唯一性與防偽性。證書三年審核一次,保證持證人的實力與權(quán)益。
倒計時
更多詳情請咨詢客服 13182834526
客服在線時間:9:00-22:00,其他時間請在線預約或留言,謝謝。南京CDA數(shù)據(jù)分析:南京秦淮區(qū)
本周僅剩 個試聽名額
請鍵入信息,稍后系統(tǒng)將會把領(lǐng)獎短信發(fā)至您的手機