推廣 熱搜： 2022 財(cái)務(wù) 微信法律張網(wǎng)格化管理營(yíng)銷總裁班安全

首頁(yè) > 內(nèi)訓(xùn)課 > 綜合管理 > Python數(shù)據(jù)建模

Python數(shù)據(jù)建模

【課程目標(biāo)】

本課程主要講解如何利用Python進(jìn)行時(shí)間序列的數(shù)據(jù)建模。

通過(guò)本課程的學(xué)習(xí)，達(dá)到如下目的：

1、掌握數(shù)據(jù)建模的標(biāo)準(zhǔn)流程。

2、掌握各種分類預(yù)測(cè)模型的原理，以及算法實(shí)現(xiàn)。

3、掌握各種分類模型類的重要參數(shù)，以及應(yīng)用。

4、掌握模型的評(píng)估指標(biāo)、評(píng)估方法，以及過(guò)擬合評(píng)估。

5、掌握模型優(yōu)化的基本方法，學(xué)會(huì)超參優(yōu)化。

6、掌握集成優(yōu)化思想，掌握高級(jí)的分類模型。

7、

【授課時(shí)間】

2-5天時(shí)間

（要根據(jù)學(xué)員的實(shí)際情況調(diào)整重點(diǎn)內(nèi)容及時(shí)間）

【授課對(duì)象】

業(yè)務(wù)支持部、IT系統(tǒng)部、大數(shù)據(jù)系統(tǒng)開(kāi)發(fā)部、大數(shù)據(jù)分析中心、網(wǎng)絡(luò)運(yùn)維部等相關(guān)技術(shù)人員。

【學(xué)員要求】

1、每個(gè)學(xué)員自備一臺(tái)便攜機(jī)(必須)。

2、便攜機(jī)中事先安裝好Python 3.9版本及以上。

3、安裝好Numpy,Pandas,statsmodels,sklearn,scipy等常用庫(kù)。

注：講師現(xiàn)場(chǎng)提供分析的數(shù)據(jù)源。

【授課方式】

建模流程+ 案例演練 + 開(kāi)發(fā)實(shí)踐 + 可視化呈現(xiàn)

采用互動(dòng)式教學(xué)，圍繞業(yè)務(wù)問(wèn)題，展開(kāi)數(shù)據(jù)分析過(guò)程，全過(guò)程演練操作，讓學(xué)員在分析、分享、講授、總結(jié)、自我實(shí)踐過(guò)程中獲得能力提升。

【課程大綱】

第一部分：預(yù)測(cè)建?；A(chǔ)

1、數(shù)據(jù)建模六步法

? 選擇模型：基于業(yè)務(wù)選擇恰當(dāng)?shù)臄?shù)據(jù)模型

? 屬性篩選：選擇對(duì)目標(biāo)變量有顯著影響的屬性來(lái)建模

? 訓(xùn)練模型：采用合適的算法，尋找到最合適的模型參數(shù)

? 評(píng)估模型：進(jìn)行評(píng)估模型的質(zhì)量，判斷模型是否可用

? 優(yōu)化模型：如果評(píng)估結(jié)果不理想，則需要對(duì)模型進(jìn)行優(yōu)化

? 應(yīng)用模型：如果評(píng)估結(jié)果滿足要求，則可應(yīng)用模型于業(yè)務(wù)場(chǎng)景

2、數(shù)據(jù)挖掘常用的模型

? 數(shù)值預(yù)測(cè)模型：回歸預(yù)測(cè)、時(shí)序預(yù)測(cè)等

? 分類預(yù)測(cè)模型：邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等

? 市場(chǎng)細(xì)分：聚類、RFM、PCA等

? 產(chǎn)品推薦：關(guān)聯(lián)分析、協(xié)同過(guò)濾等

? 產(chǎn)品優(yōu)化：回歸、隨機(jī)效用等

? 產(chǎn)品定價(jià)：定價(jià)策略/最優(yōu)定價(jià)等

3、屬性篩選/特征選擇/變量降維

? 基于變量本身特征

? 基于相關(guān)性判斷

? 因子合并（PCA等）

? IV值篩選（評(píng)分卡使用）

? 基于信息增益判斷（決策樹(shù)使用）

4、訓(xùn)練模型及實(shí)現(xiàn)算法

? 模型原理

? 算法實(shí)現(xiàn)

5、模型評(píng)估

? 評(píng)估指標(biāo)

? 評(píng)估方法

? 過(guò)擬合評(píng)估

6、模型優(yōu)化

? 優(yōu)化模型：選擇新模型/修改模型

? 優(yōu)化數(shù)據(jù)：新增顯著自變量

? 優(yōu)化公式：采用新的計(jì)算公式

7、模型應(yīng)用

? 模型解讀

? 模型部署

? 模型應(yīng)用

8、好模型是優(yōu)化出來(lái)的

第二部分：分類模型評(píng)估

1、三個(gè)方面評(píng)估：指標(biāo)、方法、過(guò)擬合

2、兩大矩陣

? 混淆矩陣

? 代價(jià)矩陣

3、六大指標(biāo)

? 正確率Accuracy

? 查準(zhǔn)率Precision

? 查全率Recall

? 特異度Specify

? F度量值（/）

? 提升指標(biāo)lift

4、三條曲線

? ROC曲線和AUC

? PR曲線和BEP

? KS曲線和KS值

5、多分類模型評(píng)估指標(biāo)

? 宏指標(biāo)：macro_P, macro_R

? 宏指標(biāo)：micro_P, micro_R

6、模型評(píng)估方法

? 原始評(píng)估法

? 留出法（Hold-Out）

? 交叉驗(yàn)證法（k-fold cross validation）

? 自助采樣法（Bootstrapping）

7、其它評(píng)估

? 過(guò)擬合評(píng)估：學(xué)習(xí)曲線

? 殘差評(píng)估：白噪聲評(píng)估

第三部分：邏輯回歸

問(wèn)題：如何評(píng)估客戶購(gòu)買產(chǎn)品的可能性？如何預(yù)測(cè)客戶行為？

如何預(yù)測(cè)客戶流失？銀行如何實(shí)現(xiàn)欠貸風(fēng)險(xiǎn)控制？

1、邏輯回歸模型簡(jiǎn)介

2、邏輯回歸的種類

? 二項(xiàng)邏輯回歸

? 多項(xiàng)邏輯回歸

3、邏輯回歸方程解讀

4、帶分類自變量的邏輯回歸

5、邏輯回歸的算法實(shí)現(xiàn)及優(yōu)化

? 迭代樣本的隨機(jī)選擇

? 變化的學(xué)習(xí)率

6、邏輯回歸+正則項(xiàng)

7、求解算法與懲罰項(xiàng)的互斥關(guān)系

8、多元邏輯回歸處理

? ovo

? ovr

9、邏輯回歸建模過(guò)程

案例：用sklearn庫(kù)實(shí)現(xiàn)銀行貸款違約預(yù)測(cè)

案例：訂閱者用戶的典型特征（二元邏輯回歸）

案例：通信套餐的用戶畫(huà)像（多元邏輯回歸）

第四部分：決策樹(shù)

1、分類決策樹(shù)簡(jiǎn)介

演練：識(shí)別銀行欠貨風(fēng)險(xiǎn)，提取欠貸者的特征

2、決策樹(shù)的三個(gè)關(guān)鍵問(wèn)題

? 最優(yōu)屬性選擇

2 熵、基尼系數(shù)

2 信息增益、信息增益率

? 屬性最佳劃分

2 多元?jiǎng)澐峙c二元?jiǎng)澐?/span>

2 連續(xù)變量最優(yōu)劃分

? 決策樹(shù)修剪

2 剪枝原則

2 預(yù)剪枝與后剪枝

3、構(gòu)建決策樹(shù)的算法

? C5.0、CHAID、CART、QUEST

? 各種算法的比較

4、決策樹(shù)的超參優(yōu)化

5、決策樹(shù)的解讀

6、決策樹(shù)建模過(guò)程

案例：商場(chǎng)酸奶購(gòu)買用戶特征提取

案例：客戶流失預(yù)警與客戶挽留

案例：識(shí)別拖欠銀行貨款者的特征，避免不良貨款

案例：識(shí)別電信詐騙者嘴臉，讓通信更安全

案例：電力竊漏用戶自動(dòng)識(shí)別

第五部分：人工神經(jīng)網(wǎng)絡(luò)

1、神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介（ANN）

2、神經(jīng)元基本原理

? 加法器

? 激活函數(shù)

3、神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)

? 隱藏層數(shù)量

? 神經(jīng)元個(gè)數(shù)

4、神經(jīng)網(wǎng)絡(luò)的建立步驟

5、神經(jīng)網(wǎng)絡(luò)的關(guān)鍵問(wèn)題

6、 BP算法實(shí)現(xiàn)

7、 MLP多層神經(jīng)網(wǎng)絡(luò)

案例：評(píng)估銀行用戶拖欠貨款的概率

案例：神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)產(chǎn)品銷量

第六部分：線性判別分析（LDA）

1、判別分析簡(jiǎn)介

? 基本思想

2、判別分析種類

3、判別分析算法

? 類間散席

? 類內(nèi)散席

4、 LDA線性判別模型

5、多分類判別分析

案例：MBA學(xué)生錄取判別分析

案例：上市公司類別評(píng)估

第七部分：最近鄰分類（KNN）

1、 KNN的基本原理

2、 K近鄰的關(guān)鍵問(wèn)題

3、 K近鄰的實(shí)現(xiàn)算法

? Brute暴力計(jì)算

? Kd_tree

? Ball_tre

第八部分：樸素貝葉斯分類（NBN）

1、貝葉斯簡(jiǎn)介

2、貝葉斯分類原理

? 先驗(yàn)概率和后驗(yàn)概率

? 條件概率和類概率

3、常見(jiàn)貝葉斯網(wǎng)絡(luò)

4、計(jì)算類別屬性的條件概率

5、估計(jì)連續(xù)屬性的條件概率

6、預(yù)測(cè)分類概率（計(jì)算概率）

7、拉普拉斯修正

案例：評(píng)估銀行用戶拖欠貨款的概率

第九部分：支持向量機(jī)（SVM）

1、支持向量機(jī)簡(jiǎn)介

? 適用場(chǎng)景

2、支持向量機(jī)原理

? 支持向量

? 最大邊界超平面

3、線性不可分處理

? 松弛系數(shù)

4、非線性SVM分類

5、常用核函數(shù)

? 線性核函數(shù)

? 多項(xiàng)式核

? 高斯RBF核

? 核函數(shù)的選擇原則

6、 SMO算法

第十部分：模型集成優(yōu)化篇

1、模型的優(yōu)化思想

2、集成模型的框架

? Bagging

? Boosting

? Stacking

3、集成算法的關(guān)鍵過(guò)程

? 弱分類器如何構(gòu)建

? 組合策略：多個(gè)弱學(xué)習(xí)器如何形成強(qiáng)學(xué)習(xí)器

4、 Bagging集成算法

? 數(shù)據(jù)/屬性重抽樣

? 決策依據(jù)：少數(shù)服從多數(shù)

? 隨機(jī)森林RandomForest

5、 Boosting集成算法

? 基于誤分?jǐn)?shù)據(jù)建模

? 樣本選擇權(quán)重更新

? 決策依據(jù)：加權(quán)投票

? AdaBoost模型

6、 GBDT模型

7、 XGBoost模型

8、 LightGBM模型

第十一部分：案例實(shí)戰(zhàn)

1、客戶流失預(yù)測(cè)和客戶挽留模型

2、銀行欠貸風(fēng)險(xiǎn)預(yù)測(cè)模型

結(jié)束：課程總結(jié)與問(wèn)題答疑。

下一課程：Python數(shù)據(jù)挖掘?qū)ｎ}實(shí)戰(zhàn)培訓(xùn)
上一課程：Python數(shù)據(jù)建模

點(diǎn)贊 0反對(duì) 0舉報(bào) 0 收藏 0

更多>與Python數(shù)據(jù)建模相關(guān)內(nèi)訓(xùn)課

企業(yè)家經(jīng)營(yíng)哲學(xué)與企業(yè)經(jīng)營(yíng)之道

企業(yè)家經(jīng)營(yíng)哲學(xué)與企業(yè)

高效執(zhí) 行

教練式經(jīng)銷商管理

商業(yè)模式創(chuàng)新

創(chuàng)新思維管理應(yīng)用訓(xùn)練?—?jiǎng)?chuàng)造性解決問(wèn)題

創(chuàng)新思維管理應(yīng)用訓(xùn)練

創(chuàng)新思維和有效執(zhí)行

微課的設(shè)計(jì)與制作

高效能主管風(fēng)暴訓(xùn)練營(yíng)

傅一航老師介紹>傅一航老師其它課程

大數(shù)據(jù)產(chǎn)業(yè)現(xiàn)狀及應(yīng)用創(chuàng)新

大數(shù)據(jù)產(chǎn)業(yè)現(xiàn)狀及應(yīng)用

大數(shù)據(jù)挖掘工具:SPSS

大數(shù)據(jù)挖掘工具: SPSS

大數(shù)據(jù)建模與模型優(yōu)化實(shí)戰(zhàn)培訓(xùn)

大數(shù)據(jù)建模與模型優(yōu)化

金融行業(yè)風(fēng)險(xiǎn)預(yù)測(cè)模型實(shí)戰(zhàn)

金融行業(yè)風(fēng)險(xiǎn)預(yù)測(cè)模型

數(shù)說(shuō)營(yíng)銷——大數(shù)據(jù)營(yíng)銷實(shí)戰(zhàn)培訓(xùn)

數(shù)說(shuō)營(yíng)銷——大數(shù)據(jù)營(yíng)

大數(shù)據(jù)分析與挖掘綜合

助力市場(chǎng)營(yíng)銷與服務(wù)的數(shù)據(jù)分析實(shí)戰(zhàn)

助力市場(chǎng)營(yíng)銷與服務(wù)的

京公網(wǎng)安備 11011502001314號(hào)

主講老師：	傅一航	主講師資：傅一航
課時(shí)安排：	1天/6小時(shí)
學(xué)習(xí)費(fèi)用：	面議
課程預(yù)約：	隋老師 (微信同號(hào))
課程簡(jiǎn)介：	1、掌握數(shù)據(jù)建模的標(biāo)準(zhǔn)流程。 2、掌握各種分類預(yù)測(cè)模型的原理，以及算法實(shí)現(xiàn)。 3、掌握各種分類模型類的重要參數(shù)，以及應(yīng)用。
內(nèi)訓(xùn)課程分類：	綜合管理 \| 人力資源 \| 市場(chǎng)營(yíng)銷 \| 財(cái)務(wù)稅務(wù) \| 基層管理 \| 中層管理 \| 領(lǐng)導(dǎo)力 \| 管理溝通 \| 薪酬績(jī)效 \| 企業(yè)文化 \| 團(tuán)隊(duì)管理 \| 行政辦公 \| 公司治理 \| 股權(quán)激勵(lì) \| 生產(chǎn)管理 \| 采購(gòu)物流 \| 項(xiàng)目管理 \| 安全管理 \| 質(zhì)量管理 \| 員工管理 \| 班組管理 \| 職業(yè)技能 \| 互聯(lián)網(wǎng)+ \| 新媒體 \| TTT培訓(xùn) \| 禮儀服務(wù) \| 商務(wù)談判 \| 演講培訓(xùn) \| 宏觀經(jīng)濟(jì) \| 趨勢(shì)發(fā)展 \| 金融資本 \| 商業(yè)模式 \| 戰(zhàn)略運(yùn)營(yíng) \| 法律風(fēng)險(xiǎn) \| 沙盤模擬 \| 國(guó)企改革 \| 鄉(xiāng)村振興 \| 黨建培訓(xùn) \| 保險(xiǎn)培訓(xùn) \| 銀行培訓(xùn) \| 電信領(lǐng)域 \| 房地產(chǎn) \| 國(guó)學(xué)智慧 \| 心理學(xué) \| 情緒管理 \| 時(shí)間管理 \| 目標(biāo)管理 \| 客戶管理 \| 店長(zhǎng)培訓(xùn) \| 新能源 \| 數(shù)字化轉(zhuǎn)型 \| 工業(yè)4.0 \| 電力行業(yè) \|
更新時(shí)間：	2023-09-01 11:27

Python數(shù)據(jù)建模

第一部分： 預(yù)測(cè)建?；A(chǔ)

第二部分： 分類模型評(píng)估

第三部分： 邏輯回歸

第四部分： 決策樹(shù)

第五部分： 人工神經(jīng)網(wǎng)絡(luò)

第六部分： 線性判別分析（LDA）

第七部分： 最近鄰分類（KNN）

第八部分： 樸素貝葉斯分類（NBN）

第九部分： 支持向量機(jī)（SVM）

第十部分： 模型集成優(yōu)化篇

第十一部分： 案例實(shí)戰(zhàn)