主講老師: | 傅一航 | |
課時安排: | 1天/6小時 | |
學習費用: | 面議 | |
課程預約: | 隋老師 (微信同號) | |
課程簡介: | 本課程的主要目的是,培養(yǎng)學員的大數據意識和大數據思維,掌握常用的數據分析方法和數據分析模型,并能夠用于對客戶行為作分析和預測,提升學員的數據分析綜合能力。 | |
內訓課程分類: | 綜合管理 | 人力資源 | 市場營銷 | 財務稅務 | 基層管理 | 中層管理 | 領導力 | 管理溝通 | 薪酬績效 | 企業(yè)文化 | 團隊管理 | 行政辦公 | 公司治理 | 股權激勵 | 生產管理 | 采購物流 | 項目管理 | 安全管理 | 質量管理 | 員工管理 | 班組管理 | 職業(yè)技能 | 互聯網+ | 新媒體 | TTT培訓 | 禮儀服務 | 商務談判 | 演講培訓 | 宏觀經濟 | 趨勢發(fā)展 | 金融資本 | 商業(yè)模式 | 戰(zhàn)略運營 | 法律風險 | 沙盤模擬 | 國企改革 | 鄉(xiāng)村振興 | 黨建培訓 | 保險培訓 | 銀行培訓 | 電信領域 | 房地產 | 國學智慧 | 心理學 | 情緒管理 | 時間管理 | 目標管理 | 客戶管理 | 店長培訓 | 新能源 | 數字化轉型 | 工業(yè)4.0 | 電力行業(yè) | | |
更新時間: | 2023-09-01 12:27 |
【課程目標】
本課程專注于金融行業(yè)的風控模型,面向數據分析部等專門負責數據分析與建模的人士。
本課程的主要目的是,培養(yǎng)學員的大數據意識和大數據思維,掌握常用的數據分析方法和數據分析模型,并能夠用于對客戶行為作分析和預測,提升學員的數據分析綜合能力。
通過本課程的學習,達到如下目的:
1、 掌握數據分析和數據建模的基本過程和步驟
2、 掌握客戶行為分析中常用的分析方法
3、 掌握業(yè)務的影響因素分析常用的方法
4、 掌握常用客戶行為預測模型,包括邏輯回歸、決策樹、神經網絡、判別分析等等,以及分類模型的優(yōu)化
5、 掌握金融行業(yè)信用評分卡模型,構建信用評分模型
本課程突出數據挖掘的實際應用,結合行業(yè)的典型應用特點,從實際問題入手,引出相關知識,進行大數據的收集與處理;探索數據之間的規(guī)律及關聯性,幫助學員掌握系統(tǒng)的數據預處理方法;介紹常用的模型,訓練模型,并優(yōu)化模型,以達到最優(yōu)分析結果。
【授課時間】
2-3天時間(每天6個小時)
【授課對象】
風險控制部、業(yè)務支撐、網絡中心、IT系統(tǒng)部、數據分析部等對數據建模有較高要求的相關領域人員。
【學員要求】
1、 每個學員自備一臺便攜機(必須)。
2、 便攜機中事先安裝好Office Excel 2013版本及以上。
3、 便攜機中事先安裝好IBM SPSS Statistics v24版本以上軟件。
注:講師可以提供試用版本軟件及分析數據源。
【授課方式】
理論精講 + 案例演練 + 實際業(yè)務問題分析 + SPSS實際操作
【課程大綱】
問題:什么是數據思維?大數據決策的底層邏輯以及決策依據是什么?
1、 數字化五大技術戰(zhàn)略:ABCDI戰(zhàn)略
? A:人工智能,目的是用機器模擬人類行為
? B:區(qū)塊鏈,構建不可篡改的分布記賬系統(tǒng)
? C:云計算,搭建按需分配的計算資源平臺
? D:大數據,實現智能化的判斷和決策機制
? I:物聯網,實現萬物互聯通信的基礎架構
2、 大數據的本質
? 數據,是事物發(fā)展和變化過程中留下的痕跡
? 大數據不在于量大,而在于全(多維性)
? 業(yè)務導向還是技術導向
3、 大數據決策的底層邏輯(即四大核心價值)
? 探索業(yè)務規(guī)律,按規(guī)律來管理決策
案例:客流規(guī)律與排班及最佳營銷時機
案例:致命交通事故發(fā)生的時間規(guī)律
? 發(fā)現運營變化,定短板來運營決策
案例:考核周期導致的員工月初懈怠
案例:工序信號異常監(jiān)測設備故障
? 理清要素關系,找影響因素來決策
案例:情緒對于股市漲跌的影響
案例:為何升職反而會增加離職風險?
? 預測未來趨勢,通過預判進行決策
案例:惠普預測員工離職風險及挽留
案例:保險公司的車險預測與個性化保費定價
4、 大數據決策的三個關鍵環(huán)節(jié)
? 業(yè)務數據化:將業(yè)務問題轉化為數據問題
? 數據信息化:提取數據中的業(yè)務規(guī)律信息
? 信息策略化:基于規(guī)律形成業(yè)務應對策略
案例:用數據來識別喜歡賺“差價”的營業(yè)員
1、 數據分析的六步曲
2、 步驟1:明確目的,確定分析思路
? 確定分析目的:要解決什么樣的業(yè)務問題
? 確定分析思路:分解業(yè)務問題,構建分析框架
3、 步驟2:收集數據,尋找分析素材
? 明確數據范圍
? 確定收集來源
? 確定收集方法
4、 步驟3:整理數據,確保數據質量
? 數據質量評估
? 數據清洗、數據處理和變量處理
? 探索性分析
5、 步驟4:分析數據,尋找業(yè)務答案
? 選擇合適的分析方法
? 構建合適的分析模型
? 選擇合適的分析工具
6、 步驟5:呈現數,解讀業(yè)務規(guī)律
? 選擇恰當的圖表
? 選擇合適的可視化工具
? 提煉業(yè)務含義
7、 步驟6:撰寫報告,形成業(yè)務策略
? 選擇報告種類
? 完整的報告結構
演練:產品精準營銷案例分析
? 如何搭建精準營銷分析框架
? 精準營銷分析的過程和步驟
問題:數據分析方法的種類?分析方法的不同應用場景?
1、 業(yè)務分析的三個階段
? 現狀分析:通過企業(yè)運營指標來發(fā)現規(guī)律及短板
? 原因分析:查找數據相關性,探尋目標影響因素
? 預測分析:合理配置資源,預判業(yè)務未來的趨勢
2、 常用的數據分析方法種類
? 描述性分析法(對比/分組/結構/趨勢/交叉…)
? 相關性分析法(相關/方差/卡方…)
? 預測性分析法(回歸/時序/決策樹/神經網絡…)
? 專題性分析法(聚類/關聯/RFM模型/…)
3、 統(tǒng)計分析基礎
? 統(tǒng)計分析兩大關鍵要素(類別、指標)
? 統(tǒng)計分析的操作模式(類別à指標)
? 統(tǒng)計分析三個操作步驟(統(tǒng)計、畫圖、解讀)
? 透視表的三個組成部分
4、 常用的描述性指標
? 集中程度:均值、中位數、眾數
? 離散程度:極差、方差/標準差、IQR
? 分布形態(tài):偏度、峰度
5、 基本分析方法及其適用場景
? 對比分析(查看數據差距,發(fā)現事物變化)
演練:尋找用戶的地域分布特征
演練:分析產品受歡迎情況及貢獻大小
演練:用數據來探索增量不增收困境的解決方案
? 分布分析(查看數據分布,探索業(yè)務層次)
演練:銀行用戶的消費水平和消費層次分析
演練:客戶年齡分布/收入分布分析
案例:通信運營商的流量套餐劃分合理性的評估
演練:呼叫中心接聽電話效率分析(呼叫中心)
? 結構分析(查看指標構成,評估結構合理性)
案例:增值業(yè)務收入結構分析(通信)
案例:物流費用成本結構分析(物流)
案例:中移動用戶群動態(tài)結構分析
演練:財務領域的結構瀑布圖、財務收支的變化瀑布圖
? 趨勢分析(發(fā)現事物隨時間的變化規(guī)律)
案例:破解零售店銷售規(guī)律
案例:手機銷量的淡旺季分析
案例:微信用戶的活躍時間規(guī)律
演練:發(fā)現客流量的時間規(guī)律
? 交叉分析(從多個維度的數據指標分析)
演練:用戶性別+地域分布分析
演練:不同客戶的產品偏好分析
演練:不同學歷用戶的套餐偏好分析
演練:銀行用戶的違約影響因素分析
問題:如何才能全面/系統(tǒng)地分析而不遺漏?如何分解和細化業(yè)務問題?
1、 業(yè)務分析思路和分析框架來源于業(yè)務模型
2、 常用的業(yè)務模型
? 外部環(huán)境分析:PEST
? 業(yè)務專題分析:5W2H
? 競品/競爭分析:SWOT、波特五力
? 營銷市場專題分析:4P/4C等
3、 用戶行為分析(5W2H分析思路和框架)
? WHY:原因(用戶需求、產品亮點、競品優(yōu)劣勢)
? WHAT:產品(產品喜好、產品貢獻、產品功能、產品結構)
? WHO:客戶(基本特征、消費能力、產品偏好)
? WHEN:時間(淡旺季、活躍時間、重購周期)
? WHERE:區(qū)域/渠道(區(qū)域喜好、渠道偏好)
? HOW:支付/促銷(支付方式、促銷方式有效性評估等)
? HOW MUCH:價格(費用、成本、利潤、收入結構、價格偏好等)
案例討論:結合公司情況,搭建用戶消費習慣的分析框架(5W2H)
1、 預測建模六步法
? 選擇模型:基于業(yè)務選擇恰當的數據模型
? 特征工程:選擇對目標變量有顯著影響的屬性來建模
? 訓練模型:采用合適的算法對模型進行訓練,尋找到最優(yōu)參數
? 評估模型:進行評估模型的質量,判斷模型是否可用
? 優(yōu)化模型:如果評估結果不理想,則需要對模型進行優(yōu)化
? 應用模型:如果評估結果滿足要求,則可應用模型于業(yè)務場景
2、 數據挖掘常用的模型
? 定量預測模型:回歸預測、時序預測等
? 定性預測模型:邏輯回歸、決策樹、神經網絡、支持向量機等
? 市場細分:聚類、RFM、PCA等
? 產品推薦:關聯分析、協(xié)同過濾等
? 產品優(yōu)化:回歸、隨機效用等
? 產品定價:定價策略/最優(yōu)定價等
3、 特征工程/特征選擇/變量降維
? 基于變量本身特征
? 基于相關性判斷
? 因子合并(PCA等)
? IV值篩選(評分卡使用)
? 基于信息增益判斷(決策樹使用)
4、 模型評估
? 模型質量評估指標:R^2、正確率/查全率/查準率/特異性等
? 預測值評估指標:MAD、MSE/RMSE、MAPE、概率等
? 模型評估方法:留出法、K拆交叉驗證、自助法等
? 其它評估:過擬合評估、殘差檢驗
5、 模型優(yōu)化
? 優(yōu)化模型:選擇新模型/修改模型
? 優(yōu)化數據:新增顯著自變量
? 優(yōu)化公式:采用新的計算公式
? 集成思想:Bagging/Boosting/Stacking
6、 常用預測模型介紹
? 時序預測模型
? 回歸預測模型
? 分類預測模型
問題:如何選擇合適的屬性/特征來建模呢?選擇的依據是什么?比如價格是否可用于產品銷量預測?
1、 數據預處理vs特征工程
2、 特征工程處理內容
? 變量變換
? 變量派生
? 變量精簡(特征選擇、因子合并)
? 類型轉換
3、 特征選擇常用方法
? 相關分析、方差分析、卡方檢驗
4、 相關分析(衡量兩數據型變量的線性相關性)
? 相關分析簡介
? 相關分析的應用場景
? 相關分析的種類
2 簡單相關分析
2 偏相關分析
2 距離相關分析
? 相關系數的三種計算公式
2 Pearson相關系數
2 Spearman相關系數
2 Kendall相關系數
? 相關分析的假設檢驗
? 相關分析的四個基本步驟
演練:營銷費用會影響銷售額嗎?影響程度如何量化?
演練:哪些因素與汽車銷量有相關性
演練:影響用戶消費水平的因素會有哪些
? 偏相關分析
2 偏相關原理:排除不可控因素后的兩變量的相關性
2 偏相關系數的計算公式
2 偏相關分析的適用場景
? 距離相關分析
5、 方差分析(衡量類別變量與數值變量間的相關性)
? 方差分析的應用場景
? 方差分析的三個種類
2 單因素方差分析
2 多因素方差分析
2 協(xié)方差分析
? 單因素方差分析的原理
? 方差分析的四個步驟
? 解讀方差分析結果的兩個要點
演練:擺放位置與銷量有關嗎
演練:客戶學歷對消費水平的影響分析
演練:廣告和價格是影響終端銷量的關鍵因素嗎
演練:營業(yè)員的性別、技能級別對產品銷量有影響嗎
演練:尋找影響產品銷量的關鍵因素
? 多因素方差分析原理
? 多因素方差分析的作用
? 多因素方差結果的解讀
演練:廣告形式、地區(qū)對銷量的影響因素分析
? 協(xié)方差分析原理
? 協(xié)方差分析的適用場景
演練:排除產品價格,收入對銷量有影響嗎?
6、 列聯分析/卡方檢驗(兩類別變量的相關性分析)
? 交叉表與列聯表:計數值與期望值
? 卡方檢驗的原理
? 卡方檢驗的幾個計算公式
? 列聯表分析的適用場景
案例:套餐類型對客戶流失的影響分析
案例:學歷對業(yè)務套餐偏好的影響分析
案例:行業(yè)/規(guī)模對風控的影響分析
問題:如何評估客戶購買產品的可能性?如何預測客戶的購買行為?如何提取某類客戶的典型特征?如何向客戶精準推薦產品或業(yè)務?
1、 分類模型概述及其應用場景
2、 常見分類預測模型
3、 邏輯回歸(LR)
? 邏輯回歸的適用場景
? 邏輯回歸的模型原理
? 邏輯回歸分類的幾何意義
? 邏輯回歸的種類
2 二項邏輯回歸
2 多項邏輯回歸
? 如何解讀邏輯回歸方程
? 帶分類自變量的邏輯回歸分析
? 多項邏輯回歸/多分類邏輯回歸
案例:如何評估用戶是否會購買某產品(二項邏輯回歸)
案例:多品牌選擇模型分析(多項邏輯回歸)
4、 分類決策樹(DT)
問題:如何預測客戶行為?如何識別潛在客戶?
風控:如何識別欠貸者的特征,以及預測欠貸概率?
客戶保有:如何識別流失客戶特征,以及預測客戶流失概率?
? 決策樹分類簡介
案例:美國零售商(Target)如何預測少女懷孕
演練:識別銀行欠貨風險,提取欠貸者的特征
? 決策樹分類的幾何意義
? 構建決策樹的三個關鍵問題
2 如何選擇最佳屬性來構建節(jié)點
2 如何分裂變量
2 修剪決策樹
? 選擇最優(yōu)屬性生長
2 熵、基尼索引、分類錯誤
2 屬性劃分增益
? 如何分裂變量
2 多元劃分與二元劃分
2 連續(xù)變量離散化(最優(yōu)分割點)
? 修剪決策樹
2 剪枝原則
2 預剪枝與后剪枝
? 構建決策樹的四個算法
2 C5.0、CHAID、CART、QUEST
2 各種算法的比較
? 如何選擇最優(yōu)分類模型?
案例:商場用戶的典型特征提取
案例:客戶流失預警與客戶挽留
案例:識別拖欠銀行貨款者的特征,避免不良貨款
案例:識別電信詐騙者嘴臉,讓通信更安全
? 多分類決策樹
案例:不同套餐用戶的典型特征
? 決策樹模型的保存與應用
5、 人工神經網絡(ANN)
? 神經網絡概述
? 神經網絡基本原理
? 神經網絡的結構
? 神經網絡分類的幾何意義
? 神經網絡的建立步驟
? 神經網絡的關鍵問題
? BP反向傳播網絡(MLP)
? 徑向基網絡(RBF)
案例:評估銀行用戶拖欠貨款的概率
6、 判別分析(DA)
? 判別分析原理
? 判別分析種類
? Fisher線性判別分析
案例:MBA學生錄取判別分析
案例:上市公司類別評估
7、 最近鄰分類(KNN)
? KNN模型的基本原理
? KNN分類的幾何意義
? K近鄰的關鍵問題
8、 支持向量機(SVM)
? SVM基本原理
? 線性可分問題:最大邊界超平面
? 線性不可分問題:特征空間的轉換
? 維災難與核函數
9、 貝葉斯分類(NBN)
? 貝葉斯分類原理
? 計算類別屬性的條件概率
? 估計連續(xù)屬性的條件概率
? 預測分類概率(計算概率)
? 拉普拉斯修正
案例:評估銀行用戶拖欠貨款的概率
1、 模型的評估指標
? 兩大矩陣:混淆矩陣,代價矩陣
? 六大指標:Acc,P,R,Spec,F1,lift
? 三條曲線:
2 ROC曲線和AUC
2 PR曲線和BEP
2 KS曲線和KS值
2、 模型的評估方法
? 原始評估法
? 留出法(Hold-Out)
? 交叉驗證法(k-fold cross validation)
? 自助采樣法(Bootstrapping)
1、 模型的優(yōu)化思路
2、 集成算法基本原理
? 單獨構建多個弱分類器
? 多個弱分類器組合投票,決定預測結果
3、 集成方法的種類
? Bagging
? Boosting
? Stacking
4、 Bagging集成
? 數據/屬性重抽樣
? 決策依據:少數服從多數
? 典型模型:隨機森林RF
5、 Boosting集成
? 基于誤分數據建模
? 樣本選擇權重更新公式
? 決策依據:加權投票
? 典型模型:AdaBoost模型
1、 信用評分卡模型簡介
2、 評分卡的關鍵問題
3、 信用評分卡建立過程
? 篩選重要屬性
? 數據集轉化
? 建立分類模型
? 計算屬性分值
? 確定審批閾值
4、 篩選重要屬性
? 屬性分段
? 基本概念:WOE、IV
? 屬性重要性評估
5、 數據集轉化
? 連續(xù)屬性最優(yōu)分段
? 計算屬性取值的WOE
6、 建立分類模型
? 訓練邏輯回歸模型
? 評估模型
? 得到字段系數
7、 計算屬性分值
? 計算補償與刻度值
? 計算各字段得分
? 生成評分卡
8、 確定審批閾值
? 畫K-S曲線
? 計算K-S值
? 獲取最優(yōu)閾值
案例:構建銀行小額貸款的用戶信用模型
1、 電信業(yè)客戶流失預警和客戶挽留模型實戰(zhàn)
2、 銀行欠貸風險預測模型實戰(zhàn)
3、 銀行信用卡評分模型實戰(zhàn)
結束:課程總結與問題答疑。
京公網安備 11011502001314號