推廣 熱搜: 2022  財務  微信  法律    網(wǎng)格化  管理  營銷  總裁班  安全 

Python實現(xiàn)大數(shù)據(jù)挖掘技術培訓

主講老師: 傅一航 傅一航

主講師資:傅一航

課時安排: 1天/6小時
學習費用: 面議
課程預約: 隋老師 (微信同號)
課程簡介: 在數(shù)據(jù)挖掘標準過程指導下,采用Python分析工具,實現(xiàn)數(shù)據(jù)挖掘項目的每一步操作,從數(shù)據(jù)預處理、數(shù)據(jù)建模、數(shù)據(jù)可視化,到最終數(shù)據(jù)挖掘結(jié)束,幫助學員掌握Python用于數(shù)據(jù)挖掘,提升學員的數(shù)據(jù)化運營及數(shù)據(jù)挖掘的能力。
內(nèi)訓課程分類: 綜合管理 | 人力資源 | 市場營銷 | 財務稅務 | 基層管理 | 中層管理 | 領導力 | 管理溝通 | 薪酬績效 | 企業(yè)文化 | 團隊管理 | 行政辦公 | 公司治理 | 股權(quán)激勵 | 生產(chǎn)管理 | 采購物流 | 項目管理 | 安全管理 | 質(zhì)量管理 | 員工管理 | 班組管理 | 職業(yè)技能 | 互聯(lián)網(wǎng)+ | 新媒體 | TTT培訓 | 禮儀服務 | 商務談判 | 演講培訓 | 宏觀經(jīng)濟 | 趨勢發(fā)展 | 金融資本 | 商業(yè)模式 | 戰(zhàn)略運營 | 法律風險 | 沙盤模擬 | 國企改革 | 鄉(xiāng)村振興 | 黨建培訓 | 保險培訓 | 銀行培訓 | 電信領域 | 房地產(chǎn) | 國學智慧 | 心理學 | 情緒管理 | 時間管理 | 目標管理 | 客戶管理 | 店長培訓 | 新能源 | 數(shù)字化轉(zhuǎn)型 | 工業(yè)4.0 | 電力行業(yè) |
更新時間: 2023-09-01 11:21


課程目標】

Python已經(jīng)成為數(shù)據(jù)分析和數(shù)據(jù)挖掘的首選語言,作為除了Java、C/C++/C#外最受歡迎的語言。

本課程基于Python工具來實現(xiàn)大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘項目。基于業(yè)務問題,在數(shù)據(jù)挖掘標準過程指導下,采用Python分析工具,實現(xiàn)數(shù)據(jù)挖掘項目的每一步操作,從數(shù)據(jù)預處理、數(shù)據(jù)建模、數(shù)據(jù)可視化,到最終數(shù)據(jù)挖掘結(jié)束,幫助學員掌握Python用于數(shù)據(jù)挖掘,提升學員的數(shù)據(jù)化運營及數(shù)據(jù)挖掘的能力。

通過本課程的學習,達到如下目的:

1、 全面掌握Python語言以及其編程思想。

2、 掌握常用擴展庫的使用,特別是數(shù)據(jù)挖掘相關庫的使用

3、 學會使用Python完成數(shù)據(jù)挖掘項目整個過程。

4、 掌握利用Python實現(xiàn)可視化呈現(xiàn)。

5、 掌握數(shù)據(jù)挖掘常見算法在Python中的實現(xiàn)。

【授課時間】

2~5天時間

(全部模塊講完需要5天時間,可以根據(jù)時間需求拆分內(nèi)容模塊)。

【授課對象】

業(yè)務支持部、IT系統(tǒng)部、大數(shù)據(jù)系統(tǒng)開發(fā)、大數(shù)據(jù)分析中心、網(wǎng)絡運維部等相關技術人員。

【學員要求】

課程為實戰(zhàn)課程,要求:

1、 每個學員自備一臺便攜機(必須)。

2、 便攜機中事先安裝好Python 3.6版本及以上。

注:講師現(xiàn)場提供開源的安裝程序、擴展庫,以及現(xiàn)場分析的數(shù)據(jù)源。

 

【授課方式】

語言基礎 + 挖掘模型 + 案例演練 + 開發(fā)實踐 + 可視化呈現(xiàn)

采用互動式教學,圍繞業(yè)務問題,展開數(shù)據(jù)分析過程,全過程演練操作,讓學員在分析、分享、講授、總結(jié)、自我實踐過程中獲得能力提升。

課程大綱】

第一部分: Python語言基礎

目的:掌握基本的Python編程思想與編程語句,熟悉常用數(shù)據(jù)結(jié)構(gòu)的操作

1、 Python簡介

2、 開發(fā)環(huán)境搭建

Python的安裝

擴展庫的安裝

3、 掌握Python的簡單數(shù)據(jù)類型

 字符串的使用及操作

整數(shù)、浮點數(shù)

4、 掌握基本語句:

if、while、for、print等

基本運算:

函數(shù)定義、參數(shù)傳遞、返回值

5、 掌握復雜的數(shù)據(jù)類型:列表/元組

列表操作:訪問、添加、修改、刪除、排序

列表切片、復制等

列表相關的函數(shù)、方法

元組的應用

6、 復雜數(shù)據(jù)類型:字典

創(chuàng)建、訪問、修改、刪除、遍歷

字典函數(shù)和方法

7、 復雜數(shù)據(jù)類型:集合

8、 掌握面向?qū)ο缶幊趟枷?/span>

創(chuàng)建類、繼承類

模塊

9、 函數(shù)定義、參數(shù)傳遞、返回值

10、 標準庫與擴展庫的導入

11、 異常處理:try-except

演練基本的Python編程語句

 

第二部分: Python擴展庫

目的:掌握數(shù)據(jù)集結(jié)構(gòu)及基本處理方法,進一步鞏固Python語言

1、 數(shù)據(jù)挖掘常用擴展庫介紹

Numpy數(shù)組處理支持

Scipy矩陣計算模塊

Matplotlib數(shù)據(jù)可視化工具庫

Pandas數(shù)據(jù)分析和探索工具

StatsModels統(tǒng)計建模庫

Scikit-Learn機器學習庫

Keras深度學習(神經(jīng)網(wǎng)絡)庫

Gensim文本挖掘庫

2、 數(shù)據(jù)集讀取與操作:讀取、寫入

讀寫文本文件

讀寫CSV文件

讀寫Excel文件

從數(shù)據(jù)庫獲取數(shù)據(jù)集

3、 數(shù)據(jù)集的核心數(shù)據(jù)結(jié)構(gòu)(Pandas數(shù)據(jù)結(jié)構(gòu))

Dataframe對象及處理方法

Series對象及處理方法

演練:用Python實現(xiàn)數(shù)據(jù)的基本統(tǒng)計分析功能

 

第三部分: 數(shù)據(jù)可視化處理

目的:掌握作圖擴展庫,實現(xiàn)數(shù)據(jù)可視化

1、 常用的Python作圖庫

Matplotlib庫

Pygal

2、 實現(xiàn)分類匯總

演練按性別統(tǒng)計用戶人數(shù)

演練:按產(chǎn)品+日期統(tǒng)計各產(chǎn)品銷售金額

3、 各種圖形的畫法

直方圖

餅圖

折線圖

散點圖

4、 繪圖的美化技巧

演練Python庫作圖來實現(xiàn)產(chǎn)品銷量分析,并可視化

 

第四部分: 數(shù)據(jù)理解和數(shù)據(jù)準備

目的:掌握數(shù)據(jù)預處理的基本環(huán)節(jié),以及Python的實現(xiàn)

1、 數(shù)據(jù)預處理

異常值處理:3σ準則,IQR準則

缺失值插補:均值、拉格朗日插補

數(shù)據(jù)篩選/抽樣

數(shù)據(jù)的離散化處理

變量變換、變量派生

2、 數(shù)據(jù)的基本分析

相關分析:原理、公式、應用

方差分析:原理、公式、應用

卡方分析:原理、公式、應用

主成分分析:降維

案例Python實現(xiàn)數(shù)據(jù)預處理及數(shù)據(jù)準備

 

第五部分: 分類預測模型實戰(zhàn)

1、 常見分類預測的模型與算法

2、 如何評估分類預測模型的質(zhì)量

查準率

查全率

ROC曲線

3、 邏輯回歸分析模型

邏輯回歸的原理

邏輯回歸建模的步驟

邏輯回歸結(jié)果解讀

案例sklearn庫實現(xiàn)銀行貸款違約預測

4、 決策樹模型

決策樹分類的原理

決策樹的三個關鍵問題

決策樹算法與實現(xiàn)

案例:電力竊漏用戶自動識別

5、 決策樹算法

最優(yōu)屬性選擇算法:ID3、ID4.0、ID5.0

連續(xù)變量分割算法

樹剪枝:預剪枝、后剪枝

6、 人工神經(jīng)網(wǎng)絡模型(ANN)

神經(jīng)網(wǎng)絡概述

神經(jīng)元工作原理

常見神經(jīng)網(wǎng)絡算法(BP、LM、RBF、FNN等)

案例:神經(jīng)網(wǎng)絡預測產(chǎn)品銷量

7、 支持向量機(SVM)

SVM基本原理

維災難與核心函數(shù)

案例:基于水質(zhì)圖像的水質(zhì)評價

8、 貝葉斯分析

條件概率

常見貝葉斯網(wǎng)絡

 

第六部分: 數(shù)值預測模型實戰(zhàn)

1、 常用數(shù)值預測的模型

通用預測模型:回歸模型

季節(jié)性預測模型:相加、相乘模型

新產(chǎn)品預測模型:珀爾曲線與龔鉑茲曲線

2、 回歸分析概念

3、 常見回歸分析類別

4、 回歸分析常見算法

梯度上升/下降

普通最小二乘法OLS

局部加權(quán)線性回歸LWLR

嶺回歸(RR)

套索回歸Lasso

ElasticNet回歸

第七部分: 聚類分析(客戶細分)實戰(zhàn)

1、 客戶細分常用方法

2、 聚類分析(Clustering

聚類方法原理介紹及適用場景

常用聚類分析算法

聚類算法的評價

案例使用SKLearn實現(xiàn)K均值聚類

案例:使用TSNE實現(xiàn)聚類可視化

3、 RFM模型分析

RFM模型,更深入了解你的客戶價值

RFM模型與市場策略

案例:航空公司客戶價值分析

 

第八部分: 關聯(lián)規(guī)則分析實戰(zhàn)

1、 關聯(lián)規(guī)則概述

2、 常用關聯(lián)規(guī)則算法

Apriori算法

發(fā)現(xiàn)頻繁集

生成關聯(lián)規(guī)則

FP-Growth算法

構(gòu)建FP樹

提取規(guī)則

3、 時間序列分析

案例使用apriori庫實現(xiàn)關聯(lián)分析

案例:中醫(yī)證型關聯(lián)規(guī)則挖掘

 

第九部分: 案例實戰(zhàn)(學員主導,老師現(xiàn)場指導)

1、 電商用戶行為分析及服務推薦

2、 基于基站定位數(shù)據(jù)的商圈分析

 

結(jié)束:課程總結(jié)問題答疑

 
反對 0舉報 0 收藏 0
更多>與Python實現(xiàn)大數(shù)據(jù)挖掘技術培訓相關內(nèi)訓課
企業(yè)家經(jīng)營哲學與企業(yè)經(jīng)營之道 高   效   執(zhí)   行   力 教練式經(jīng)銷商管理 商業(yè)模式創(chuàng)新 創(chuàng)新思維管理應用訓練?—創(chuàng)造性解決問題 創(chuàng)新思維和有效執(zhí)行 微課的設計與制作 高效能主管風暴訓練營
傅一航老師介紹>傅一航老師其它課程
大數(shù)據(jù)產(chǎn)業(yè)現(xiàn)狀及應用創(chuàng)新 大數(shù)據(jù)挖掘工具:SPSS Modeler入門與提高 大數(shù)據(jù)挖掘工具: SPSS Statistics入門與提高 大數(shù)據(jù)建模與模型優(yōu)化實戰(zhàn)培訓 金融行業(yè)風險預測模型實戰(zhàn) 數(shù)說營銷——大數(shù)據(jù)營銷實戰(zhàn)培訓 大數(shù)據(jù)分析與挖掘綜合能力提升實戰(zhàn) 助力市場營銷與服務的數(shù)據(jù)分析實戰(zhàn)
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  誠聘英才  |  網(wǎng)站聲明  |  隱私保障及免責聲明  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  京ICP備11016574號-25