大數(shù)據(jù)時代的數(shù)據(jù)挖掘分析及案例(含CRISP-DM方法論)

  培訓(xùn)講師:段方

講師背景:
段方專業(yè)背景:曾在中國銀行工作現(xiàn)任某集團總部大數(shù)據(jù)專家、數(shù)據(jù)倉庫項目經(jīng)理多家培訓(xùn)機構(gòu)及大學(xué)總裁班特邀講師十幾年專注于大數(shù)據(jù)的研究與推廣積累了15年的大數(shù)據(jù)領(lǐng)域的實際工作經(jīng)驗。帶領(lǐng)相關(guān)的團隊,從系統(tǒng)創(chuàng)建到系統(tǒng)運營,開發(fā)了很多大數(shù)據(jù)領(lǐng)域的各種應(yīng) 詳細(xì)>>

段方
    課程咨詢電話:

大數(shù)據(jù)時代的數(shù)據(jù)挖掘分析及案例(含CRISP-DM方法論)詳細(xì)內(nèi)容

大數(shù)據(jù)時代的數(shù)據(jù)挖掘分析及案例(含CRISP-DM方法論)
 

一、“大數(shù)據(jù)、大機會”:

1.概述

1)大數(shù)據(jù)概念和特點

2)大數(shù)據(jù)需要哪些技術(shù)支撐

3)大數(shù)據(jù)能夠帶來哪些新應(yīng)用?

2.大數(shù)據(jù)時代帶來對傳統(tǒng)營銷的挑戰(zhàn)

1)大數(shù)據(jù)如何成為資產(chǎn)?——GOOGLE的市值遠(yuǎn)超過制造企業(yè)

2)大數(shù)據(jù)如何體現(xiàn)精細(xì)營銷

3)大數(shù)據(jù)的價值——靠空調(diào)電表判斷氣候趨勢(“指數(shù)”)

3.大數(shù)據(jù)時代的“互聯(lián)網(wǎng)思維”營銷模式

1)互聯(lián)網(wǎng)思維——先圈用戶再掙錢

2)互聯(lián)網(wǎng)的營銷模式——微博營銷、網(wǎng)頁營銷等

3) CRM——“舊貌煥發(fā)新顏”

4)精細(xì)營銷——裝上了GPS,實現(xiàn)“精確打擊”

4.如何在海量數(shù)據(jù)中整合線上、線下數(shù)據(jù),形成你對客戶的獨特洞察力

1)知道客戶的各個屬性——互聯(lián)網(wǎng)時代不再“是否是狗”

2)客戶的群體特征——“人以群分”

5.如何建立產(chǎn)品分析的數(shù)據(jù)平臺,提供產(chǎn)品的“標(biāo)尺”

1)產(chǎn)品的數(shù)據(jù)有哪些?

2)產(chǎn)品設(shè)計的互聯(lián)網(wǎng)思維?——小米手機

3)產(chǎn)品的大數(shù)據(jù)分析——哪些維度?

4)如何“產(chǎn)品為中心”發(fā)展為“客戶為中心”?——有數(shù)據(jù)就有可能

6.大數(shù)據(jù)對企業(yè)的精細(xì)管理提升

1)企業(yè)的精細(xì)管理——不再盲人摸象

2)企業(yè)的KPI儀表板——進(jìn)入駕駛艙

3)預(yù)防企業(yè)的管理風(fēng)險——早診斷、早發(fā)現(xiàn)

4)員工的量化績效評定——計件之后計量

7.大數(shù)據(jù)提升企業(yè)的產(chǎn)品質(zhì)量

1)建立量化的產(chǎn)品管理方法——辣椒的辣度評定

2)產(chǎn)品制造過程的管理控制——監(jiān)控大數(shù)據(jù)分析

3)產(chǎn)品問題的及時監(jiān)控——溫度、風(fēng)速等異常早發(fā)現(xiàn)

4)產(chǎn)品訂制的范例——好萊塢大片的大數(shù)據(jù)

5)產(chǎn)品質(zhì)量的量化管控——擋板安裝的故事


二、大數(shù)據(jù)的“數(shù)據(jù)挖掘技術(shù)”

1.數(shù)據(jù)挖掘概述

1)基本概念——“啤酒和尿布的故事”

2)與講師系統(tǒng)、統(tǒng)計分析、人工智能的關(guān)系——演進(jìn)歷史分析

3)數(shù)據(jù)挖掘在制造行業(yè)的應(yīng)用內(nèi)容——如何體現(xiàn)“智能制造”?

2. CRISP-DM過程描述

1)商業(yè)理解——要實現(xiàn)什么“目的”?

2)數(shù)據(jù)的理解以及收集——手里有哪些數(shù)據(jù)?

3)數(shù)據(jù)的準(zhǔn)備——數(shù)據(jù)的清洗及轉(zhuǎn)換

4)應(yīng)用數(shù)據(jù)挖掘工具建立模型——使用哪種數(shù)據(jù)挖掘算法和工具?

5)模型評估——算法評估

6)部署(并形成數(shù)據(jù)挖掘報告)——實際使用及形成報告  

3.數(shù)據(jù)挖掘常用算法介紹

預(yù)測型

1)分類算法

2)回歸分析

3)時間序列

描述型

4)關(guān)聯(lián)分析

5)序列關(guān)聯(lián)分析

6)聚類分析

4.數(shù)據(jù)挖掘具體算法舉例

1)神經(jīng)網(wǎng)絡(luò)算法

2)決策樹算法

5.根據(jù)實際問題選擇數(shù)據(jù)挖掘算法

1)客戶離網(wǎng)分析

2)客戶分群模型

3)產(chǎn)品關(guān)聯(lián)分析

4)問題的描述

需要解決的關(guān)鍵問題

如何轉(zhuǎn)換成為數(shù)據(jù)挖掘的描述

數(shù)據(jù)挖掘算法的選擇依據(jù)

預(yù)測類還是描述類

與各種算法的使用特點結(jié)合

6.分析結(jié)果的檢驗

對照組數(shù)據(jù)的選擇方法

對照組數(shù)據(jù)的時間窗口選擇

對照組數(shù)據(jù)的抽樣

數(shù)據(jù)挖掘模型的修訂

1)如何剔除無效的結(jié)果數(shù)據(jù)

2) 根據(jù)反饋結(jié)果進(jìn)行模型修訂

7.數(shù)據(jù)挖掘項目的投入產(chǎn)出

數(shù)據(jù)挖掘項目的投入成本計算

數(shù)據(jù)挖掘項目的產(chǎn)出計算依據(jù) 

8.如何形成分析報告

1)分析報告的組成部分

2)部分優(yōu)秀的分析報告演示

9.常用數(shù)據(jù)挖掘工具介紹

   1)SAS

   2 ) SPSS


三、數(shù)據(jù)挖掘具體案例分析

某電信公司具體數(shù)據(jù)挖掘案例(某產(chǎn)品營銷)詳細(xì)舉例

1. 商業(yè)理解:提升哪個KPI指標(biāo)?(ARPU/MOU等)

2. 數(shù)據(jù)理解及收集:哪些具體的數(shù)據(jù)(客戶詳單、客戶資料等)

3. 數(shù)據(jù)準(zhǔn)備:

1)客戶數(shù)據(jù)質(zhì)量分析

如何保障數(shù)據(jù)質(zhì)量——哪些衡量指標(biāo)

如何發(fā)現(xiàn)異常數(shù)據(jù)——剔除干擾數(shù)據(jù)

2)客戶數(shù)據(jù)抽樣過程

抽樣比例分析

抽樣的具體方法

3)挖掘應(yīng)用需求描述

如何篩選有用數(shù)據(jù)——選擇相關(guān)變量和匯總數(shù)據(jù)

如何描述需求

4.數(shù)據(jù)挖掘工具建立模型

挖掘算法選擇

如何選擇合適的分析方法

如何剔除無效的干擾數(shù)據(jù)

選擇關(guān)鍵變量

挖掘具體過程

結(jié)果數(shù)據(jù)分析

5.模型(算法)評估

LIFT值等分析

6.實際部署及分析報告

   實際分析報告編寫示例

   如何計算該項目的投入、產(chǎn)出

項目的投入計算依據(jù)

項目的產(chǎn)出計算方法

項目的投入/產(chǎn)出結(jié)果


四、基礎(chǔ)數(shù)據(jù)的收集和整理

1、數(shù)據(jù)的種類

1)客戶數(shù)據(jù)內(nèi)容(保險客戶的基本資料)

2)產(chǎn)品數(shù)據(jù)內(nèi)容(產(chǎn)品的編碼)

3)營銷數(shù)據(jù)內(nèi)容(交易記錄的保存)

4)服務(wù)數(shù)據(jù)內(nèi)容(客戶服務(wù)數(shù)據(jù)的保存)

5)制造行業(yè)數(shù)據(jù)的特點:(數(shù)據(jù)類型雜、數(shù)據(jù)量大等)

2、數(shù)據(jù)的存放方法

1)數(shù)據(jù)的清洗、轉(zhuǎn)換和加載

2)存放在數(shù)據(jù)庫/數(shù)據(jù)倉庫

3)數(shù)據(jù)的基本分析工具EXCEL等

3、數(shù)據(jù)的基本整理

1)數(shù)據(jù)的歸類存放(建模型)

2)數(shù)據(jù)的基本加工

4、數(shù)據(jù)的基礎(chǔ)分析

1)數(shù)據(jù)的基本匯總

2)數(shù)據(jù)中的“金子”:從石頭中淘金子

5、數(shù)據(jù)質(zhì)量的基本保障

1)指標(biāo)的口徑描述和統(tǒng)一

2)后期補數(shù)據(jù)成本是前提收集數(shù)據(jù)成本的15倍

3)“差之毫厘謬以千里”

6、制造業(yè)企業(yè)數(shù)據(jù)的收集和整理

1)制造環(huán)境的數(shù)據(jù)收集/整理

2)采購數(shù)據(jù)的收集/整理

3)營銷數(shù)據(jù)的收集/整理:

4)人力資源數(shù)據(jù)的收集/整理

示例:某企業(yè)的數(shù)據(jù)收集/整理方案


五、云計算技術(shù)

1.Hadoop項目簡介

2.HDFS體系結(jié)構(gòu)

3.HDFS關(guān)鍵運行機制

4.MapReduce產(chǎn)生背景

5.MapReduce編程模型

6.MapReduce實現(xiàn)機制

7.MapReduce案例分析

8.HIVE介紹

9.HBASE介紹


六、總結(jié)和展望


 

段方老師的其它課程

《“連接+算力+能力”——移動公司新戰(zhàn)略》-段方某世界100強企業(yè)大數(shù)據(jù)/AI總設(shè)計師教授北京大學(xué)博士后===========================================================概述-------------------------------------------------------------1.1中國移

 講師:段方詳情


《大數(shù)據(jù)系列培訓(xùn)的課程目錄》——段方段方——北京大學(xué)博士后摘要列出大數(shù)據(jù)系列課程目錄,從不同角度詳細(xì)介紹大數(shù)據(jù)的各種相關(guān)內(nèi)容。從實際案例出發(fā),分享實際建設(shè)、運營的經(jīng)驗和教訓(xùn),分享個人的思考?!局v師簡介】30余年計算機(IT)領(lǐng)域從業(yè)經(jīng)歷,直至博士后的學(xué)歷背景;16年大數(shù)據(jù)系統(tǒng)(含數(shù)據(jù)倉庫)設(shè)計、建設(shè)、應(yīng)用、管理、運營實際經(jīng)驗,累計投資120億元買來的教訓(xùn);2

 講師:段方詳情


《基于大數(shù)據(jù)的機器學(xué)習(xí)和深度學(xué)習(xí)》——原理與實踐目錄1背景1.1從AlphaGo說起5\lquot;bookmark6quot;1.1.1AlphaGo的效果5\lquot;bookmark8quot;1.1.2AlphaGo的原理5\lquot;bookmark10quot;1.2機器學(xué)習(xí)基礎(chǔ)5\lquot;bookmark12quot;1.2.1機器學(xué)習(xí)

 講師:段方詳情


《物聯(lián)網(wǎng)技術(shù)與應(yīng)用》段方——北京大學(xué)博士后目錄1概述1.1物聯(lián)網(wǎng)概念及特點1.1.1定義1.1.2與互聯(lián)網(wǎng)的關(guān)系1.1.3物聯(lián)網(wǎng)的特點1.2物聯(lián)網(wǎng)發(fā)展歷程1.2.1源起1.2.2中國移動的“萬物互聯(lián)”1.3物聯(lián)網(wǎng)關(guān)鍵技術(shù)1.3.1從RFID開始1.3.2感應(yīng)識別技術(shù)1.3.3定位系統(tǒng)1.3.4其它的感應(yīng)技術(shù)1.4物聯(lián)網(wǎng)的產(chǎn)業(yè)鏈1.4.1設(shè)備層面1.4.2網(wǎng)絡(luò)

 講師:段方詳情


=============================================================《人工智能(含機器學(xué)習(xí))及其在電信領(lǐng)域應(yīng)用》-段方某世界100強企業(yè)大數(shù)據(jù)/AI總設(shè)計師教授、北京大學(xué)博士后=============================================================1930

 講師:段方詳情


=============================================================《中國廣電5G運營策略》——段方中國移動資深專家教授北京大學(xué)博士后=============================================================15G發(fā)展概述1.15G概述1.25G技術(shù)特征1.

 講師:段方詳情


=============================================================《人工智能基礎(chǔ)及應(yīng)用培訓(xùn)》-段方某世界100強大數(shù)據(jù)/AI總設(shè)計師教授北京大學(xué)博士后=============================================================202916811801概述--

 講師:段方詳情


《數(shù)據(jù)安全技術(shù)》-段方某世界100強企業(yè)大數(shù)據(jù)總設(shè)計師教授北京大學(xué)博士后1概述1.1信息安全的概念及范圍1.1.1概述1.1.2信息系統(tǒng)潛在威脅被動攻擊主動攻擊黑客攻擊手法1.1.3信息安全技術(shù)概覽1.1.4信息安全注重體系安全防護(hù)檢測響應(yīng)恢復(fù)1.2信息安全等級分類1.2.1分級的概念1.2.2分級保護(hù)涉及的標(biāo)準(zhǔn)1.2.3職責(zé)和角色1.2.4企業(yè)信息等級選擇

 講師:段方詳情


=============================================================《數(shù)據(jù)管理及數(shù)倉建模》-段方某世界100強企業(yè)大數(shù)據(jù)/AI總設(shè)計師教授北京大學(xué)博士后=============================================================13465791461概述---

 講師:段方詳情


=============================================================《數(shù)智化發(fā)展及運用案例分析》-段方某世界100強企業(yè)大數(shù)據(jù)/AI總設(shè)計師教授北京大學(xué)博士后=============================================================23704858471概念

 講師:段方詳情


COPYRIGT @ 2001-2018 HTTP://kunyu-store.cn INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權(quán)所有