Python 实现大数据挖掘

课程介绍

本课程基于Python 工具来实现大数据的数据分析和数据挖掘项目。基于业务问题,在数据挖掘标准过程指导下,采用Python 分析工具, 实现数据挖掘项目的每一步操作,从数据预处理、数据建模、数据可视化,到最终数据挖掘结束,帮助学员掌握Python 用于数据挖掘, 提升学员的数据化运营及数据挖掘的能力。

课程受众

业务支持部、IT 系统部、大数据系统开发部、大数据分析中心、网络运维部等相关技术人员。

课程大纲

第一部分:Python 语言基础
• 目的:掌握基本的 Python 编程思想与编程语句,熟悉常用数据结构的操作
1. Python 简介
2. 开发环境搭建
3. 掌握 Python 的简单数据类型
4. 掌握基本语句
5. 掌握复杂的数据类型:列表 / 元组
6. 复杂数据类型:字典
7. 复杂数据类型:集合
8. 掌握面向对象编程思想
9. 函数定义、参数传递、返回值
10. 标准库与扩展库的导入
11. 异常处理 :try-except 块

第二部分:Python 扩展库
• 目的:掌握数据集结构及基本处理方法,进一步巩固 Python语言
1. 数据挖掘常用扩展库介绍
2. 数据集读取与操作:读取、写入
3. 数据集的核心数据结构(Pandas 数据结构)

第三部分:数据可视化处理
• 目的:掌握作图扩展库,实现数据可视化
1. 常用的 Python 作图库
2. 实现分类汇总
3. 各种图形的画法
4. 绘图的美化技巧

第四部分:数据理解和数据准备
• 目的:掌握数据预处理的基本环节,以及 Python 的实现
1. 数据预处理
2. 数据的基本分析

第五部分:分类预测模型实战
1. 常见分类预测的模型与算法
2. 如何评估分类预测模型的质量
3. 逻辑回归分析模型
4. 决策树模型
5. 决策树算法
6. 人工神经网络模型(ANN)
7. 支持向量机(SVM)
8. 贝叶斯分析

第六部分:数值预测模型实战
1. 常用数值预测的模型
2. 回归分析概念
3. 常见回归分析类别
4. 回归分析常见算法

第七部分:聚类分析(客户细分)实战
1. 客户细分常用方法
2. 聚类分析(Clustering)
3. RFM 模型分析
第八部分:关联规则分析实战
1. 关联规则概述
2. 常用关联规则算法
3. 时间序列分析
第九部分:案例实战
1. 客户流失预测和客户挽留模型
2. 测模型

 

课程价格:

标准价   5000 元

注:费用已包含午餐,教材,税点。
咨询报名