求知 文章 文库 Lib 视频 Code iProcess 课程 认证 咨询 工具 火云堂 讲座吧   成长之路  
会员   
 
 
 
全部课程 | 技术学院 | 管理学院 | 嵌入式学院 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 

数据挖掘与分析(互联网行业)     3873 次浏览    1100 次 
  报名参课   学生报名
主讲嘉宾 杨老师,曾任淘宝资深数据分析师
时间地点: 深圳 北京 上海 根据报名开班
课程费用: 5000元/人,3人以上报名9折,5人以上8折 (学生3折),详见 公开课学习手册
企业内训: 可以根据企业需求,定制内训,详见 内训学习手册


《数据分析师》  认证方式  
1.知识:权威知识考试;
2.技能:真实案例实践考评;
3.经验:工作经验审核;
4.素养:未来发展潜力的评估。

 
此门课程讲解了互联网行业数据分析、数据挖掘的基本理论和实际应用,介绍了数据挖掘在互联网的应用。重点介绍移动互联网行业中常用的数据分析与挖掘方法,包括关联分析技术、分类和预测技术、聚类分析技术等,以及算法的应用案例,课程还介绍了数据挖掘步骤及流程,并以SPSS Clementine为例讲解了数据挖掘工具的使用。。
 
培训目标:

完成此门课程,学员将具备以下能力:

  • 了解互联网行业数据挖掘的特点
  • 掌握互联网行业数据分析与挖掘中的基本概念和指标
  • 掌握数据挖掘的应用范围及技术发展方向 了解数据挖掘在互联网行业的应用
  • 掌握关联分析、分类、聚类算法及应用场景
  • 掌握主流数据挖掘工具在互联网行业业务分析中的应用
  • 能够灵活运用本课所学知识,进行互联网业务的辅助业务分析
培训对象:互联网行业数据分析师,数据挖掘工程师
学员基础:具有一定数据分析经验
授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
培训内容: 2天
互联网数据挖掘概览
  • 互联网的数据挖掘典型需求
  • 互联网数据采集的典型渠道
  • 互联网数据存储特征
  • 数据挖掘技术与工具
  • 数据分析的工作模式
  • 示例:数据挖掘在互联网行业中的应用
互联网相关的数据挖掘典型应用场景
  • 数据流挖掘分析
  • 文本挖掘分析
  • 示例:文本数据流分析
  • 位置分析
  • 社交关系分析
  • 互联网应用识别
  • 个性化推荐介绍
数据分析与挖掘的流程
  • 确定数据需求
  • 设计数据挖掘模型
  • 确定数据来源
  • 收集并整理数据
  • 选择数据挖掘算法
  • 执行数据挖掘算法
  • 数据分析结果评估与算法+数据优化
  • 报告数据分析结果
数据需求分析
  • 确定数据分析目标
  • 围绕目标分解指标
  • 把指标映射到已有的数据
  • 确定对数据的要求
设计数据挖掘模型
  • 确定数据源模型
  • 确定数据挖掘结果模型
  • 确定数据分析算法容器模型
  • 建立从数据源到数据分析结果映射图
确定数据源
  • 数据源存储空间标定
  • 数据源逻辑模型分析
  • 数据源抽取方法列表
  • 数据源备份机制选择
  • 数据源质量分析
收集并整理数据
  • 数据整理需求明确
  • 采用自动化方法整理数据
  • 对不合规数据的特殊处理
  • 间隙数据的补充
选择数据挖掘算法
  • 典型数据挖掘算法列表
  • 关联和相关分析
    • 相关分析
    • 关联规则分析
    • 实例:使用相关及关联进行分析
  • 聚类分析算法及应用
    • 实例:聚类分析实例,客户聚类
  • 分类算法
    • 用决策树进行分类
    • 神经网络
    • 实例:使用分类方法进行客户流失分析
  • 回归分析与预测
    • 回归分析概述
    • 时间序列分析
  • 示例:使用时间序列分析进行网络流量预测
数据挖掘工具原理与实践
  • 典型数据挖掘工具列表
  • 统计分析工具SPSS介绍(简要)
  • 数据挖掘专用工具SPSS Clementine介绍
  • 建模及模型评价过程
  • 应用SPSS Clementine工具进行数据挖掘与分析
数据挖掘效果评估与优化
  • 数据挖掘结果差异分析
  • 差异原因定位
  • 优化数据与算法
  • 重新处理数据、算法分析
  • 结果比对与确认
  • 数据分析结果报告
如果课程内容不符合您的期望,可以定制内训
 


3873 次浏览   1100 次
其他人还看了课程
数据挖掘原理、案例、工具与应用  3468 次浏览
Oracle数据库数据同步与容灾备份  2946 次浏览
高级数据库架构设计师  8868 次浏览
大数据平台规划与设计-搜索与异地容灾  3239 次浏览
商业智能(BI)与数据仓库  2829 次浏览
NoSQL数据库(原理、应用、最佳实践)  11330 次浏览
定制内训




最新活动计划
MBSE(基于模型的系统工程)4-18[北京]
自然语言处理(NLP) 4-25[北京]
基于 UML 和EA进行分析设计 4-29[北京]
以用户为中心的软件界面设计 5-16[北京]
DoDAF规范、模型与实例 5-23[北京]
信息架构建模(基于UML+EA)5-29[北京]