求知 文章 文库 Lib 视频 Code iProcess 课程 认证 咨询 工具 火云堂 讲座吧   成长之路  
会员   
 
 
 
全部课程 | 技术学院 | 管理学院 | 嵌入式学院 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 

 大数据分析专题-R语言培训      4295 次浏览    1093 次 
 
专家讲师: James,某世界知名企业首席大数据架构师。
地点时间: 北京 有人等开班;上海、深圳根据报名开班   
课程费用: 5000元/人 详见 公开课学习手册
企业内训: 可以根据企业需求,定制内训,详见 内训学习手册
 

在互联网思维、互联网经济、移动互联、电子商务等新兴产业纷纷走上历史舞台的大背景下,越来越多的数据使得数据分析技术成为关键的商业竞争技术之一,大数据时代来临了,大数据分析行业也应运而生。从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数据分析普遍存在的方法理论有哪些呢?

大数据分析的五个基本方面包括:可视化分析,数据挖掘算法,数据平台工具,语义引擎,数据质量和数据管理,

而大数据分析又是重中之重,R语言作为大数据分析利器,正在逐渐被大家所接受与使用。本次培训通过两天的培训帮助大家掌握R语言基本理论

 
培训目标:
  • 掌握数据挖掘与数据分析原理
  • 了解常见的挖掘算法分类,聚类等
  • R语言基础深入掌握
  • R 语言环境下的聚类分析,决策树与随机森林,逻辑回归,聚类。
培训对象:希望掌握R语言算法的工程师
学员基础:具有大数据分析经验的分析师等
授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
培训内容:2天
统计学基本原理
  • 何谓研究
  • 常见的研究名词:概念性架构、模型、操作型定义、变量、命题与假设
  • 问卷设计原则与操作
  • 研究中常见的变量:自变量、依变量、中介变量、干扰变量及控制变量
  • 统计分析常用的名词:平均数、众数、方差、协方差、标准偏差、标准误
  • 测量尺度的应用:名目尺度、顺序尺度、区间尺度及比例尺度
  • 估计(Confidence Interval, CI)与检定(P-value)
  • 自由度 9. 统计的假设:常态、同质、独立 10. 信度
  • 效度:表面效度、内容效度、效标效度、建构效度(收敛效度及区别效度
R语言基础
  • R简介、数据类型介绍、R的数据可视化、常用R包介绍。R集成开发环境
  • 数据整理:数据的读入输出、控制流、各种图表,常用统计量计算
  • 数据展现1:基本制图函数综述、理解关键制图参数
R语言数据可视化
  • 数据展现2:散点图、线图与时间序列谱图,案例:股价走势可视化展现
  • 数据展现3:柱形图,点图,饼图,直方图,案例:销售数据可视化展现
  • 数据展现4:箱线图,热力图,等高线,地图,案例:Facebook好友联系图
Logistic回归与商业大数据建模
  • Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。
  • 主要案例:
  • 案例2:利用Logistic回归分析网页点击流量
  • 案例3:利用Logistic回归分析婚外情
关联规则和R语言实现
  • 关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。
  • 主要案例:
  • 案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析);
决策树(回归树)分析和随机森林R语言实现
  • 决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。
  • 主要案例:
  • 案例1:对汽车销量走势预测
R语言聚类算法
  • 在机器学习中,聚类算法包括,层次聚类法,谱系图,k平均值法,k中心法
  • 是非常重要的算法模块
  • 主要案例:
  • 案例1:推荐系统
4295 次浏览   1093 次
其他人还看了课程
Hadoop与Spark大数据架构专题  4466 次浏览
企业级Hadoop大数据处理最佳实践  2539 次浏览
大数据分析与挖掘分析专题-R语言  
Spark实践培训  2921 次浏览
数据统计分析方法与工具、实践  4132 次浏览
大数据分析-SparkR  3156 次浏览
定制内训




最新活动计划
MBSE(基于模型的系统工程)4-18[北京]
自然语言处理(NLP) 4-25[北京]
基于 UML 和EA进行分析设计 4-29[北京]
以用户为中心的软件界面设计 5-16[北京]
DoDAF规范、模型与实例 5-23[北京]
信息架构建模(基于UML+EA)5-29[北京]