游侠云服务,国外稳定安全免备案的服务器

统一声明:

1.本站联系方式QQ:1754646538 TG:@UXWNET 如果有其他人通过本站链接联系您导致被骗,本站一律不负责!
2.需要付费搭建请联系站长QQ:1754646538 TG:@UXWNET
3.国外免备案服务器- 游侠云服务
4.免实名域名注册购买- 游侠云域名
5.免实名国外服务器购买- 游侠网云服务

资源名称:R与Hadoop大数据分析实战

内容简介:

本书全面而系统地讲解了如何将R语言与Hadoop技术结合并应用于大数据分析,不仅系统且深入地阐释了R与Hadoop集成技术的工具、方法、原则和最佳实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用R语言与Hadoop技术进行大数据处理提供翔实指导。

全书分为四部分,共7章:第一部分(第1~2章)是基础知识,主要讲解R语言以及Hadoop的安装过程、计算原理和基本概念;第二部分(第3~4章)是初级应用,主要讲解RHIPE、RHadoop和streaming三种实现方案;第三部分(第5~6章)是高级实例,主要以RHadoop为技术背景,讲解多个实际应用案例;第四部分(第7章)介绍数据库连接,主要讲解在RHadoop下如何与各类数据库进行连接。

资源目录:

译者序

前言

审校者简介

致谢

第1章 R和Hadoop入门1

1.1 安装R2

1.2 安装RStudio3

1.3 R语言的功能特征3

1.3.1 使用R程序包3

1.3.2 执行数据操作3

1.3.3 日渐增多的社区支持4

1.3.4 R语言数据建模4

1.4 Hadoop的安装5

1.4.1 不同的Hadoop模式6

1.4.2 Hadoop的安装步骤6

1.5 Hadoop的特点12

1.5.1 HDFS简介13

1.5.2 MapReduce简介13

1.6 HDFS和MapReduce架构14

1.6.1 HDFS架构14

1.6.2 MapReduce架构15

1.6.3 通过图示了解HDFS和MapReduce架构15

1.7 Hadoop的子项目16

1.8 小结19

第2章 编写Hadoop MapReduce程序20

2.1 MapReduce基础概念20

2.2 Hadoop MapReduce技术简介22

2.2.1 MapReduce中包含的实体22

2.2.2 MapReduce中的主要执行进程23

2.2.3 MapReduce的局限25

2.2.4 MapReduce 可以解决的问题26

2.2.5 使用Hadoop编程时用到不同的Java概念26

2.3 Hadoop MapReduce原理27

2.3.1 MapReduce对象27

2.3.2 MapReduce中实现Map阶段的执行单元数目28

2.3.3 MapReduce中实现Reduce阶段的执行单元数目28

2.3.4 MapReduce的数据流28

2.3.5 深入理解HadoopMapReduce30

2.4 编写Hadoop MapReduce示例程序32

2.4.1 MapReduce job运行的步骤33

2.4.2 MapReduce可解决的商业问题38

2.5 在R环境中编写Hadoop MapReduce程序的方式39

2.5.1 RHadoop39

2.5.2 RHIPE40

2.5.3 Hadoop streaming40

2.6 小结40

第3章 集成R和Hadoop41

3.1 RHIPE42

3.1.1 安装RHIPE42

3.1.2 RHIPE架构44

3.1.3 RHIPE实例45

3.1.4 RHIPE参考函数48

3.2 RHadoop51

3.2.1 RHadoop架构51

3.2.2 安装RHadoop52

3.2.3 RHadoop案例53

3.2.4 RHadoop参考函数56

3.3 小结58

第4章 Hadoop Streaming中使用R59

4.1 Hadoop Streaming基础概念59

4.2 使用R运行Hadoop streaming62

4.2.1 MapReduce应用程序基础63

4.2.2 如何编写MapReduce应用程序65

4.2.3 如何运行MapReduce应用程序67

4.2.4 如何浏览MapRecuce应用程序的输出69

4.2.5 Hadoop MapReduce脚本的基础R函数70

4.2.6 管理Hadoop MapReduce任务71

4.3 R语言扩展包HadoopStreaming介绍72

4.3.1 hsTableReader函数73

4.3.2 hsKeyValReader函数75

4.3.3 hasLineReader函数75

4.3.4 运行Hadoop streaming任务78

4.3.5 执行Hadoop Streaming任务79

4.4 小结79

第5章 利用R和Hadoop学习数据分析80

5.1 数据分析项目生命周期80

5.1.1 问题定义81

5.1.2 设计数据需求81

5.1.3 数据预处理81

5.1.4 数据分析82

5.1.5 数据可视化82

5.2 数据分析问题83

5.2.1 展示网页分类 83

5.2.2 计算股市变动频率92

5.2.3 案例研究:预测推土机售价98

5.3 小结107

第6章 应用机器学习做大数据分析108

6.1 机器学习介绍108

6.2 有监督机器学习算法109

6.2.1 线性回归109

6.2.2 logistic回归115

6.3 无监督机器学习算法118

6.4 推荐算法123

6.4.1 在R中产生推荐商品的步骤125

6.4.2 使用R和Hadoop产生推荐商品128

6.5 小结131

第7章 从各种数据库中导入与导出数据132

7.1 文件型数据库134

7.1.1 不同类型的文件134

7.1.2 安装R包134

7.1.3 将数据导入R134

7.1.4 从R导出数据135

7.2 MySQL135

7.2.1 安装MySQL135

7.2.2 安装RMySQL136

7.2.3 列出数据表及其结构136

7.2.4 导入数据进R136

7.2.5 数据操纵137

7.3 Excel137

7.3.1 安装Excel138

7.3.2 导入数据进R138

7.3.3 R和Excel的数据操纵138

7.3.4 导出数据到Excel138

7.4 MongoDB138

7.4.1 安装MongoDB139

7.4.2 安装rmongodb141

7.4.3 导入数据进R141

7.4.4 数据操纵142

7.5 SQLite143

7.5.1 SQLite的特性143

7.5.2 安装SQLite144

7.5.3 安装RSQLite144

7.5.4 将数据导师入R144

7.5.5 数据操纵145

7.6 PostgreSQL145

7.6.1 PostgreSQL的特性145

7.6.2 安装PostgreSQL145

7.6.3 安装RPostgreSQL146

7.6.4 从R导出数据146

7.7 Hive147

7.7.1 Hive的特性147

7.7.2 安装Hive147

7.7.3 安装RHive149

7.7.4 RHive操作149

7.8 HBase150

7.8.1 HBase的特性150

7.8.2 安装HBase151

7.8.3 安装Thrift152

7.8.4 安装RHBase153

7.8.5 导入数据进R153

7.8.6 数据操纵153

7.9 小结154

附录 参考资源155

资源截图:

R与Hadoop大数据分析实战
收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

1. 本站所有资源来源于用户上传和网络,因此不包含技术服务请大家谅解!如有侵权请邮件联系客服!17131833@qq.com 2. 本站不保证所提供下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理,有奖励! 3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负! 4. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有站币奖励和额外收入!

源雷 云计算教程 R与Hadoop大数据分析实战 https://www.mubanke.com/58303.html

linux教程windows教程云计算大数据

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长QQ:1754646538 提供付款信息为您处理。

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源。