统一声明:
1.本站联系方式QQ:709466365 TG:@UXWNET 如果有其他人通过本站链接联系您导致被骗,本站一律不负责! 2.需要付费搭建请联系站长QQ:709466365 TG:@UXWNET 3.国外免备案服务器- 游侠云服务 4.免实名域名注册购买- 游侠云域名 5.免实名国外服务器购买- 游侠网云服务资源名称:R与Hadoop大数据分析实战
内容简介:
本书全面而系统地讲解了如何将R语言与Hadoop技术结合并应用于大数据分析,不仅系统且深入地阐释了R与Hadoop集成技术的工具、方法、原则和最佳实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用R语言与Hadoop技术进行大数据处理提供翔实指导。
全书分为四部分,共7章:第一部分(第1~2章)是基础知识,主要讲解R语言以及Hadoop的安装过程、计算原理和基本概念;第二部分(第3~4章)是初级应用,主要讲解RHIPE、RHadoop和streaming三种实现方案;第三部分(第5~6章)是高级实例,主要以RHadoop为技术背景,讲解多个实际应用案例;第四部分(第7章)介绍数据库连接,主要讲解在RHadoop下如何与各类数据库进行连接。
资源目录:
译者序
前言
审校者简介
致谢
第1章 R和Hadoop入门1
1.1 安装R2
1.2 安装RStudio3
1.3 R语言的功能特征3
1.3.1 使用R程序包3
1.3.2 执行数据操作3
1.3.3 日渐增多的社区支持4
1.3.4 R语言数据建模4
1.4 Hadoop的安装5
1.4.1 不同的Hadoop模式6
1.4.2 Hadoop的安装步骤6
1.5 Hadoop的特点12
1.5.1 HDFS简介13
1.5.2 MapReduce简介13
1.6 HDFS和MapReduce架构14
1.6.1 HDFS架构14
1.6.2 MapReduce架构15
1.6.3 通过图示了解HDFS和MapReduce架构15
1.7 Hadoop的子项目16
1.8 小结19
第2章 编写Hadoop MapReduce程序20
2.1 MapReduce基础概念20
2.2 Hadoop MapReduce技术简介22
2.2.1 MapReduce中包含的实体22
2.2.2 MapReduce中的主要执行进程23
2.2.3 MapReduce的局限25
2.2.4 MapReduce 可以解决的问题26
2.2.5 使用Hadoop编程时用到不同的Java概念26
2.3 Hadoop MapReduce原理27
2.3.1 MapReduce对象27
2.3.2 MapReduce中实现Map阶段的执行单元数目28
2.3.3 MapReduce中实现Reduce阶段的执行单元数目28
2.3.4 MapReduce的数据流28
2.3.5 深入理解HadoopMapReduce30
2.4 编写Hadoop MapReduce示例程序32
2.4.1 MapReduce job运行的步骤33
2.4.2 MapReduce可解决的商业问题38
2.5 在R环境中编写Hadoop MapReduce程序的方式39
2.5.1 RHadoop39
2.5.2 RHIPE40
2.5.3 Hadoop streaming40
2.6 小结40
第3章 集成R和Hadoop41
3.1 RHIPE42
3.1.1 安装RHIPE42
3.1.2 RHIPE架构44
3.1.3 RHIPE实例45
3.1.4 RHIPE参考函数48
3.2 RHadoop51
3.2.1 RHadoop架构51
3.2.2 安装RHadoop52
3.2.3 RHadoop案例53
3.2.4 RHadoop参考函数56
3.3 小结58
第4章 Hadoop Streaming中使用R59
4.1 Hadoop Streaming基础概念59
4.2 使用R运行Hadoop streaming62
4.2.1 MapReduce应用程序基础63
4.2.2 如何编写MapReduce应用程序65
4.2.3 如何运行MapReduce应用程序67
4.2.4 如何浏览MapRecuce应用程序的输出69
4.2.5 Hadoop MapReduce脚本的基础R函数70
4.2.6 管理Hadoop MapReduce任务71
4.3 R语言扩展包HadoopStreaming介绍72
4.3.1 hsTableReader函数73
4.3.2 hsKeyValReader函数75
4.3.3 hasLineReader函数75
4.3.4 运行Hadoop streaming任务78
4.3.5 执行Hadoop Streaming任务79
4.4 小结79
第5章 利用R和Hadoop学习数据分析80
5.1 数据分析项目生命周期80
5.1.1 问题定义81
5.1.2 设计数据需求81
5.1.3 数据预处理81
5.1.4 数据分析82
5.1.5 数据可视化82
5.2 数据分析问题83
5.2.1 展示网页分类 83
5.2.2 计算股市变动频率92
5.2.3 案例研究:预测推土机售价98
5.3 小结107
第6章 应用机器学习做大数据分析108
6.1 机器学习介绍108
6.2 有监督机器学习算法109
6.2.1 线性回归109
6.2.2 logistic回归115
6.3 无监督机器学习算法118
6.4 推荐算法123
6.4.1 在R中产生推荐商品的步骤125
6.4.2 使用R和Hadoop产生推荐商品128
6.5 小结131
第7章 从各种数据库中导入与导出数据132
7.1 文件型数据库134
7.1.1 不同类型的文件134
7.1.2 安装R包134
7.1.3 将数据导入R134
7.1.4 从R导出数据135
7.2 MySQL135
7.2.1 安装MySQL135
7.2.2 安装RMySQL136
7.2.3 列出数据表及其结构136
7.2.4 导入数据进R136
7.2.5 数据操纵137
7.3 Excel137
7.3.1 安装Excel138
7.3.2 导入数据进R138
7.3.3 R和Excel的数据操纵138
7.3.4 导出数据到Excel138
7.4 MongoDB138
7.4.1 安装MongoDB139
7.4.2 安装rmongodb141
7.4.3 导入数据进R141
7.4.4 数据操纵142
7.5 SQLite143
7.5.1 SQLite的特性143
7.5.2 安装SQLite144
7.5.3 安装RSQLite144
7.5.4 将数据导师入R144
7.5.5 数据操纵145
7.6 PostgreSQL145
7.6.1 PostgreSQL的特性145
7.6.2 安装PostgreSQL145
7.6.3 安装RPostgreSQL146
7.6.4 从R导出数据146
7.7 Hive147
7.7.1 Hive的特性147
7.7.2 安装Hive147
7.7.3 安装RHive149
7.7.4 RHive操作149
7.8 HBase150
7.8.1 HBase的特性150
7.8.2 安装HBase151
7.8.3 安装Thrift152
7.8.4 安装RHBase153
7.8.5 导入数据进R153
7.8.6 数据操纵153
7.9 小结154
附录 参考资源155
资源截图:
感谢您的支持,我会继续努力的!
1. 本站所有资源来源于用户上传和网络,因此不包含技术服务请大家谅解!如有侵权请邮件联系客服!17131833@qq.com 2. 本站不保证所提供下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理,有奖励! 3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负! 4. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有站币奖励和额外收入!
源雷 云计算教程 R与Hadoop大数据分析实战 https://www.mubanke.com/58303.html
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!
8. 精力有限,不少源码未能详细测试(解密),不能分辨部分源码是病毒还是误报,所以没有进行任何修改,大家使用前请进行甄别!
站长QQ:709466365 站长邮箱:709466365@qq.com