统一声明:
1.本站联系方式QQ:1754646538 TG:@UXWNET 如果有其他人通过本站链接联系您导致被骗,本站一律不负责! 2.需要付费搭建请联系站长QQ:1754646538 TG:@UXWNET 3.国外免备案服务器- 游侠云服务 4.免实名域名注册购买- 游侠云域名 5.免实名国外服务器购买- 游侠网云服务资源名称:命令行中的数据科学 完整版pdf
第1章 简介 1
1.1 概述 1
1.2 数据科学就是OSEMN 2
1.2.1 数据获取 2
1.2.2 数据清洗 2
1.2.3 数据探索 3
1.2.4 数据建模 3
1.2.5 数据解释 3
1.3 插入的几章 4
1.4 什么是命令行 4
1.5 为什么用命令行做数据科学工作 6
1.5.1 命令行的灵活性 6
1.5.2 命令行可增强 6
1.5.3 命令行可扩展 7
1.5.4 命令行可扩充 7
1.5.5 命令行无处不在 7
1.6 一个现实用例 8
1.7 延伸阅读 11
第2章 入门指南 13
2.1 概述 13
2.2 设置数据科学工具箱 13
2.2.1 步骤1:下载和安装VirtualBox 14
2.2.2 步骤2:下载和安装Vagrant 14
2.2.3 步骤3:下载并启动数据科学工具箱 14
2.2.4 步骤4:登录(Linux 和Mac OS X) 16
2.2.5 步骤4:登录(微软Windows) 16
2.2.6 步骤5:关闭或重启 16
2.3 必要的概念和工具 17
2.3.1 环境 17
2.3.2 运行命令行工具 18
2.3.3 五类命令行工具 19
2.3.4 命令行工具的组合 21
2.3.5 输入和输出重定向 22
2.3.6 处理文件 23
2.3.7 寻求帮助 24
2.4 延伸阅读 26
第3章 数据获取 27
3.1 概述 27
3.2 将本地文件复制到数据科学工具箱 28
3.2.1 本地数据科学工具箱 28
3.2.2 远程数据科学工具箱 28
3.3 解压缩文件 29
3.4 微软Excel电子表格的转换 30
3.5 查询关系数据库 32
3.6 从互联网下载 33
3.7 调用Web API 35
3.8 延伸阅读 36
第4章 创建可重用的命令行工具 37
4.1 概述 38
4.2 将单行转变为shell脚本 38
4.2.1 步骤1:复制和粘贴 39
4.2.2 步骤2:添加执行权限 40
4.2.3 步骤3:定义shebang 41
4.2.4 步骤4:删除固定的输入 42
4.2.5 步骤5:参数化 42
4.2.6 步骤6:扩展PATH 43
4.3 用Python 和R 创建命令行工具 44
4.3.1 移植shell 脚本 45
4.3.2 处理来自标准输入的流数据 46
4.4 延伸阅读 47
第5章 数据清洗 49
5.1 概述 50
5.2 纯文本的常见清洗操作 50
5.2.1 行过滤 50
5.2.2 值提取 54
5.2.3 值替换和删除 55
5.3 处理CSV 56
5.3.1 主体、头部和列 56
5.3.2 对CSV执行SQL查询 60
5.4 处理HTML/XML 和JSON 61
5.5 CSV的常见清洗操作 65
5.5.1 列的提取和重排序 65
5.5.2 行过滤 66
5.5.3 列合并 67
5.5.4 多个CSV文件的合并 70
5.6 延伸阅读 73
…….
资源截图:
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!
8. 精力有限,不少源码未能详细测试(解密),不能分辨部分源码是病毒还是误报,所以没有进行任何修改,大家使用前请进行甄别!
站长QQ:1754646538 站长邮箱:1754646538@qq.com