互联网数据采集技术与应用
出版时间:
2022-11
版次:
1
ISBN:
9787302619109
定价:
49.00
-
本书基于“基础知识”
“代码示例”
“应用案例”的模式编写,共包括 7个项目。项目 1主要介绍互联网数据采集的入门知识;项目 2通过一个入门级的简单案例,介绍互联网数据采集的基本流程;项目 3通过一个进阶的案例,详细介绍在没有给出官方开放 API的情况下,如何通过抓包工具获取 XHR请求地址;项目 4主要介绍 HTML文档数据的采集,对 HTML进行解析,以及如何提取数据的属性与文本;项目 5主要讲解批量获取数据的整理与合并技巧;项目 6重点讲解如何通过 Python的 pymysql库对 MySQL进行读写;项目 7给出了对半结构化数据进行处理的最佳实践。 本书内容条理清晰、案例丰富,可以作为职业院校大数据、人工智能、云计算等相关专业的教材,也可以作为行业从业人员的参考用书。
本书封面贴有清华大学出版社防伪标签,无标签者不得销售。 项目 1.基础开发环境的安装与配置 1
任务 1.1.通过 Anaconda3安装基础开发环境 4
任务 1.2.常见问题与解决方案 13
项目总结 20
项目巩固与提高 20
项目 2.通过国务院新闻网官方 API获取时政新闻 21
任务 2.1.从开放的 API采集数据 23
任务 2.2.将数据存储到 Excel文件 27
项目总结 28
项目巩固与提高 29
项目 3.采集巨潮资讯网的股票财经信息 30
任务 3.1. Chrome网络抓包工具的使用 33
任务 3.2. 通过截获 XHR请求采集数据 35
任务 3.3. 采集更多信息 41
项目总结 44
项目巩固与提高 45
IV
互联网数据采集技术与应用
项目4 采集网络个性头像 46
任务4.1 采集图片数据 52
任务4.2 二进制数据的存储 60
项目总结76
项目巩固与提高77
项目5 获取全国主要城市未来5 天的天气情况 78
任务5.1 申请API 接口 79
任务5.2 采集天气数据 81
项目总结89
项目巩固与提高90
项目6 对多个MySQL 数据库进行数据整合 91
任务6.1 数据读取与合并 104
项目总结 109
项目巩固与提高 110
项目7 通过MongoDB 对半结构化Excel 数据进行高效存储 111
任务7.1 MongoDB 安装 113
任务7.2 MongoDB shell 工具 122
任务7.3 pymongo 的安装与使用 124
任务7.4 批量将Excel 数据存入MongoDB 128
项目总结 130
项目巩固与提高 130
参考文献 131
-
内容简介:
本书基于“基础知识”
“代码示例”
“应用案例”的模式编写,共包括 7个项目。项目 1主要介绍互联网数据采集的入门知识;项目 2通过一个入门级的简单案例,介绍互联网数据采集的基本流程;项目 3通过一个进阶的案例,详细介绍在没有给出官方开放 API的情况下,如何通过抓包工具获取 XHR请求地址;项目 4主要介绍 HTML文档数据的采集,对 HTML进行解析,以及如何提取数据的属性与文本;项目 5主要讲解批量获取数据的整理与合并技巧;项目 6重点讲解如何通过 Python的 pymysql库对 MySQL进行读写;项目 7给出了对半结构化数据进行处理的最佳实践。 本书内容条理清晰、案例丰富,可以作为职业院校大数据、人工智能、云计算等相关专业的教材,也可以作为行业从业人员的参考用书。
本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
-
目录:
项目 1.基础开发环境的安装与配置 1
任务 1.1.通过 Anaconda3安装基础开发环境 4
任务 1.2.常见问题与解决方案 13
项目总结 20
项目巩固与提高 20
项目 2.通过国务院新闻网官方 API获取时政新闻 21
任务 2.1.从开放的 API采集数据 23
任务 2.2.将数据存储到 Excel文件 27
项目总结 28
项目巩固与提高 29
项目 3.采集巨潮资讯网的股票财经信息 30
任务 3.1. Chrome网络抓包工具的使用 33
任务 3.2. 通过截获 XHR请求采集数据 35
任务 3.3. 采集更多信息 41
项目总结 44
项目巩固与提高 45
IV
互联网数据采集技术与应用
项目4 采集网络个性头像 46
任务4.1 采集图片数据 52
任务4.2 二进制数据的存储 60
项目总结76
项目巩固与提高77
项目5 获取全国主要城市未来5 天的天气情况 78
任务5.1 申请API 接口 79
任务5.2 采集天气数据 81
项目总结89
项目巩固与提高90
项目6 对多个MySQL 数据库进行数据整合 91
任务6.1 数据读取与合并 104
项目总结 109
项目巩固与提高 110
项目7 通过MongoDB 对半结构化Excel 数据进行高效存储 111
任务7.1 MongoDB 安装 113
任务7.2 MongoDB shell 工具 122
任务7.3 pymongo 的安装与使用 124
任务7.4 批量将Excel 数据存入MongoDB 128
项目总结 130
项目巩固与提高 130
参考文献 131
查看详情
-
互联网数据采集技术与应用
全新正版书籍,假一罚十(图片为标准图,仅供参考。以标题为准,不了解的可以询问客服。) 可开发票
全新
北京市朝阳区
平均发货16小时
成功完成率95.22%
-
九五品
河北省保定市
平均发货19小时
成功完成率78.76%
-
全新
北京市房山区
平均发货22小时
成功完成率77.75%
-
全新
北京市丰台区
平均发货25小时
成功完成率87.61%
-
全新
河北省保定市
平均发货22小时
成功完成率87.45%
-
全新
河北省保定市
平均发货27小时
成功完成率88.39%
-
全新
河北省保定市
平均发货31小时
成功完成率77.3%
-
九五品
河北省保定市
平均发货21小时
成功完成率84.91%
-
全新
北京市朝阳区
平均发货15小时
成功完成率96.21%
-
全新
河北省保定市
平均发货18小时
成功完成率81.29%
-
全新
江苏省南京市
平均发货15小时
成功完成率82.48%
-
全新
北京市通州区
平均发货9小时
成功完成率87.01%
-
全新
江苏省南京市
平均发货7小时
成功完成率98.15%
-
全新
江苏省苏州市
平均发货9小时
成功完成率95.68%
-
全新
江苏省无锡市
平均发货8小时
成功完成率96.12%
-
全新
四川省成都市
平均发货14小时
成功完成率80.09%
-
全新
北京市海淀区
平均发货20小时
成功完成率86.41%
-
全新
四川省成都市
平均发货9小时
成功完成率96.73%
-
全新
河北省保定市
平均发货18小时
成功完成率80.79%
-
全新
河北省保定市
平均发货18小时
成功完成率82.75%
-
全新
天津市西青区
平均发货14小时
成功完成率89.71%
-
全新
-
全新
北京市西城区
平均发货16小时
成功完成率91.71%
-
全新
北京市东城区
平均发货25小时
成功完成率85.58%
-
全新
四川省成都市
平均发货17小时
成功完成率81.25%
-
全新
江苏省无锡市
平均发货16小时
成功完成率94.49%
-
全新
河北省保定市
平均发货26小时
成功完成率87.97%
-
全新
江苏省无锡市
平均发货10小时
成功完成率94.15%
-
全新
天津市河东区
平均发货24小时
成功完成率91.01%
-
全新
河北省保定市
平均发货17小时
成功完成率81.73%
-
全新
-
全新
广东省广州市
平均发货7小时
成功完成率88.68%
-
全新
河北省保定市
平均发货6小时
成功完成率85.25%
-
全新
河北省保定市
平均发货13小时
成功完成率88.46%
-
全新
河北省保定市
平均发货28小时
成功完成率69.88%
-
互联网数据采集技术与应用
新华书店全新正版书籍。书名与图片不一致的,以书名为准。个别套装书为单本价格,详情请咨询客服下单。
全新
河北省沧州市
平均发货13小时
成功完成率71.84%
-
全新
-
全新
河北省保定市
平均发货24小时
成功完成率82.08%
-
全新
上海市闵行区
平均发货29小时
成功完成率55.81%
-
全新
北京市朝阳区
平均发货19小时
成功完成率76.76%
-
全新
广东省广州市
平均发货19小时
成功完成率86.84%
-
全新
江苏省南京市
平均发货15小时
成功完成率82.48%
-
九五品
江苏省无锡市
平均发货17小时
成功完成率81.53%
-
全新
北京市海淀区
平均发货13小时
成功完成率91.51%
-
全新
天津市河东区
平均发货24小时
成功完成率91.01%
-
全新
山东省烟台市
平均发货21小时
成功完成率89.38%
-
全新
河北省保定市
平均发货28小时
成功完成率92.55%
-
全新
四川省成都市
平均发货57小时
成功完成率82.49%
-
全新
广东省广州市
平均发货18小时
成功完成率87.59%
-
九五品
北京市朝阳区
平均发货29小时
成功完成率85.81%