题名:
|
网络爬虫全解析 wang luo pa chong quan jie xi / 罗刚著 , |
ISBN:
|
978-7-121-31071-3 价格: CNY79.00 |
语种:
|
chi |
载体形态:
|
429页 图 25cm |
出版发行:
|
出版地: 北京 出版社: 电子工业出版社 出版日期: 2017 |
内容提要:
|
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力,本书介绍了实现分布式网络爬虫的关键技术。另外,本书介绍了从图像和语音等多媒体格式文件中提取文本信息,以及如何使用大数据技术存储抓取到的信息。最后,以实战为例,介绍了如何抓取微信和微博,以及在电商、医药、金融等领域的案例应用。其中,电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。 |
主题词:
|
软件工具 程序设计 |
中图分类法:
|
TP311.561 版次: 5 |
其它题名:
|
技术、原理与实践 |
主要责任者:
|
罗刚 luo gang 著 |