会员
网络数据采集技术:Java网络爬虫实战
钱洋等更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
主页
同类热门书
最新上架
- 会员
小学生C++创意编程(视频教学版)
C++是信息学奥赛指定的编程语言。本书以通俗易懂的方式深入浅出地介绍了C++编程语言,适合作为小学生学习的教材类读物。《小学生C++创意编程(视频教学版)》的特点在于紧密结合生活,将算法融入其中。精心挑选了100多个案例,旨在逐步引导读者掌握编程技巧。书中的案例难度梯度设计合理,既能够满足孩子的挑战欲,又能让他们在完成任务后获得内在的成就感。本书以逻辑思维、算法思考为核心,旨在激发孩子对编程的学习计算机7.6万字 - 会员
剑指大数据:企业级电商数据仓库项目实战(精华版)
本书主要讲解了搭建一个企业级数据仓库项目的全过程,从项目需求入手,逐步讲解项目架构的设计、技术框架的选型、数据仓库项目的理论基础。接着分别讲解了大数据的数据采集、数据计算、数据仓库分层、全流程调度和指标结果可视化。本书涉及的数据仓库的数据源更加丰富、更加贴近实际开发,各技术框架的版本也进行了全面升级,数据仓库搭建过程的思路分析更加详细,并配了更多思路讲解图,更有利于读者理解。本书IT互联网程序员、计算机9.6万字 - 会员
C语言王者归来
《C语言王者归来》详细讲解了C语言的相关知识,从基本概念开始,逐步讲解程序流程控制、循环、字符串、指针、函数、结构、文件输入与输出,以及完整的大型项目设计。同时本书还进一步讲解了数据结构的基础知识,如串行、堆栈、队列与二叉树,奠定读者未来学习算法的基础。本书最后一章则是介绍C++与C语言的差异,由此可以帮助读者学习面向对象的程序开发方法。计算机14.3万字 - 会员
HBase从入门到实战
《HBase从入门到实战》系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。本书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java计算机5.2万字 - 会员
小学生Python创意编程(视频教学版)
《小学生Python创意编程:视频教学版》语言风趣幽默,讲解细致入微,案例生动有趣,能够让小朋友轻松愉悦地学习Python编程。《小学生Python创意编程:视频教学版》共分14章,以图解的形式介绍变量、条件判断、循环、列表、函数、类与对象、模块、文件、注释、异常与调试等基础知识,简单明了,易于理解;穿插许多小朋友感兴趣的项目案例,如输出爱心、绘制五角星、诗词接龙、探索运算、侦测破案、商品管理系统计算机5.9万字 - 会员
Python应用轻松入门
本书以实战项目为主线,系统介绍了Python在自动化办公、图像处理、控制各种传感器、搭建网络等工作中的实际应用案例,能够让初学者快速入门Python系列知识。全书共分为18章,第一篇为Python基础(第1章~第3章),详细介绍了Python的基础知识;第二篇为自动化办公(第4章~第6章),介绍了Word、Excel、PPT、txt、csv、JSON、图像、声频、视频等各种文件的自动化操作;第三篇计算机12.8万字 - 会员
软件设计基础理论
软件设计是软件开发的核心活动,软件设计理论的发展推动着软件工程的发展。本书梳理了基础的软件设计理论,可帮助读者更好地理解各种软件设计技术。全书共分为5章,第1章介绍软件设计基础原则;第2章介绍程序设计,帮助读者深刻认识程序设计工作背后的机理,而不是仅仅停留在掌握一门或几门程序设计语言上;第3章介绍复杂软件设计,重点包括模块化设计、信息隐藏与设计原则;第4章介绍软件设计方法学,指导读者用系统化、规范计算机13.2万字 - 会员
腾讯游戏开发精粹Ⅲ
《腾讯游戏开发精粹Ⅲ》是腾讯游戏研发团队不断积累沉淀的技术结晶,是继2019年推出《腾讯游戏开发精粹I》和《《腾讯游戏开发精粹II》后的诚意续作。本书收录了21个在上线项目中得到验证的技术方案,深入介绍了腾讯公司在游戏开发领域的新研究成果和新技术进展,涉及人工智能、计算机图形、动画和物理、客户端架构和技术、服务端架构和技术及管线和工具等多个方向。本书适合游戏从业者、游戏相关专业师生及对游戏幕后技术计算机25.5万字 - 会员
图解Java数据结构与算法(微课视频版)
《图解Java数据结构与算法:微课视频版》系统、全面地介绍数据结构的基础理论与算法设计,精选数据结构考研习题和各类典型例题进行讲解,案例和课后习题丰富,突出对数据结构算法实践能力的培养。本书算法均采用Java语言实现,示例代码可直接上机运行。《图解Java数据结构与算法:微课视频版》共分11章,内容包括数据结构与算法概述,线性表,栈和队列,串、数组和广义表,树,图,查找算法,排序算法,分治算法,贪计算机12.8万字