会员
网络数据采集技术:Java网络爬虫实战
钱洋等更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
主页
同类热门书
最新上架
- 会员
响应式编程实战:构建弹性、可伸缩、事件驱动的分布式系统
本书展示了如何利用事件驱动和响应式原理来构建健壮的分布式系统,减少延迟并提高吞吐量——特别是在微服务和无服务器应用程序中。本书分为四部分:第一部分介绍响应式的背景、环境和内容;第二部分深入讲解响应式,涵盖分布式系统的弊端、响应式系统和响应式编程;第三部分阐述如何使用Quarkus构建响应式应用程序,涵盖响应式引擎、响应式编程库SmallRyeMutiny、HTTP以及响应式数据访问的相关知识;第计算机11.1万字 - 会员
C语言程序设计教程(第5版)
本书介绍利用C语言进行程序设计的基本知识。全书共11章,主要内容包括C语言概述,数据类型、运算符与表达式,数据的输入和输出,选择结构,循环结构,数组,函数,编译预处理,指针,结构体与共用体,文件等。每章还配有大量的习题,便于读者巩固所学知识,掌握程序设计的基本方法和编程技巧。本书力求概念叙述准确、严谨,语言通俗易懂,适合作为高等院校理工科非计算机专业的C语言程序设计课程教材,也可供工程技术人员参考计算机13.1万字 - 会员
让Python遇上Office:从编程入门到自动化办公实践
本书将从零开始教读者如何通过Python实现办公自动化。全书共10章,分为3部分:第一部分(第1~5章)包括从零基础入门Python的基础知识(数据类型、函数、类与对象、捕获异常、文件操作、管理模块等);第二部分(第6~9章)以操作办公文档为主,介绍如何使用Python代码处理Word、Excel、PPT、PDF文档,实现文档办公自动化;第三部分(第10章)为进阶部分,内容涉及桌面自动化、发送邮件计算机15.4万字 - 会员
整理优先:小改进,大回报,整洁代码设计指南
本书分为三部分:第1部分介绍代码的整理(微型重构);第二部分讨论如何将整理工作整合到开发工作流程中;第三部分深入探讨什么是软件设计、软件设计如何驱动软件开发和运营成本以及软件开发和运营成本又如何驱动软件设计、投资软件结构与不投资软件结构之间的权衡是什么、我们可以利用哪些经济和人文原则来决定是否以及如何改变软件结构。计算机3.7万字 - 会员
零基础快速入行入职软件测试工程师(第2版)
本书为软件测试初学者量身打造,从零开始,覆盖软件公司招聘的基本要求。全书分为16章,涵盖了软件测试的核心概念、功能测试方法、Linux基础知识、MySQL数据库管理、Web自动化测试框架、HTTP接口测试、Charles抓包工具的使用、Python接口自动化测试、AI赋能软件测试,以及如何制作求职简历等内容。此外,本书还提供精选面试题及参考答案,助力读者通过面试。全书知识体系循序渐进,紧跟读者需求计算机19.1万字 - 会员
Java到Kotlin:代码重构指南
本书讲述了如何从Java过渡到Kotlin,主要关注代码,每章都阐述了从Java过渡到Kotlin的一个方面,考察了典型Java项目在这个过程中可以改进的方面。比如,从Optional到nullable,从Bean到值,从开放类到密封类。每章首先解释关键概念,然后展示如何在保持互操作性的前提下,逐步且安全地将生产型Java代码重构为惯用的Kotlin代码,由此产生的代码更简单、更有表现力,也更容易计算机14.5万字 - 会员
写给青少年的人工智能(Python版·微课视频版)
本书以通俗易懂的方式介绍人工智能的基础知识及其应用,采用案例的形式讲解,方便读者轻松阅读。全书共5章,首先介绍人工智能的基础知识,然后从文本、图像、语音三方面介绍自然语言处理、图像处理、语音识别等人工智能研究领域,最后通过实战案例让读者全面了解人工智能的应用。本书适合有志于了解人工智能基础知识及应用的初、高中学生,也可以作为人工智能初学爱好者的学习资料。计算机4.9万字 - 会员
Podman实战
本书主要介绍了如何构建、管理和运行容器,解释如何将人们在Docker中学到的技能轻松地转移到Podman上,以及如果你以前从未使用过容器引擎,你该如何轻松地学习使用Podman。本书还教你使用像pod这样的高级功能,并指导你构建准备在Kubernetes边缘或内部运行的应用程序。最后,本书解释了Linux内核中用于将容器与系统和其他容器进行隔离的所有安全功能。本书适用于希望了解、开发和使用容器的软计算机11.9万字 - 会员
Web交互界面设计与制作(微课版)
本书在编写过程中坚持理论性和实用性相结合,力求与互联网行业技术发展同步,着重提高读者Web交互界面设计和制作的能力。全书共9章,内容包括交互界面设计概述、Web交互界面设计基础、Web交互界面技术概述、HTML5和CSS3基础、Web交互界面设计案例、HTML5和CSS3进阶、JavaScript基础、Web交互界面开发、综合案例:网站交互界面开发。本书系统地介绍Web交互界面设计与制作的全过程,计算机11.2万字