《用Python写网络爬虫》
PDF电子书:用Python写网络爬虫
作者:[澳]理查德 劳森
出版社:人民邮电出版社
副标题:web scraping with python
出版年:2016年
页数:157
电子书格式:PDF
ISBN:9787115431790
内容简介:
作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。 《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
作者简介:
Richard Lawson来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。他精通于世界语,可以使用汉语和韩语对话,并且积极投身于开源软件。他目前在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。
-
《万历十五年》PDF电子书免费下载
《万历十五年》是黄仁宇的一部明史研究专著。1587年,在西欧历史上为西班牙舰队全部出动征英的前一年。当年,在明朝发生了若干为历史学家所易于忽视的事件。这些事件,表面看来虽似末端小节,但实质上却是以前发生大事的症结,也是将在以后掀起波澜的机缘。其...
01月01日[文化]
-
《绿房子》PDF电子书免费下载
《绿房子》的故事发生在相距很远的两处地方,即位于秘鲁海边沙漠地区的皮乌拉市和远在亚马逊流域心脏地带的能够经商和传教的圣玛丽亚·德·聂瓦镇。故事的象征物就是那非常出名的,由外地人安塞尔莫建造的享乐中心——绿房子。 《绿房子》出版于1965年,第二...
01月01日[文化]
-
《关系的重建》PDF电子书免费下载
在《关系的重建》一书中,阿米尔·莱文与蕾切尔·赫尔勒阐释了他们对于成人依恋关系的理解,这也是迄今前沿的亲密关系科学成果。他们将依恋倾向分为三类:焦虑型:他们常常沉迷于亲密关系不可自拔,常常怀疑自己的伴侣是否能回馈与自己同样的爱。回避型:他们...
01月01日[生活]
-
《盲剑楼奇谭》PDF电子书免费下载
一九四五年九月,金泽著名的艺伎馆“盲剑楼”发生了一起密室袭击案,在出入口皆被封住的屋子里,五个无赖被一瞬间斩杀,目击者声称他们是被一位“美剑客”处决的。莫非这位“美剑客”就是盲剑楼庭院的祭祠内供奉的“盲剑大人”?七十多年后,吉敷竹史与前妻通...
01月01日[小说]
-
《大仲马集(世界名著名译文库 共八册)》PDF电子书免费下载
01《三个火枪手》(全二册)小说主要描述了法国红衣大主教黎塞留,从1624年出任首相到1628年攻打并占领胡格诺教派的主要根据地拉罗谢尔城期间所发生的事。黎塞留为了要帮助国王路易十三,千方百计要抓住王后与英国首相白金汉公爵暧昧关系的把柄。而作品主人公...
01月01日[小说]