《用Python写网络爬虫》
PDF电子书:用Python写网络爬虫
作者:[澳]理查德 劳森
出版社:人民邮电出版社
副标题:web scraping with python
出版年:2016年
页数:157
电子书格式:PDF
ISBN:9787115431790
内容简介:
作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。 《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
作者简介:
Richard Lawson来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。他精通于世界语,可以使用汉语和韩语对话,并且积极投身于开源软件。他目前在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。
-
《失业白领的职场漂流》PDF电子书免费下载
本书是一部生存启示录,为失业白领、为焦虑的在职白领而写。企业当然不能为员工提供一个完全稳定和成长的环境,但随时待命、放弃休假、开夜车、全力以赴、身心负荷达到极限的不安定感,已有的教育和社会环境并未为白领做好准备。通过七个月“失业白领”的失败...
01月01日[生活]
-
《西南联大英文课》PDF电子书免费下载
《西南联大英文课》是国立西南联合大学建校80周年纪念版。品读卞之琳、查良铮、吴宓、钱锺书、许渊冲、杨振宁、汪曾祺、何兆武、季羡林的英文课本。品味影响民国一代学人的思想精髓,触摸一代文化精英的家国情怀、文化格局、教育理想和处世哲学。思考何为教育...
01月01日[教材]
-
《故事力思维》PDF电子书免费下载
会讲故事是人的本能,爱听故事是人的天性。“数字统治”时代下,谁拥有故事力思维,谁就有了核心竞争力。本书的作者是英国特许营销协会(CIM)的培训主管,深谙商业传播之道,也深知一个好的故事有着难以想象的力量。《故事力思维》中24个行之有效的关键技巧...
01月01日[小说]
-
《尸案调查科》PDF电子书免费下载
河流上游漂来两具无名浮尸,怎样确定死者身份缉获凶手? 高速公路两侧惊现11个碎尸麻包,受害人头部遭油泼毁容,车流人海中如何锁定真凶? 偏远豆腐村,一个疑点重重的上吊身亡现场,死者到底是自杀还是他杀? 深夜无人的高粱地,摩的司机被劫杀,凶手临时起...
01月01日[流行]
-
《系统思考》PDF电子书免费下载
《系统思考》丹尼斯以一种非常吸引人的方式介绍了大量美妙、甚至是幽默的案例。读这本书不需要具备任何专业知识,但书中融汇着超凡的智慧。如果你已经读过《第五项修炼》,那么本书不仅有助于加深你对系统思考的理解,也为如何使用相关的工具与方法绘制系统循...
01月01日[生活]