《用Python写网络爬虫》勘误

更多

《用Python写网络爬虫》这本书已经出版差不多两个月了,之前一直较忙,没有顾得上更新博客,今天先补上这本书的勘误,后续再将读书笔记等补齐(读书笔记地址:http://www.pythoner.com/495.html)。

想要购买本书的朋友可以通过京东当当亚马逊异步社区等渠道购买,其中部分购买渠道可以购买到本书的电子版。

和《Python核心编程(第三版)》不同,这本书是我第一次完整翻译全书(出版书籍)。虽然在翻译后又审阅多次,但是拿到成书后再读,还是会发现很多不妥之处。因此,还望各位读者对不当之处多加批评指正。

书中勘误可以通过异步社区来提交,每提交成功一个勘误可以获得100积分(相当于1元RMB),该积分可以用于换取样书。当然,您也可以在本文评论中提交。

本书中代码均已经过测试,原著中存在错误或易产生误解的地方都已进行了修改。最初想将搭建本书环境时遇到的各种问题总结一问,不过因为当时未能及时记录,现在也很难再回溯了。

如下是本书中文版(1版1印)的勘误:

页数 章节 位置 原文 勘误 备注
20 第1章 最后1行 Throttle对爬虫进行限速 throttle对爬虫进行限速 此处指代下面代码中的throttle对象,而非Throttle类
88 第5章 第2段第4行 在网络较慢时会经常会失败 在网络较慢时会经常失败
91 第6章 “表单编码”第2段 http://www.w3.org/TR/html5/forms.html#selectinga-form-submission-encoding http://www.w3.org/TR/html5/forms.html#selecting-a-form-submission-encoding selecting与a之间少了一个横线。感谢异步社区用户Lancelot86提交该勘误。
138 第8章 第3段第1行 优化放置 优化设置

用Python写网络爬虫_人民邮电_1版1印_勘误.xlsx

如果有读者阅读了英文版,可以参考我在翻译时对英文版进行的勘误:
Web.Scraping.with.Python_Packt_Errata.xlsx

本文内容遵从CC3.0版权协议,转载请注明:转自Pythoner

本文链接地址:《用Python写网络爬虫》勘误

  1. 请问李老师,用Python写网络爬虫这本书的vagrant的box镜像没法在线下载:
    D:\scrapybook>vagrant up –no-parallel
    Bringing machine ‘web’ up with ‘docker’ provider…
    Bringing machine ‘spark’ up with ‘docker’ provider…
    Bringing machine ‘es’ up with ‘docker’ provider…
    Bringing machine ‘redis’ up with ‘docker’ provider…
    Bringing machine ‘mysql’ up with ‘docker’ provider…
    Bringing machine ‘scrapyd1’ up with ‘docker’ provider…
    Bringing machine ‘scrapyd2’ up with ‘docker’ provider…
    Bringing machine ‘scrapyd3’ up with ‘docker’ provider…
    Bringing machine ‘dev’ up with ‘docker’ provider…
    ==> web: Docker host is required. One will be created if necessary…
    web: Vagrant will now create or start a local VM to act as the Docker
    web: host. You’ll see the output of the vagrant up for this VM below.
    web:
    docker-provider: Box ‘lookfwd/scrapybook’ could not be found. Attempting to
    find and install…
    docker-provider: Box Provider: virtualbox
    docker-provider: Box Version: >= 0
    The box ‘lookfwd/scrapybook’ could not be found or
    could not be accessed in the remote catalog. If this is a private
    box on HashiCorp’s Atlas, please verify you’re logged in via
    vagrant login. Also, please double-check the name. The expanded
    URL and error message are shown below:

    URL: [“https://atlas.hashicorp.com/lookfwd/scrapybook”]
    Error: [em_yali]

  1. 暂无 Trackback

[em_zan] [em_yali] [em_xiao] [em_xhj] [em_tucao] [em_tu] [em_tiaopi] [em_sx] [em_sdz] [em_sbq] [em_mobai] [em_kzh] [em_ku] [em_ksh] [em_keai] [em_jiong] [em_jing] [em_hx] [em_han] [em_ganga] [em_daxiao] [em_cool] [em_chi] [em_bu] [em_bizui] [em_ai]

return top