cqcn1991
V2EX  ›  问与答

爬虫求助: 美亚的书有人抓过没?有啥好方法?

  •  
  •   cqcn1991 · Apr 22, 2017 · 3506 views
    This topic created in 3308 days ago, the information mentioned may be changed or developed.

    主要是关注亚马逊有哪些新书出来

    每本书的信息,评论、评分似乎都挺好抓

    9 replies    2017-04-22 16:32:35 +08:00
    cqcn1991
        1
    cqcn1991  
    OP
       Apr 22, 2017
    我个人找到的是, https://www.amazon.com/gp/new-releases/books 感觉可以爬一爬
    zyEros
        2
    zyEros  
       Apr 22, 2017 via iPhone
    亚马逊会给你假信息的
    Pysensor
        3
    Pysensor  
       Apr 22, 2017
    解析亚马逊的页面就足够喝一壶了。。
    cqcn1991
        4
    cqcn1991  
    OP
       Apr 22, 2017 via iPhone
    @zyEros
    @Pysensor 靠…有这么难?!
    Pysensor
        5
    Pysensor  
       Apr 22, 2017
    @cqcn1991 你随便点开个商品看看页面源代码。。看看怎么清洗信息比较妥当
    clanned
        6
    clanned  
       Apr 22, 2017 via Android
    也许可以参考我这个 https://github.com/xdtianyu/FreeKindle
    cqcn1991
        7
    cqcn1991  
    OP
       Apr 22, 2017 via iPhone
    @Pysensor 书的基本信息应该是有 api 之类,就是 isbn 直接获取信息,因为之前看 library genesis 有调用
    ilcn
        8
    ilcn  
       Apr 22, 2017
    libgen 有数据库下载你可以去看一下。有 index 和 dump 两种。 mysql 的 dump 是 15g 还是 30g ,直接按时间抓出来就行了
    cqcn1991
        9
    cqcn1991  
    OP
       Apr 22, 2017 via iPhone
    @ilcn …厉害…学到了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2995 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 15:20 · PVG 23:20 · LAX 08:20 · JFK 11:20
    ♥ Do have faith in what you're doing.