• 请不要在回答技术问题时复制粘贴 AI 生成的内容
woscaizi
V2EX  ›  程序员

大佬们, http://chuansong.me/ 传送门,这个网站是怎么爬取到最新的公众号文章的?

  •  
  •   woscaizi · Jan 4, 2018 · 3961 views
    This topic created in 3053 days ago, the information mentioned may be changed or developed.
    搜狗微信搜索是做了反扒的,求解。
    15 replies    2018-01-05 00:17:22 +08:00
    forestyuan
        1
    forestyuan  
       Jan 4, 2018
    是公众号作者自己提交的,可能微信有接口取数据吧
    mcfog
        2
    mcfog  
       Jan 4, 2018 via Android
    搜微信群控
    so1n
        3
    so1n  
       Jan 4, 2018   ❤️ 1
    可能用一个自己的微信小号关注后,自动获取把
    F1024
        4
    F1024  
       Jan 4, 2018
    微信网页版 抓个文章不是轻轻松松吗
    oonnnoo
        5
    oonnnoo  
       Jan 4, 2018
    直接爬它就好啦~
    F1024
        6
    F1024  
       Jan 4, 2018
    我又看了下 搜狗微信可以直接爬 打开源码就能找到相应信息 应该没什么反爬
    woscaizi
        7
    woscaizi  
    OP
       Jan 4, 2018 via iPhone
    @F1024
    试试一次打开多篇文章,会弹验证码的
    caomu
        8
    caomu  
       Jan 4, 2018 via Android
    谢谢 lz,原来已经恢复更新了啊。
    woscaizi
        9
    woscaizi  
    OP
       Jan 4, 2018 via iPhone
    爬到的数据包含阅读数,点赞数。
    所以数据来源应该和搜狗微信无关了。
    通过微信小号关注公众号然后爬取文章这个方法非常有可能。
    F1024
        10
    F1024  
       Jan 4, 2018
    验证码 只弹出一次 后面我猛打开十几篇也没出现验证码了
    AlwaysBee
        11
    AlwaysBee  
       Jan 4, 2018
    这个网站已经被卖了
    iyaozhen
        12
    iyaozhen  
       Jan 4, 2018 via Android
    这个网站很久远了。还没有搜狗微信搜索的时候就有了。估计还是客户端抓取的
    angith
        13
    angith  
       Jan 4, 2018 via Android
    这个站去年 不 前年的时候还比较火的 我还找站长加了我的公众号的
    wzwwzw
        14
    wzwwzw  
       Jan 4, 2018
    搜狗微信好像也只能爬取十条的吧。
    remenbo
        15
    remenbo  
       Jan 5, 2018
    被卖了多少钱啊 现在还是更新得很大
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3080 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 77ms · UTC 04:11 · PVG 12:11 · LAX 21:11 · JFK 00:11
    ♥ Do have faith in what you're doing.