yanng

tuicool.com 网的朋友不要全文抓取我 blog 的文章

  •  
  •   yanng · Mar 10, 2014 · 4175 views
    This topic created in 4456 days ago, the information mentioned may be changed or developed.
    可以使用链接,但全文抓取商业使用,我觉得不好,还请以后不要这么做了。之前好像看到过这个网站的招聘,另外想看看大家怎么看这件事的,全文抓取,对原作者没有任何好处的,好像有点没劲。
    (to推酷的朋友:我的个人资料里有博客地址)
    10 replies    1970-01-01 08:00:00 +08:00
    levan
        1
    levan  
       Mar 10, 2014 via iPhone
    这个应该去ruby china 发 他们应该在那
    Livid
        2
    Livid  
    MOD
    PRO
       Mar 10, 2014   ❤️ 1
    loading
        3
    loading  
       Mar 10, 2014
    太可耻了。
    Mihuwa
        4
    Mihuwa  
       Mar 10, 2014
    yanng
        5
    yanng  
    OP
       Mar 10, 2014
    @Mihuwa 原来不止我一个人的网站被抓取,个人觉得抓取作为个人使用没问题的,搜索引擎都不会全文拿去,商业网站更不能这么做。
    hadoop
        6
    hadoop  
       Mar 10, 2014
    还有一个 博客聚合站也是,巨讨厌,抓了之后还会把里面一些链接换成自己的
    FarBox
        7
    FarBox  
       Mar 10, 2014
    @yanng 很抱歉,这个我们甚至都帮不上忙。原本想增加一个用户自定义的user-agent过滤,但我在nerdyang.com的访问日志里,找了半天,没有找到tuicool的user-agent……
    yanng
        8
    yanng  
    OP
       Mar 10, 2014 via iPad
    @FarBox 这么高大上的技术,没什么,他们看到了相信会处理的,另外一个帖子的人都给删掉了。
    yanng
        9
    yanng  
    OP
       Mar 11, 2014
    请 @guiquba 及时处理一下。
    kernel1983
        10
    kernel1983  
       Mar 11, 2014
    同意, http://simple-is-better.com/ 也喜欢全文抓

    还是要推荐 http://news.pychina.org/ 这种形式的玩法

    笑而不语:)
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2760 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 54ms · UTC 12:53 · PVG 20:53 · LAX 05:53 · JFK 08:53
    ♥ Do have faith in what you're doing.