• 请不要在回答技术问题时复制粘贴 AI 生成的内容
hiddenstrawberry
V2EX  ›  程序员

拒绝爬虫从入门到入狱!中国爬虫违法违规案例汇总

  •  
  •   hiddenstrawberry · Sep 29, 2019 · 7415 views
    This topic created in 2420 days ago, the information mentioned may be changed or developed.

    最近在公司做了一期技术合规相关的分享,反响不错。把搜集的资料汇总了下发到了 Github,整理了爬虫在中国大陆涉诉与违规相关的新闻、资料与法律法规。帮助各位爬虫从业者了解我国相关法律,避免触碰数据合规红线。

    https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China

    欢迎大家补充案例,提交 PR~

    8 replies    2019-09-30 14:46:33 +08:00
    gIrl1990
        1
    gIrl1990  
       Sep 29, 2019
    哎哟,不错哦~
    arcaitan
        2
    arcaitan  
       Sep 30, 2019
    好优秀,跟了。
    是不是现在不管做什么爬虫都有被抓的概率?
    aptx4689
        3
    aptx4689  
       Sep 30, 2019 via iPhone
    那像天眼查这种动不动就让你开会员从 zf 网站爬数据的为什么不抓
    efaun
        4
    efaun  
       Sep 30, 2019
    @aptx4689 #3 很明显交了钱的啊
    zhangalong69
        5
    zhangalong69  
       Sep 30, 2019
    自 9 月份开始,一场迅疾浩大的风暴席卷了大数据风控行业,让整个行业如履薄冰。
    9 月 6 号下午,杭州魔蝎数据科技有限公司疑被警方控制,CEO 周江翔被警方带走调查。

    同日,新颜科技人工智能科技有限公司 CEO 黄向前也被警方要求协助调查。

    9 月 11 号晚上,公信宝实体运营公司——杭州存信数据科技有限公司被查封。

    9 月 12 日上午,天翼征信的总经理、副总经理以及市场人员被警察带走调查。
    hiddenstrawberry
        6
    hiddenstrawberry  
    OP
       Sep 30, 2019 via iPhone
    @efaun
    @aptx4689 其实不是的,基于我的认知给大家说一下
    首先大家可以发现一个很鸡贼的点,天眼查所有的 公网抓取的数据都是公开的,比如裁判文书,比如工商信息,这些都是不收费登录就可以看的。其实这就相当于没有获利,所以应该是没有法律风险的。天眼查主要收费的点在于人与人之间的关联,人与公司的关联。再有就是 api 收费,这其实都能被天眼查解释为服务费了……因为看数据其实是不要钱的。
    是否被抓很重要的一个判定的点就是是否获利。
    hiddenstrawberry
        7
    hiddenstrawberry  
    OP
       Sep 30, 2019 via iPhone
    @arcaitan 还是这句话,你只要不得罪大佬(参考头条案例),没靠抓来的数据赚钱,其实就没什么事……
    Simon0cc
        8
    Simon0cc  
       Sep 30, 2019
    广州有个做车辆违章数据的,爬交管网数据然后拿去卖,抓了公司几个头和做爬虫的技术
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1298 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 333ms · UTC 17:28 · PVG 01:28 · LAX 10:28 · JFK 13:28
    ♥ Do have faith in what you're doing.