• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Feiox
V2EX  ›  程序员

一个收集网上垃圾网站的 Github repo 。。。。

  •  
  •   Feiox ·
    feiox · Nov 19, 2015 · 7177 views
    This topic created in 3834 days ago, the information mentioned may be changed or developed.

    转一下 README.md 懒得再打一遍了。

    互联网垃圾网站列表 Github repo

    这里是收集到的互联网上的垃圾网站列表。

    使用

    您可以这样利用它:
    * Chrome :您可以将它导入到 Chrome 的 Personal Blocklist 插件中,用以屏蔽 Google 搜索结果中的垃圾网站。
    * Firefox :我并不是一个 FF 用户,希望您能帮助我找到这类插件

    对垃圾网站的定义

    P.S. 并不完整,欢迎补充

    19 replies    2016-12-27 16:15:45 +08:00
    chinvo
        1
    chinvo  
       Nov 19, 2015
    kafan 这么流氓怎么能不上榜,已 pr
    coolcfan
        2
    coolcfan  
       Nov 19, 2015
    @chinvo 可能因为毕竟还是有有一定质量的 UGC 在上面……
    Sequencer
        3
    Sequencer  
       Nov 19, 2015 via iPhone
    如何 duckduckgo 可以有这种 block 插件就好了
    lizhenda
        4
    lizhenda  
       Nov 19, 2015
    这个不错哈~~
    caomu
        5
    caomu  
       Nov 19, 2015 via Android
    kafan 的 bbs 还是有用的,那个什么教程就可以屏蔽。
    hellokt
        6
    hellokt  
       Nov 19, 2015
    不得不回一条,kafan 垃圾的令人发指!不过滤这个的列表根本不是一个有效的列表.
    vivisidea
        7
    vivisidea  
       Nov 19, 2015
    操作略麻烦,还要安装 chrome 插件才能屏蔽,为什么 google 不设置一个云端的 personal blocklist 呢
    这样不管在哪台机器上,只要登陆了 google 账号,搜索结果自动帮我屏蔽掉
    skylancer
        8
    skylancer  
       Nov 19, 2015
    @vivisidea 曾经是有的,只不过你要问为什么 Google 要关了这功能
    Feiox
        9
    Feiox  
    OP
       Nov 19, 2015
    @Sequencer 自己开发一个 Chrome 插件呀 ~
    @caomu @hellokt @caomu 真的?这么严重?我看了一下,感觉并不是很,,,内容不至于全部是垃圾吧?(是不是那种抓别人网站的爬虫站呢?)不过已接受 pr
    imlonghao
        10
    imlonghao  
       Nov 19, 2015
    我曾经打算自己做这个列表,但是觉得有些网站我想 BLOCK ,但是他里面又有一点有用的东西,然后很纠结
    Licamla
        11
    Licamla  
       Nov 19, 2015   ❤️ 1
    firefox 有一个 block site 插件可以用,这个是我改的列表 http://pan.baidu.com/s/1jG2erxO
    或者直接用 adblock 也可以。
    Feiox
        12
    Feiox  
    OP
       Nov 19, 2015
    @imlonghao 对,有些博客被一些爬虫站抓取,但过一段时间该博客关闭了,这时候,这些爬虫站却变成“凑合能看也比没有强”的地方了。。。
    Sequencer
        13
    Sequencer  
       Nov 19, 2015
    @Feiox 如果搜索引擎官方支持就好了 因为 Chrome 内存吃的可怕 云也不方便 还是在用 Safari
    Slienc7
        14
    Slienc7  
       Nov 19, 2015
    https://goo.gl/jWoiR3
    我自己用的列表,只有垃圾搜索站。放在 Gist 上了。
    SparkMan
        15
    SparkMan  
       Nov 19, 2015
    我的网站被爬虫快搞死了 http://www.scooter-monocycle.com
    Feiox
        16
    Feiox  
    OP
       Nov 19, 2015
    @SparkMan 这是什么意思?
    @xgowex 谢了,我把它们加进了。

    除了中文,英文垃圾站的列表大家有没有、、、、、
    xjoker
        17
    xjoker  
       Nov 20, 2015
    so.vjiangyin.net

    也算是一个垃圾站
    Kuso
        18
    Kuso  
       Dec 27, 2016
    @Feiox
    谢谢你收集整理这个列表!
    现在还有 3 个误伤的网站:
    google.com
    imgur.com
    mafengwo.cn
    (原谅我没去 github 的 issues 里反馈)
    Kuso
        19
    Kuso  
       Dec 27, 2016
    @Feiox
    还发现这两个:
    lofter.com
    blog.sina.com.cn
    虽然存在滥用,有垃圾内容,但不完全是垃圾站。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5284 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 64ms · UTC 07:37 · PVG 15:37 · LAX 00:37 · JFK 03:37
    ♥ Do have faith in what you're doing.