dndx

有没有人考虑做密码泄漏中招查询网站?

  •  
  •   dndx · Dec 22, 2011 · 6577 views
    This topic created in 5268 days ago, the information mentioned may be changed or developed.
    实际上,技术实现也会很蛋疼,只能考虑把4000W条记录全部Cache到Memory里。MySQL、MongoDB神马的基本上没用,因为必然每次都是4000W的全表扫描,网友涌来服务器必宕无疑。

    如果有同学能提供8G内存的VPS,这事还比较靠谱。可以来联系我Twitter@dndxdndx

    我用Python试了一下,600W条内存记录遍历一次大概需要0.4s,可以忍受。
    23 replies    1970-01-01 08:00:00 +08:00
    rfwert343
        1
    rfwert343  
       Dec 22, 2011
    不用直接下载以后看更快
    cdh_ys
        2
    cdh_ys  
       Dec 22, 2011
    http://t.easyicon.cn/ 不到0.4s吧
    dndx
        3
    dndx  
    OP
       Dec 22, 2011
    @cdh_ys E-Mail和用户名都遍历,因为记不住用户名的人是相当多的。
    rfwert343
        4
    rfwert343  
       Dec 22, 2011
    @dndx 你不如直接做个链接网站,电驴分享的,不消耗服务器。
    dndx
        5
    dndx  
    OP
       Dec 22, 2011
    @cdh_ys 另外这个站用的是精确匹配
    比如你叫dndx123,你搜dndx是搜不到的
    这样能利用索引,所以速度快
    代价是记不清用户名就悲剧了。
    rfwert343
        6
    rfwert343  
       Dec 22, 2011
    @dndx 做个电驴链接分享网站,用discuz论坛就能搭建一个。然后下载都是用户自己下载用户的,你就不用担心服务器耗不起了。
    dndx
        7
    dndx  
    OP
       Dec 22, 2011
    @dndx 上条纠正,这个站应该是like %xxx% 匹配的
    dndx123是能用dndx搜到的。
    dndx
        8
    dndx  
    OP
       Dec 22, 2011
    @rfwert343 小心跨省啊。
    rfwert343
        9
    rfwert343  
       Dec 22, 2011
    @dndx 你直接做个密码查询网站数据都在你网站上,岂不是更要抓你?
    dndx
        10
    dndx  
    OP
       Dec 22, 2011
    @rfwert343 但是在显示结果前你可以给密码打码,客观上你并没有传播别人的密码,也就无从跨省了。
    rfwert343
        11
    rfwert343  
       Dec 22, 2011
    @dndx 话是这样说,可是你说哪个更容易被封呢?数据都在你的服务器上呢。
    lxklz
        12
    lxklz  
       Dec 22, 2011
    http://leak.xpcha.com/csdn/ 这个也很快,但好像只能精确匹配
    willerce
        13
    willerce  
       Dec 22, 2011
    多简单的事,放数据库就OK了,分表嘛。
    dreamersdw
        14
    dreamersdw  
       Dec 22, 2011
    方法有很多种
    1)像 @willere 说的那样放数据库里,加上索引,或者分区。
    2)虽然是文件数据,但努力一下也可以像 ctags 那样,实现二分查找。
    3)利用文件系统实现查找功能,比如建立多层文件夹表示用户名 /path/s/o/m/e/o/n/e/
    CMGS
        15
    CMGS  
       Dec 23, 2011
    目前放出来的都是精确匹配,数据入数据库,索引Email和Name……
    模糊的……恩有……纯文本grep,下面有提供方案……
    http://www.v2ex.com/t/24087#reply15

    哈欠……睡觉去……
    feiandxs
        16
    feiandxs  
       Dec 23, 2011
    我一直想知道
    xmd5这种站是怎么做到的。。。
    billions of key/values....
    delectate
        17
    delectate  
       Dec 23, 2011
    文件系统io是瓶颈;grep更快
    delectate
        18
    delectate  
       Dec 23, 2011
    grep+正则还可以支持模糊匹配
    taby
        19
    taby  
       Dec 23, 2011
    金山已经出了吧
    vibbow
        20
    vibbow  
       Dec 23, 2011
    http://vsean.net/blog/post/98 5个数据库全文搜索,搜一次3分钟...
    jakori
        21
    jakori  
       Dec 24, 2011
    这玩意估计就一阵风,这阵风过了,还会有多少用户来查询咧
    dndx
        22
    dndx  
    OP
       Dec 24, 2011
    @feiandxs CMD5大多数情况下查询都会告诉你“已加入队列,完毕后E-Mail通知”
    这不很显然嘛。
    Showfom
        23
    Showfom  
    PRO
       Dec 24, 2011
    已联系~
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1143 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 73ms · UTC 23:16 · PVG 07:16 · LAX 16:16 · JFK 19:16
    ♥ Do have faith in what you're doing.