• 请不要在回答技术问题时复制粘贴 AI 生成的内容
xmflswood
V2EX  ›  程序员

求微信聊天记录搜索算法的思路

  •  
  •   xmflswood · Dec 5, 2018 · 3714 views
    This topic created in 2758 days ago, the information mentioned may be changed or developed.

    今天发现微信的聊天记录搜索算法有点特殊:

    例如聊天记录中有 evan69780 这句话

    1.搜索 evan 匹配

    2.搜索 evan697 匹配

    3.搜索 van 不匹配

    4.搜索 697 匹配

    5.搜索 97 不匹配

    请问这是一种什么思路呢?(想必是通过牺牲一定的准确性来提升搜索效率)

    12 replies    2018-12-05 20:09:24 +08:00
    wdv2ly
        1
    wdv2ly  
       Dec 5, 2018 via Android
    就是个 bug 而已
    boileryao
        2
    boileryao  
       Dec 5, 2018 via Android   ❤️ 1
    应该是分词+前缀适配
    reself
        3
    reself  
       Dec 5, 2018 via Android
    顶楼上,我也觉得很可能是分词+前缀
    ballshapesdsd
        4
    ballshapesdsd  
       Dec 5, 2018
    van you see?
    mumbler
        5
    mumbler  
       Dec 5, 2018
    97 之于 evan69780 可能权重太低而被过滤了,不如 97 年,1997
    337136897
        6
    337136897  
       Dec 5, 2018
    楼主大佬请问下微信的聊天记录的数据库如何打开。。。
    graysheeep
        7
    graysheeep  
       Dec 5, 2018
    @337136897 你能打开张小龙直接 500W 请你过去
    unsized
        8
    unsized  
       Dec 5, 2018
    @graysheeep 现在的不知道能不能打开。至少今年 1,2 月份的时候可以。Android
    azh7138m
        9
    azh7138m  
       Dec 5, 2018
    我猜类似 bitap 这种,取决于 score 怎么给和 token 怎么做

    https://en.wikipedia.org/wiki/Bitap_algorithm
    rb6221
        10
    rb6221  
       Dec 5, 2018 via iPhone   ❤️ 2
    xmflswood
        11
    xmflswood  
    OP
       Dec 5, 2018
    @janus77 感谢!
    falsemask
        12
    falsemask  
       Dec 5, 2018
    刚测了一下,对方手机是 iphone,我的是安卓,我搜 van 搜不到,她能搜到
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   902 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 61ms · UTC 21:08 · PVG 05:08 · LAX 14:08 · JFK 17:08
    ♥ Do have faith in what you're doing.