V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
valkyrja
V2EX  ›  问与答

如何实现快速中文搜索?

  •  
  •   valkyrja · May 11, 2017 · 1867 views
    This topic created in 3285 days ago, the information mentioned may be changed or developed.
    有 500 条中文字符串需要在 13 万条的备选数据里检索相似度最高的五条,请教大佬们有好的实现方法吗?目前的思路是用 bk tree 来做,不知道是否可行?
    3 replies    2017-05-12 00:43:10 +08:00
    valkyrja
        1
    valkyrja  
    OP
       May 11, 2017 via Android
    标题好像打错了😂是中文近似匹配
    luxinxin
        2
    luxinxin  
       May 12, 2017 via iPhone
    得看近似是什么样的近似了,编辑距离是一种近似,同义词也是近似,两者实现的难度完全不一样
    valkyrja
        3
    valkyrja  
    OP
       May 12, 2017 via Android
    @luxinxin 谢谢大佬 我指的就是编辑距离 不需要同义词 所以想到了 bk 树 不知道中文用这个方法靠谱吗
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3067 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 12:57 · PVG 20:57 · LAX 05:57 · JFK 08:57
    ♥ Do have faith in what you're doing.