Leon6868
V2EX  ›  Google

搜索引擎是怎么处理零宽字符的?

  •  
  •   Leon6868 · Aug 22, 2020 via Android · 3023 views
    This topic created in 2097 days ago, the information mentioned may be changed or developed.
    举个例子:
    如果我在一段文字中加入零宽字符;当我在引擎中查询这段文字,搜索搜索引擎在返回结果时,是否会忽略零宽字符?

    如以下字符串:(咱花了好久才试出来的)
    unicode:8234 前‪后 1‪2
    unicode:8235 这是真的‫可爱 1‫2
    unicode:8236 前‬后 1‬2
    unicode:8237 前‭后 1‭2
    unicode:8203 前​后 1​2
    unicode:8204 前‌后 1‌2
    unicode:8205 前‍后 1‍2
    unicode:8206 前‎后 1‎2
    unicode:8207 前‏后 1‏2

    我是否可以通过零宽字符来溯源?
    5 replies    2020-08-23 16:38:12 +08:00
    billlee
        1
    billlee  
       Aug 22, 2020
    搜索引擎都是要先分词的,零宽字符大概和空格是一样的效果吧
    TimePPT
        2
    TimePPT  
    PRO
       Aug 23, 2020 via Android
    停用词
    Leon6868
        3
    Leon6868  
    OP
       Aug 23, 2020 via Android
    @TimePPT 就是说,零宽字符不会影响搜索引擎的结果?
    TimePPT
        4
    TimePPT  
    PRO
       Aug 23, 2020 via Android
    @Leon6868 不影响
    codehz
        5
    codehz  
       Aug 23, 2020
    你用 chrome 的页内搜索功能搜索前后两个字试试(
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3338 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 11:14 · PVG 19:14 · LAX 04:14 · JFK 07:14
    ♥ Do have faith in what you're doing.