有 5 亿多条中文例句文本,长度 100 个字符以内,做一个搜索引擎的功能。搜索有中文分词,查询出相应的文本和出处两个字段,可能还有其他关联字段,总的来说业务并不复杂,但是要求性能和速度,用 java 实现有什么合适的方案呢?
1
zxc12300123 Nov 22, 2019 via iPhone Elasticsearch
|
2
shawndev Nov 22, 2019
我只想问一句这个语料库能不能共享。
|
3
snappyone Nov 22, 2019 via Android
elasticsearch +1
|
4
kimari Nov 22, 2019
Elasticsearch+1
|
6
daimaosix Nov 22, 2019
Elasticsearch 稳如狗
|
7
axwz88 OP 既然大家的意见如此统一,那就决定用 es 了
|