比如一段关于比特币的文字,怎么将里面最核心的关键字提取出来?提取 3-5 个,比如下面这段文字:
“ SegWit2x 升级定于 11 月 16 日开始生效。该升级旨在提升比特币交易的速度,并将同时提高交易的手续费。不过,过去几个月来,越来越多的比特币开发者不再支持比特币的升级。
业内大佬向 CNBC 表示:“我们的目标一直是比特币顺利的升级。不幸的是,很显然我们没有足够的共识来进行升级。继续目前的道路可能分裂社区,并阻碍比特币的发展。随着比特币交易手续费的提升,开发人员一直希望数字货币社区能获得共识,解决这一问题。””
程序上怎么实现提取核心的关键字?我的思路是这样:
1、词库里面匹配,将文章全部打散成关键字
2、检测重复次数最多的关键字
3、去掉通用关键字(做一个通用关键字表,每个关键字都有相关通用率)
4、去掉通用之后保留的 3-5 个应该就是核心关键字了
可行吗?
“ SegWit2x 升级定于 11 月 16 日开始生效。该升级旨在提升比特币交易的速度,并将同时提高交易的手续费。不过,过去几个月来,越来越多的比特币开发者不再支持比特币的升级。
业内大佬向 CNBC 表示:“我们的目标一直是比特币顺利的升级。不幸的是,很显然我们没有足够的共识来进行升级。继续目前的道路可能分裂社区,并阻碍比特币的发展。随着比特币交易手续费的提升,开发人员一直希望数字货币社区能获得共识,解决这一问题。””
程序上怎么实现提取核心的关键字?我的思路是这样:
1、词库里面匹配,将文章全部打散成关键字
2、检测重复次数最多的关键字
3、去掉通用关键字(做一个通用关键字表,每个关键字都有相关通用率)
4、去掉通用之后保留的 3-5 个应该就是核心关键字了
可行吗?
)