日常书荒,今天产生了一个想法是是否可以利用训练对网络上繁杂的小说进行筛选。
比如我可以人工总结一些自己比较喜欢的小说,比如有 20 本,A B C D E F G...如果作为语料库的话也有个几百上千万字,应该不算少了。然后搞一个系统,训练,以后再看到新的小说推荐的话先跑个分(例如衡量新小说跟喜欢的语料库的相似度),相似度分太低就不看了?
对 nlp 基本上是完全不了解,不知道能不能实现,用什么技术比较合适。我感觉从逻辑上讲,要训练网络去找一本小说的情节是否跌宕起伏、引人入胜,应该是比较困难的工作。但是如果要判断一本小说的文笔是否过于小白,感觉应该还是能做到?