业余在做一个机器抓取网上文章在整合发布的网站。现在想用机器学习之类的技术能把文章按不同的内容进行分类,请问应该怎么做?谢谢!
1
likai Aug 4, 2013 via Android 中文分词作tag
|
3
maxint64 Aug 4, 2013
分词是第一步,之后是为文章建立模型,然后是做聚类。
|
4
binux Aug 4, 2013
标记,分词,找个库扔进去训练就完了
如果觉得觉得麻烦,手动提取特征tag |