我看了下贝叶斯分类器和ID3感觉都解决不了。求内行指引下方向。
1
chlx Nov 1, 2013
可行但是准确率达不到100%.分类器不是关键,这种短文本的分类任务中,特征更重要。
|
2
wizardoz Nov 1, 2013
这个是数学建模题吧,这种题不可能100%准确的。考量标准是你的模型分类的正确率。
|
3
brikhoff Nov 1, 2013
500块我给你分,我人工分^_^
|
4
zzNucker Nov 1, 2013
标题么? 那用统计方法是有点难
|
5
solos Nov 1, 2013
试下余弦定理计算相似性
|
7
miaoever Nov 1, 2013
一般用贝叶斯分类起吧。不过,标题一般比较短,能够提取的特征不多,再加上只有 500 条已知类别的,估计效果不会太好。
|
10
solos Nov 1, 2013
关键词聚类行不? https://code.google.com/p/word2vec/
|
11
efi Nov 2, 2013
只有正样本,没有负样本,不可能做分类。可以做回归分析,比相似性,设阈值取类,正确率无保证。
|
12
holy_sin Nov 4, 2013
svm ?
|