• Tools
  • Articles
  • Q&A
  • Login
0 0

分类器指定分出50个类,但实际上只分出5个类,什么原因造成?


样本 :训练数据中有2000条数据,每条数据含有300-500个英文单词文本;

分类器 :Topic-model

算法 :LSI

python库 :NLTK+gensim

我想指定50个类,但实际上只分出5个类,是样本数据选的不好吗?

数据挖掘与机器学习 文本分类

10 years, 2 months ago
咸鱼型杏子茶

咸鱼型杏子茶


share
咸鱼型杏子茶 10 years, 2 months ago

Answers

Your Answer

Ask Question
Related questions

分类算法中如何收集停用词?

请问在哪里能下到“文本情感分析”的标注好的数据?

NLTK中名词词性是通过什么原理去判断的?

nltk中对词性进行过滤,是不是特别消耗计算量?

训练集中任意两个文本的相似度会不会随着训练样本的增多而改变?

gensim中lsi模型如何存储?