LDA主题模型需要预先设定好主题的个数,那么该如何确定?有什么通用的方法吗?
1个回答
可以用coherence scores来确定,具体方法类似于k means的手肘法,然后利用coherence scores去找拐点。
python里可以用gensim实现lda的主体个数选取。
相关主题
NLP里的OOV是什么意思?
2回答
自然语言处理中的分词是什么意思?
1回答
求推荐条件随机场(CRF)的python package
1回答
可以把多个文档、段落向量直接加和求平均来获得新的表示向量吗?
1回答
一维的数据可以做聚类吗?
3回答
k均值有用到EM的思想吗?
1回答
HDBSCAN和DBSCAN这两种聚类方法有什么区别?
0回答
数据批量分析提取,求指点迷津
4回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!