3. 微博主题挖掘算法3.1 文本生成模型LDA(latent Dirichlet allocation ) 超参数
1
主题数目
超参数
2
d
2
z
3
w
3 D
T文本数目 抽取主题与 单词的关系
图1 LDA模型的贝叶斯网络图抽取的文本d 与主题的关系
当前单词所 属的主题
抽取出具 体单词
1.在Dirichlet分布中抽取主题与单词的关系 2.在Dirichlet分布中抽样出文本d与各个主题的关系,并确定当前单词所属主题z 3.结合以上,从多项式分布中抽取出具体单词
3. 微博主题挖掘算法3.1 文本生成模型LDA(latent Dirichlet allocation ) 超参数
1
主题数目
超参数
2
d
2
z
3
w
3 D
T文本数目 抽取主题与 单词的关系
图1 LDA模型的贝叶斯网络图抽取的文本d 与主题的关系
当前单词所 属的主题
抽取出具 体单词
1.在Dirichlet分布中抽取主题与单词的关系 2.在Dirichlet分布中抽样出文本d与各个主题的关系,并确定当前单词所属主题z 3.结合以上,从多项式分布中抽取出具体单词
下一篇:变电站综合自动化系统的内容和功能