3. 微博主题挖掘算法3.2微博生成模型 MB-LDA (MicroBlog-latent Dirichlet allocation) 基本思想:研究LDA的基础上,对微博的联系人关联关系和文本关联关系进行统一建
模,形成的适合于微博主题挖掘的模型。联系人C与各主 题之间的关系 当前单词所 属的主题 联系人关系 抽取出具 体单词
2联系人关联关系
c
c dr
c
抽取的微博d与 主题的关系 文本关联关系
z dRT
4
w
4
1 T
抽取主题与 单词的关系
3
D转发部分与各主 题之间的关系
转发关系
图2 MB-LDA模型的贝叶斯网络图