3. 微博主题挖掘算法3.1 文本生成模型LDA
基本思想:每个文本都可以表示成一系列主题的混合分布,记为P(z);同时每个主题是词汇表中所有单词上的概率分布,记为P(w|z).
一个文本中每个单词的概率分布如式(1)所示:
一个文本中所有单词与 其所属主题的联合概率分布如式(2)所示:
3. 微博主题挖掘算法3.1 文本生成模型LDA
基本思想:每个文本都可以表示成一系列主题的混合分布,记为P(z);同时每个主题是词汇表中所有单词上的概率分布,记为P(w|z).
一个文本中每个单词的概率分布如式(1)所示:
一个文本中所有单词与 其所属主题的联合概率分布如式(2)所示:
下一篇:变电站综合自动化系统的内容和功能