中文文本分类特征提取方法的研究与实现
3.3 基于类别相关的新文本特征提取方法 ............................................................................... 27
3.3.1 特征与类别的相关性 ................................................................................................. 28
3.3.2 特征与类别的相关度 ................................................................................................. 29
3.3.3 SP文本特征提取方法 ................................................................................................. 29
3.4 本章小结 ............................................................................................................................... 31 4 中文文本分类系统的设计与实现 ............................................................................ 32
4.1 中文文本分类系统的总体设计 ........................................................................................... 32
4.1.1 系统需求 ..................................................................................................................... 32
4.1.2 开发平台 ..................................................................................................................... 33
4.1.3 系统关键问题解决方案 ............................................................................................. 34
4.1.4 系统整体设计 ............................................................................................................. 41
4.2 中文文本分类系统模块设计 ............................................................................................... 43
4.2.1 文本预处理模块设计 ................................................................................................. 43
4.2.2 文本特征提取模块设计 ............................................................................................. 45
4.2.3 文本特征加权模块设计 ............................................................................................. 47
4.2.4 文本分类及性能评价模块设计 .................................................................................. 48
4.3 中文文本分类系统的实现 ................................................................................................... 49
4.3.1 文本预处理模块实现 ................................................................................................. 49
4.3.2 文本特征提取模块实现 ............................................................................................. 51
4.3.3 文本特征加权模块实现 ............................................................................................. 53
4.3.4 文本分类及性能评价模块实现 .................................................................................. 54
4.4 本章小结 ............................................................................................................................... 55 5 实验结果分析 ....................................................................................................................... 56
5.1 实验介绍 ............................................................................................................................... 56
5.1.1 实验数据集 ................................................................................................................. 56
5.1.2 实验参数设定 ............................................................................................................. 57
5.2 实验结果及分析 ................................................................................................................... 57
5.3 本章小结 ............................................................................................................................... 62 6 总结与展望 ............................................................................................................................ 63
6.1 研究总结 ............................................................................................................................... 63
6.2 下一步工作 ........................................................................................................................... 63 致 谢 ....................................................................................................................................... 65 参考文献 ....................................................................................................................................... 66 附 录 ....................................................................................................................................... 69