7.6 练习

7.6.1 在 7.3 节实例分析的基础上,进一步构建 LDA 模型及文档相似度索引,并利用新的文档向量训练分类器,与使用 TF-IDF 矩阵分类进行效果对比。

7.6.2 从公开数据源下载或者自行抓取待分析中文文本数据,根据数据实际情况进行分词、去除停用词、结构化等处理,进一步运用主题模型进行降维处理,以此为基础计算各个文档之间的相似程度。

results matching ""

    No results matching ""