5.5 小结

本章从文档-词项矩阵、词频-逆向文档矩阵、词向量三个角度介绍了文本数据结构化处理的三种方式,相关工具主要来自 sklearn 和 gensim Python 库,现汇总如下:

@todo 补充汇总表

本章的最后,结合中英文实际数据,分别介绍了文本数据结构化处理的整个流程。

results matching ""

    No results matching ""