6.8 练习

6.8.1 简述分类和聚类的思想及文本分类和文本聚类的一般步骤。

6.8.2 列举常用文本分类算法并对比不同算法之间的差异。

6.8.3 列举常用文本聚类算法并对比不同算法之间的差异。

6.8.4 列举常用聚类效果评价指标对比不同指标间的优缺点。

6.8.5 了解 scikit-learn、NLTK、Pattern、TextGrocery 等工具库支持的分类、聚类算法,掌握常用类方法的调用方式,对路透社新闻(http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html)文本进行分类、聚类处理,对比不同算法对分类或聚类效果的影响。

results matching ""

    No results matching ""