3.5 小结

继文本数据分析理论知识和 Python 入门之后,本章向读者介绍了文本数据的三个来源:一是从公开数据源获取数据,读者可以在 3.1 节找到几个常用的公开数据源;二是充分利用自有数据;三是利用网络爬虫按照需求制定相应的规则来抓取所需的文本数据,未接触过网络爬虫的读者可以仔细阅读 3.3 节的内容,学习网络爬虫的原理及实现。此外,本章最后向大家说明了 Python 文本数据的读写操作,并特别讲解了 CSV 格式数据的读写模块,掌握这些内容有助于后续数据的快速熟练读取和处理。 到本章为止,文本数据分析基础知识部分已经介绍完毕,后面将正式进入文本数分析的实践部分,准备好了吗?

results matching ""

    No results matching ""