1.5 深入阅读材料

由于篇幅限制,很多文本数据分析相关概念、工具都不能做细致的解释说明,笔者将部分参考文档和资源网站等集中列于本节,有需要的读者可以自行选择阅读。

1.5.1 词频-逆向文件频率(TF-IDF)的计算原理在这篇文章中有相近的说明:

Salton G, Fox E A, Wu H. Extended Boolean information retrieval[J]. Communications of the ACM, 1983, 26(11): 1022-1036.

1.5.2 关于词向量的发展历程以及模型的训练原理可以阅读以下几篇经典论文:

(1) Bengio Y, Schwenk H, Senécal J S, et al. Neural probabilistic language models[M]//Innovations in Machine Learning. Springer Berlin Heidelberg, 2006: 137-186.

(2)Collobert R, Weston J. A unified architecture for natural language processing: Deep neural networks with multitask learning[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 160-167.

(3)Mnih A, Hinton G E. A scalable hierarchical distributed language model[C]//Advances in neural information processing systems. 2009: 1081-1088.

(4)Mikolov T, Karafiát M, Burget L, et al. Recurrent neural network based language model[C]//INTERSPEECH. 2010, 2: 3.

1.5.3 Jupyter Notebook 的官方文档对 Jupyter Notebook 的功能特点、安装使用等都给出了较详细的说明,还给出了许多应用实例,读者可以访问以下网址学习:

http://jupyter-notebook.readthedocs.io/en/latest/

1.5.4 读者可以登录 http://www.nltk.org/ 阅读 NLTK 的官方文档了解 NLTK 的功能、提供的模块等,下面这两本书推荐给刚刚接触 NLTK 或者需要详细了解 NLTK 的读者。

(1)《Natural Language Processing with Python》
(2)《Python Text Processing with NLTK 2.0 Cookbook》

1.5.5 Stanford CoreNLP 官方网站:

http://stanfordnlp.github.io/CoreNLP/,CoreNLP 的功能、使用都有详细的说明。

1.5.6 想更全面的掌握 Matplotlib 的使用,推荐阅读以下两本书籍:

(1)《Mastering matplotlib》 by Duncan M. McGreggor
(2)《Graphics with Matplotlib》 by David J. Raymond
以及官方使用指南:http://matplotlib.org/users/index.html

1.5.7 Numpy 快速入门教程:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html,对 Numpy 支持的数据结构及相关操作均有解释说明。

1.5.8 Pandas 说明文档:http://pandas.pydata.org/pandas-docs/stable/index.html#,对数据结构及数据处理、分析功能均有解释说明。

1.5.9 关于 WordNet 的详细介绍,可以阅读书籍《WordNet: An Electronic Lexical Database》或者登陆官方网站 https://wordnet.princeton.edu/ 学习。

1.5.10 Mindnet 结构和构建方式说明文章:

Richardson ,S. D. ,William B. Dolan , and Lucy Vanderwende. MindNet : acquring and structuring semantic information from text[A]. In : Proceedings of COLINGπ98[C] , 1998 ,1098 - 1100.

1.5.11 自然语言处理相关词典网址:

(1)The Natural Language Processing Dictionary
– URL: http://www.cse.unsw.edu.au/~billw/nlpdict.html
(2) The Prolog Dictionary
– URL: http://www.cse.unsw.edu.au/~billw/prologdict.html
(3)The Artificial Intelligence Dictionary
– URL: http://www.cse.unsw.edu.au/~billw/aidict.html
(4)The Machine Learning Dictionary – URL: http://www.cse.unsw.edu.au/~billw/mldict.html

results matching ""

    No results matching ""