2.2 相关工具/包的安装说明

2.2.1 Jupyter Notebook

如果你使用的是面向数据科学的集成 Python 环境,比如 Anaconda 或者 winpython ,那么 Notebook 就已经安装好了。

如果你使用的单独安装或者系统自带的 Python 环境,可以这样来安装 Jupyter Notebook:

pip install jupyter

当然,Jupyter Notebook 为了获得更大的自定义便利,也可以通过源代码安装,这个就看使用者的个人习惯了,本书不做讨论。

2.2.2 jieba

可以直接通过 pip 来安装:

pip install jieba

2.2.3 NLTK

在 Linux、Mac 系统中可以直接通过 pip 来安装:

pip install nltk

在 Windows 中官方提供了打包好的二进制安装程序,可以直接在 https://pypi.python.org/pypi/nltk 下载安装。

2.2.4 Matplotlib

Matplotlib 也可以通过使用 pip 来进行安装:

pip install matplotlib

但是因为 Matplotlib 绘图会涉及到很多绘图系统类库,所以对于依赖要求较多,所以建议使用集成环境安装或者,在 Linux 系统中,可以使用系统包管理工具进行安装,例如在 Ubuntu/Debian Linux 发行版中,可以执行如下命令来安装:

apt install python-matplotlib

2.2.5 Numpy

可以通过 pip 直接安装:

pip install numpy

因为 Numpy 会依赖很多其他语言的科学计算类库,所以需要系统中有一些相关依赖包,可以根据安装反馈进行补充与安装,具体安装依赖软件的方式与操作系统有关。

2.2.6 Pandas

首先,可以通过 pip 来安装:

pip install pandas

但是 pip 安装 pandas 需要依赖 numpy 等需要涉及到编译的第三方包,所以需要电脑中有相关的编译工具环境以及依赖软件。

另外,一个简单的办法就是直接使用 Anaconda 基础环境,pandas 已经默认包含在其中了。

2.2.7 Gensim

Gensim 需要依赖 Numpy 与 Scipy,通过 pip 安装:

pip install gensim

2.2.8 scikit-learn

scikit-learn 需要依赖 Numpy 与 Scipy,通过 pip 安装可以直接安装,并且会安装相关依赖包:

pip install scikit-learn

results matching ""

    No results matching ""