1、安装NLTK包
在Pycharm终端/Aanaconda Prompt依次执行如下命令:
:升级pip-可根据自己的需求选择性执行本条命令:
python -m pip install --upgrade pip
:卸载旧版本nltk:
pip uninstall nltk
:安装nltk:
pip install nltk
2、安装数据包
2.1:在Pycharm或Spyder中创建py文件执行如下语句
import nltk
nltk.download()
注:此时弹出警示<urlopen error [Errno 11004] getaddrifno failed>,叉掉即可
此条警示可以理解为无法获取数据包下载地址ip(通过查询相应IP发现数据包服务器在美国,可以科学上网的同学可以先科学上网再直接试试单击Donwload按钮直接下载)
2.2:在本地计算机进入如下路径
C:\Users\你的用户名\AppData\Roaming\nltk_data
为避免出错可根据当前窗口【红色框】所示确定路径
注:部分人员可能没有相应的nltk_data 文件夹,自己创建一个同名文件夹就行了
2.3:下载数据包并解压到nltk_data文件夹
官方数据包 可直接使用的数据包 注:官方数据包不可直接使用,需要对下载的数据包内的各个压缩文件先进行解压
3、测试
from nltk.corpus import brown
print(brown.words()[0:10])
print(brown.tagged_words()[0:10])
出现运行结果则代表NLTK语料包安装成功
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', 'Friday', 'an', 'investigation', 'of']
[('The', 'AT'), ('Fulton', 'NP-TL'), ('County', 'NN-TL'), ('Grand', 'JJ-TL'), ('Jury', 'NN-TL'), ('said', 'VBD'), ('Friday', 'NR'), ('an', 'AT'), ('investigation', 'NN'), ('of', 'IN')]
|