一、路径相关

路径相关报错信息

  1. IOError: [Errno 2] No such file or directory
  1. pandas.read_csv() 报错 OSError: Initializing from file failed
  1. (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape [duplicate]
  1. File b'train.csv' does not exist even though file exist

分析与解决问题

编写python代码过程中,出现了类似这种一系列路径相关的错误,原因是,自己更改了相关文件夹/文件在电脑中的位置,解决办法就新建一个项目建一个全新路径或者修改现有路径

  • \绝对路径 会报错(转义字符)处理:①双引号前面加一个r②\换成\\(硬盘代号后面的第一个)
  • ./相对路径

三种解决方式 r"C:\Users\YJG\Desktop\pi_digits.txt" "C:\\Users\\YJG\\Desktop\\pi_digits.txt" "C:/Users/YJG/Desktop/pi_digits.txt"

PS:路径含中文

假如路径、文件名都完整,还是报错的原因是这个参数中有中文,即使Python3已经支持中文,但是调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为Python就可以解决问题。根治:将路径编程全英文,这是必要素养习惯!

da4=pd.read_csv(xxxxxxxxxx,engine='python')

PS:utf-8

  1. UnicodeDecodeError:: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid contin

解决办法:data_1 = pd.read_csv(data1, encoding = 'gb2312')或者gb2312换成gbk 参考:https://blog.csdn.net/qq_18888869/article/details/82625343

二、nltk相关

nltk下载报错信息

  1. bug:[WinError 10054] 远程主机强迫关闭了一个现有的连接

分析与解决问题

原因:模型权重参数文件(.h5)较大,下载出现中断,下载失败

  • 解决办法:手动下载模型,放到指定目录
  • C:\Users\XXX\AppData\Roaming

下载地址 (密码9sar)

参考