注意:
在打开文件的时候open(r’c:.…’)
加r和不加’’r是有区别的
‘r’是防止字符转义的 如果路径中出现’\t’的话 不加r的话\t就会被转义 而加了’r’之后’\t’就能保留原有的样子
在字符串赋值的时候 前面加’r’可以防止字符串在时候的时候不被转义 原理是在转义字符前加’\’
例:
s``=``r``'\tt'
print``(s)
Output:
'\tt'

s``=``'\tt'
print``(s)
Output:
' t'

1.txt类文本操作

内置函数open

  1. open(file,mode="r",,encoding="GBK")
  2. '''常见三个参数
  3. file:文件路径
  4. mode:处理方式
  5. encoding:编码方式(写第三个参数时encoding不能少)
  6. '''

文件对象常用方法

  1. fp = open(...)
  2. fp1 = open(...)
  3. fp.close() #关闭文件,释放文件对象
  4. fp.read() #读取文件中全部内容
  5. fp.readline() #读取文件一行内容返回
  6. fp.readlines() #返回包含文本文件中每行内容的列表
  7. fp1.write(s) #把s的内容写入文件中

读txt文件

  1. path=r"D:/file1.txt"
  2. with open(path,mode = 'r',encoding="utf-8") as fp: #创建文件对象fp,且在跳出with语句后自动关闭fp
  3. ans = fp.readlines()
  4. print(ans)
  5. str = "".join(ans)
  6. print(str)

2.json类文件处理

什么是json?
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。

dumps()函数用来把对象序列化为字符串
#loads()函数用来把json格式字符串还原为Python对象
#dump()函数用来把数据序列化并且直接写入文件
#load()函数用来读取json格式文件并且直接还原为Python对象

  1. #将数据写入一个json文件
  2. import json
  3. info=[
  4. {'小区名称':"A小区",'均价':8000,'月交易额':20},
  5. {'小区名称':"B小区",'均价':8500,'月交易额':30},
  6. {'小区名称':"C小区",'均价':7000,'月交易额':20},
  7. {'小区名称':"D小区",'均价':18000,'月交易额':18}]
  8. path = r"D:/小区交易额.json"
  9. fp = open(path,"w")
  10. json.dump(info,fp,indent=4,separators=["," , ":"])
  11. #indent代表缩进,separators中第一个","代表数据值之间用逗号隔开
  12. 第二个":"代表key和数据值之间用冒号
  13. fp.close()

image.png

  1. #将json文件的数据读出来
  2. fp=open(r"D:/小区交易额.json","r")
  3. for pdata in json.load(fp):
  4. print(pdata)

image.png

3.csv类文件处理

什么是csv?
csv是一种纯文本形式的文件格式,一般由若干字段数量相同的行组成

  1. import csv
  2. fp = open("路径","r")
  3. wr = csv.write(fp) #创建csv文件写对象
  4. wr.writerow(['列名1','列名2']) #写一行数据
  5. rd = csv.reader(fp) #创建csv文件读对象

4.word文档处理

读出word文档中的数据

  1. import docx
  2. fdocument = docx.Document(r"D:/onetest.docx")
  3. for i in fdocument.paragraphs:
  4. print(i.text)

读出word文档中的表格

  1. for table in fdocument.tables:
  2. for row in table.rows:
  3. for cell in row.cells:
  4. print(cell.text)

5.对excel类文件(.xlsx)处理

读取出每个单元格内容
(有的单元格为空,所以要try,最后空的单元格会打印None)

  1. import openpyxl
  2. wb = openpyxl.load_workbook(r"D:/twotest.xlsx")
  3. for ws in wb.worksheets:
  4. for wr in ws.rows:
  5. for c in wr:
  6. try:
  7. print(c.value)
  8. except:
  9. pass

6.对PowerPoint类文件处理

精力不够,先待学!!!!!