注意:
在打开文件的时候open(r’c:.…’)
加r和不加’’r是有区别的
‘r’是防止字符转义的 如果路径中出现’\t’的话 不加r的话\t就会被转义 而加了’r’之后’\t’就能保留原有的样子
在字符串赋值的时候 前面加’r’可以防止字符串在时候的时候不被转义 原理是在转义字符前加’\’
例:s``=``r``'\tt'
print``(s)
Output:
'\tt'
s``=``'\tt'
print``(s)
Output:
' t'
1.txt类文本操作
内置函数open
open(file,mode="r",,encoding="GBK")
'''常见三个参数
file:文件路径
mode:处理方式
encoding:编码方式(写第三个参数时encoding不能少)
'''
文件对象常用方法
fp = open(...)
fp1 = open(...)
fp.close() #关闭文件,释放文件对象
fp.read() #读取文件中全部内容
fp.readline() #读取文件一行内容返回
fp.readlines() #返回包含文本文件中每行内容的列表
fp1.write(s) #把s的内容写入文件中
读txt文件
path=r"D:/file1.txt"
with open(path,mode = 'r',encoding="utf-8") as fp: #创建文件对象fp,且在跳出with语句后自动关闭fp
ans = fp.readlines()
print(ans)
str = "".join(ans)
print(str)
2.json类文件处理
什么是json?
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。
dumps()函数用来把对象序列化为字符串
#loads()函数用来把json格式字符串还原为Python对象
#dump()函数用来把数据序列化并且直接写入文件
#load()函数用来读取json格式文件并且直接还原为Python对象
#将数据写入一个json文件
import json
info=[
{'小区名称':"A小区",'均价':8000,'月交易额':20},
{'小区名称':"B小区",'均价':8500,'月交易额':30},
{'小区名称':"C小区",'均价':7000,'月交易额':20},
{'小区名称':"D小区",'均价':18000,'月交易额':18}]
path = r"D:/小区交易额.json"
fp = open(path,"w")
json.dump(info,fp,indent=4,separators=["," , ":"])
#indent代表缩进,separators中第一个","代表数据值之间用逗号隔开
第二个":"代表key和数据值之间用冒号
fp.close()
#将json文件的数据读出来
fp=open(r"D:/小区交易额.json","r")
for pdata in json.load(fp):
print(pdata)
3.csv类文件处理
什么是csv?
csv是一种纯文本形式的文件格式,一般由若干字段数量相同的行组成
import csv
fp = open("路径","r")
wr = csv.write(fp) #创建csv文件写对象
wr.writerow(['列名1','列名2']) #写一行数据
rd = csv.reader(fp) #创建csv文件读对象
4.word文档处理
读出word文档中的数据
import docx
fdocument = docx.Document(r"D:/onetest.docx")
for i in fdocument.paragraphs:
print(i.text)
读出word文档中的表格
for table in fdocument.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
5.对excel类文件(.xlsx)处理
读取出每个单元格内容
(有的单元格为空,所以要try,最后空的单元格会打印None)
import openpyxl
wb = openpyxl.load_workbook(r"D:/twotest.xlsx")
for ws in wb.worksheets:
for wr in ws.rows:
for c in wr:
try:
print(c.value)
except:
pass
6.对PowerPoint类文件处理
精力不够,先待学!!!!!