1.int整型

数字整数就是整型,支持加减乘除% * += -= = 等操作

  1. int(66) 整型
  2. float() 浮点型

1.1独有功能

整型没有独有功能

定义形式就是在变量后面跟.功能

1.2共有功能

加减乘除等

1.3转换

  1. bool转整型
  2. inttrue)#1
  3. int(False)#0
  4. 字符串转整型
  5. 进制之间转换时需要借助10进制,10进制和其他进制之间可以互相转换,但是16 8 2,进制之间无法直接转换
  6. int('0x101',base=16)#把字符串看作16进制,然后转换为16进制
  7. int('186',base=10)#把字符串看作10进制,然后转换为10进制
  8. int('0o10',base=8)#把字符串看作8进制,然后转换为8进制
  9. int('ob10110',base=2)#把字符串看作2进制,然后转换为2进制

1.4其他知识

整型在python2和3中的区别

python2中int有整型(限制了长度)和长整型,长整型表示整型表示不了的数据

python3中int没有限制

python3中进行除法运算时得到的是具体的值

python2中除法运算默认得到整数//地板除

  1. from __future__ import division
  2. #引入此模块,在2中也可以得到具体的值

2.str字符串

字符串就是文本信息,必须用引号括起来,支持相加或者相乘

相加是将两个字符串拼接起来

相乘是将一个字符串重复多次

  1. 单行文本 #对于单行文本,可以使用单引号或者双引号括起来
  2. print'你好'
  3. 多行文本
  4. print"""
  5. 白日依山尽
  6. 黄河入海流
  7. """

2.1独有功能(18/48)

2.1.1判断字符串时候以XX开头,得到布尔值 .startswitch()
  1. name="刘小流"
  2. v2 = name.startswith("刘")
  3. printv2True

2.1.2 判断字符串是否以XX结尾,得到一个bool值 .endswith()

2.1.3 判断字符串时候为10进制数,得到一个bool值.isdecimal()

还有.isdigit() 此功能再判断时会把①此情况也判断为是10进制数

  1. v1="123"
  2. v2=v1.isdecimal()
  3. print(v2)True

2.1.4 去除字符串两边的空格换行符制表符,得到一个新的字符串.strip()

只去除两边不去除中间

.lstrip()去除左边的

.rstrip()去除右边的

需要去除指定内容是,再括号里面加上指定的内容既可

  1. v1=" 你好 "
  2. v2=v1.strip()
  3. print(v2)//你好

2.1.5字符串变的大写,得到一个新的字符串.upper()
  1. v1='abc'
  2. v2=v1.upper()
  3. print(v2)//ABC

2.1.6 字符串变小写,得到一个新的字符串.lower()

2.1.7字符串内容替换,得到一个新的字符串.replace()
  1. v1='你好好吗'
  2. v2=v1.replace("好","坏")
  3. printv2)//你坏坏吗 # 默认所有都改
  4. v2=v1.replace("好","坏",1)
  5. 只改一个 // 你坏好吗

2.1.8 字符串切割,得到一个列表.split() #默认是从左边开始切割

从右边开始切割.rsplit()

从第几个符号开始切割.split(‘|’,2) ,从左边第2个|切割

  1. v1="你好|不好|好不"
  2. v2=v1.split('|') #根据特定的字符进行切割,然后保存到列表中
  3. printv2 #["你好",”不好“,”好不“]

2.1.9 字符串拼接得到新的字符串”符号”.join() 指定使用某种符号进行拼接
  1. data_list=["你"," 好"," 吗"]
  2. v2="*".join(data_list)//将data_list列表使用*拼接起来
  3. 你*好*吗

2.1.10 格式化字符串得到新的字符串.format()
  1. text="我叫{},今年{}岁".format("小刘"18)
  2. text="我叫{0},今年{1}岁".format("小刘"18)
  3. text="我叫{name},今年{old}岁".format(name="小刘"old=18)

%进行格式化

有百分比的情况需要输入两个%%,以表示这是一个百分比

  1. text = "%s,这个片我已经下载了90%%了,居然特么的断网了" %"兄弟"
  2. print(text)
  1. text="我叫%s,今年%d岁"%("小刘"18
  2. 我叫小刘,今年18
  3. # %s用与给字符串进行占位,%d给整型占位
  4. text="我叫%(name)s,今年%(old)d岁"%("name""小刘""old":18
  5. 我叫小刘,今年18

.f

  1. name="小刘"
  2. old=18
  3. tetx=f"我叫{name},几年{old}岁"
  4. f'{print("12+2")}'
  5. 对于f{}里面的可以当作表达式运行

2.1.11 字符串转换为字节类型.encode()
  1. 字节转换为字符串.decode()
  1. name="小刘"
  2. v1=name.encode"utf_8"utf8是字节类型
  3. v2=v1.decode("utf8")将utf8的字节转换为字符串

2.1.12 将字符串居中.center()

居右.rjust()

居左.ljust()

  1. v1="小流域"
  2. v2=v1.center(10,".."),总体长途10,将v1居中,不够的长度用..补全
  3. v2=v1.ljust(10,"=") 小流域===========
  4. v2=v1.rjust(10,"=") =======小流域

2.1.13 填充0.zfill()
  1. data="alex"
  2. v1=data.zfill(10) ,总长度为10不够用0填充到左边
  3. 000000alex

find() 返回字符的索引
  1. n1 = "xscfg"
  2. n1.find('s') # 1
  3. 找不到的内容返回-1

count() 统计出现的次数
  1. n1 = 'xxxxx'
  2. n1.count('x') # 5

expandtabs() 指定制表符的宽度
  1. n1 = 'hello\tworld'
  2. n1.expandtabs(2) 两个空格 \t是空格

capitalize() 首字母大写
  1. n1 = 'hello'
  2. n1.capitalize() # Hello

swapcase() 大写边小写,小写变大写
  1. n1 = 'Hello'
  2. n1.swapcase() # hELLO

title() 每个单词的首字母大写
  1. n1 = 'hello word'
  2. n1.title() # Hello Woed

2.2公共功能

2.2.1 字符串相加+

2.2.2 字符串相乘

2.2.3获取长度 len()
  1. v1="小刘"
  2. v2=len(v1)

2.2.4 获取字符串中的字符,索引[]

字符串只能同通过索引来取值,无法修改值,字符串在内部存储时不允许修改内部元素,只能重新创建

  1. v1="你还好把"
  2. 0 1 2 3
  3. v1[0] "你"

2.2.5 获取字符串中的子序列,切片[]

前取后不取

切片也是不能修改数据,只能读取

  1. v1="你还好把"
  2. 0 1 2 3
  3. -4 -3 -2 -1
  4. v1[0:2:2] 0开始取,取到2结束不包括2,步长为2 得到 "你"
  5. v1[2:-1] "好"
  6. v1[::-1] # 字符串倒过来
  7. v1[0:3:-1] # 取不到,是0-3但是步长是-1 ,

2.2.6 循环
  1. message = "来做点py交易呀"
  2. index = 0
  3. while index < len(message):
  4. value = message[index]
  5. print(value)
  6. index += 1
  7. =========================================
  8. message = "来做点py交易呀"
  9. for char in message:
  10. print(char)

2.2.7 range()可以创建一系列数字
  1. range(10) [0,1,2,3,4,5,6,7,8,9]
  2. range(1,10)[1,2,3,4,5....9]
  3. range(1,10,2)[1,3,5,7,9]
  4. range(10,1,-1)[10,9,8,7,6,5,4,3,2]

2.3转换

一般只有整型转字符串才有意义

3.bool布尔类型

布尔类型一共有两个值False True

3.1独有功能

没有

3.2公共功能

没有

3.3转换

经常会遇到其他类型转换为bool的场景,

0,空字符串,空列表,空元组,空字典,转换为bool是都为False,其他都是True

3.4其他知识

如果在条件语句的后面跟值的话,会先转换成bool类型再进行条件判断

4.list列表类型 []

列表list 是有序的可以变的容器,里面可以放多个不同类型的元素

4.1定义

不可变类型:字符串,布尔,整型,元组,(内部数据已经最小无法进行修改,不可变指的是值改变id也会变)

可变类型:列表,字典,(内部数据元素可以修改,可变指的是值改变id不会变)

  1. data_list=[1,2,3,'你','13']

4.2独有功能

4.2.1 追加,在列表的尾部追加值.append()
  1. v1=[1,2,3,"你","dir"]
  2. v2=100
  3. v1.append(v2) v2的值追加到v1列表中
  4. v1=[1,2,3,"你","dir",100]

4.2.2 批量追加,将一个列表中的元素逐一加到零一个列表.extend()
  1. v1=["ni","好","吗"]
  2. v2=['很','好']
  3. v1.extend(v2) v2中的值逐一加到v1

4.2.3 插入,在源列表的指定索引位置插入值.insert()
  1. v1=["ni","好","吗"]
  2. v1.insert(0,"100") ["100","ni","好","吗"]在第0个索引插入

4.2.4 在原列表中根据值删除(从左到右删除),没有找到值会报错.remove()

没有返回值,None

  1. v1=["ni","好","吗"]
  2. v1.remove("好")

4.2.5在原列表中根据索引剔除某个元素(根据索引位置删除).pop()

不传参默认删除最后一个,返回值是删除的那个值

  1. v1=["ni","好","吗"]
  2. 0 1 2
  3. v1.pop("1")

4.2.6 清空原列表.clear()
  1. v1=["ni","好","吗"]
  2. 0 1 2
  3. v1.clear()

4.2.7 根据值获取索引.index()
  1. v1=["ni","好","吗"]
  2. 0 1 2
  3. v1.index(”好“) 1

4.2.8 列表元素排序.sort()

列表里的元素必须是相同类型的才可以排序

  1. 数字排序
  2. num_list = [11, 22, 4, 5, 11, 99, 88]
  3. num_list.sort() num_list从小到大排序
  4. num_list.sort(reverse=True) num_list从大到小排序
  5. 字符串排序
  6. # 字符串排序是根据 ASCI码表按顺序排序
  7. user_list = ["王宝强", "Ab陈羽凡", "Alex", "贾乃亮", "贾乃", "1"]
  8. # [29579, 23453, 24378]
  9. # [65, 98, 38472, 32701, 20961]
  10. # [65, 108, 101, 120]
  11. # [49]
  12. 列表对比大小
  13. # 是根据相同位置的元素进行对比,且必须是同种类型的元素,第一个比较出大小后不再往后比较
  14. n1 = [1,'A','c']
  15. n2 = [5,'B,'D']
  16. 1与5比较,5大于1则n2大于n1

4.2.9 反转列表.reverse()

不是排序就是反转过来

  1. v1=["ni","好","吗"]
  2. 0 1 2
  3. v1.reverse()

4.2.10 查找索引 index()
  1. n1 = ['12','34','56']
  2. n1.index('12') # 0

4.3公共功能

4.3.1相加,两个列表相加可以生成一个新的列表相当于拼接起来
  1. v1=[1,2,3]
  2. v2=["比",'比']
  3. v1+v2=[1,2,3,"比",'比']

4.3.2相乘,列表相乘,将列表中的元素再创建N份获得新的列表
  1. v2=["比",'比']
  2. v3=["比",'比']*2
  3. ["比",'比'"比",'比']

4.3.3 成员运算符 in

列表内部是由多个元素组成的,可以通过in来判断元素是否再列表中

列表再检查元素是否存在的时候,是采用逐一比较的方式,效率比较低

  1. user_list=[1,2,3,"比"]
  2. v2= "比" in user_list
  3. True

4.3.4 获取长度
  1. user_list=[1,2,3,"比"]
  2. print(len(user_list))
  3. 4

4.3.5 索引,针对一个元素的操作

超出索引位置会报错

  1. user_list=[1,2,3,"比"]
  2. 0 1 2 3
  3. print(user_list[0]) 1
  4. print(user_list[1]) 2
  5. print(user_list[2]) 3
  6. user_list=[1,2,3,"比"]
  7. 0 1 2 3
  8. user_list[0] = "你" [你,2,3,"比"]
  9. 删除
  10. user_list=[1,2,3,"比"]
  11. del user_list[1]
  12. user_list.removep[1]
  13. v1=user_list.pop[1]

4.3.6 切片,根据索引对列表中的多个元素操作

切片相当于拷贝,且是浅拷贝

前去后不取

  1. user_list=[1,2,3,"比"]
  2. print(user_list[0:2]) [1,2]
  3. user_list[0:2]=[100,200] [100,200,3,"比]
  4. user_list = ["范德彪", "刘华强", '尼古拉斯赵四']
  5. user_list[10000:] = [11, 22, 33, 44]
  6. print(user_list) # 输出 ['范德彪', '刘华强', '尼古拉斯赵四', 11, 22, 33, 44]
  7. user_list = ["范德彪", "刘华强", '尼古拉斯赵四']
  8. user_list[-10000:1] = [11, 22, 33, 44]
  9. print(user_list) # 输出 [11, 22, 33, 44, '刘华强', '尼古拉斯赵四']
  10. user_list = ["范德彪", "刘华强", '尼古拉斯赵四']
  11. del user_list[1:]
  12. print(user_list) # 输出 ['范德彪']

4.3.7 步长
  1. user_list=['你','好','吗','1',1]
  2. 0 1 2 3 4
  3. user_list[1:3:2] 取索引13的值,隔21
  4. 列表反转
  5. user_list=['你','好','吗','1',1]
  6. user_list[::-1]
  7. user_list.reverse()

4.3.8 for 循环
  1. user_list=['你','好','吗','1',1]
  2. for i in user_list: i去游览列表中的元素
  3. print(i)
  4. 面试题
  5. # 错误方式, 有坑,结果不是你想要的。
  6. user_list = ["刘的话", "范德彪", "刘华强", '刘尼古拉斯赵四', "宋小宝", "刘能"]
  7. for item in user_list:
  8. if item.startswith("刘"):
  9. user_list.remove(item)
  10. print(user_list)
  11. 正确方法
  12. user_list = ["刘的话", "范德彪", "刘华强", '刘尼古拉斯赵四', "宋小宝", "刘能"]
  13. for index in range(len(user_list) - 1, -1, -1):
  14. item = user_list[index]
  15. if item.startswith("刘"):
  16. user_list.remove(item)
  17. print(user_list)

4.3.9 转换
  • int bool类型无法转换为列表类型
  • str转列表

    1. v1='你好吗'
    2. list(v1) ['你','好','吗']
  • 元组和集合,字典转换为列表
    ```python v1=(11,12,13,145) 元组 list(v1) [11,12,13,145]

v2 = {“alex”,”eric”,”dsb”} 集合 vv2 = list(v2) 列表 [“alex”,”eric”,”dsb”]

v3 = {‘k1’:1,’k2’:2,’k3’:3} list(v3) [k1,k2,k3]

  1. 4.4 嵌套

列表属于容器,内部可以存放各种数据,也可以支持列表的嵌套 data = [ “谢广坤”,[“海燕”,”赵本山”],True,[11,22,[999,123],33,44],”宋小宝” ]

嵌套值的索引

data = [ “谢广坤”,[“海燕”,”赵本山”],True,[11,22,[999,123],33,44],”宋小宝” ] 0 1 0 1 2 3 0 1 4 print( data[0] ) # “谢广坤” print( data[1] ) # [“海燕”,”赵本山”] print( data[0][2] ) # “坤” print( data[1][-1] ) # “赵本山”

  1. <a name="1d58d3a6"></a>
  2. #### 5.tuple元组类型 tuple()

元组是一个有序且不可变的容器,里面可以存放多个不同类型的元素 (1,1.2,’AAA’) 不可变是指里面的元素不可以该改变,也就是里面元素的内存地址不可以改变(内存地址没变,就是值没变),但是可以增加元素

v1=(11,22,33) v2=(“alex”,”old”)

v3=(1) 1 v4=(1,2) (1,2) v5 = (1,) (1)

  1. <a name="daad225a"></a>
  2. #### 5.1独有功能
  3. <a name="6e2dd5d1"></a>
  4. #### 5.2公共功能
  5. <a name="fc29ccd4"></a>
  6. ##### 5.2.1 相加,两个元组相加获取一个新的元组
  7. ```python
  8. data = ("赵四","刘能") + ("宋晓峰","范德彪")
  9. print(data) # ("赵四","刘能","宋晓峰","范德彪")

5.2.2 相乘,列表相乘,将列表中的元素再创建N份并生成一个新的元组
  1. data = ("赵四","刘能") * 2
  2. print(data) # ("赵四","刘能","赵四","刘能")
  3. v1 = ("赵四","刘能")
  4. v2 = v1 * 2
  5. print(v1) # ("赵四","刘能")
  6. print(v2) # ("赵四","刘能","赵四","刘能")

5.2.3 获取长度
  1. data_list=(1,2,"刘","马")
  2. printlendata_list))

5.2.4 索引

索引元组里面没有的值会报错

  1. data_list=(1,2,"刘","马")
  2. 0 1 2 3
  3. data_list[0]

5.2.5 切片
  1. user_list = ("范德彪","刘华强",'尼古拉斯赵四',)
  2. print( user_list[0:2] )
  3. print( user_list[1:] )
  4. print( user_list[:-1] )

5.2.6 步长
  1. user_list = ("范德彪","刘华强",'尼古拉斯赵四',"宋小宝","刘能")
  2. print( user_list[1:4:2] )
  3. print( user_list[0::2] )
  4. print( user_list[1::2] )
  5. print( user_list[4:1:-1] )

5.2.7 for 循环
  1. user_list = ("范德彪","刘华强",'尼古拉斯赵四',"宋小宝","刘能")
  2. for item in user_list:
  3. if item == '刘华强':
  4. continue
  5. print(name)

5.3转换

目前只有str和list可以转换为元组

  1. name = "刘小刘"
  2. v2 = [100]
  3. v3 = tuple(name)
  4. v4 = tuple(v2) 如果列表中只有一个元素的时候会自动加逗号
  5. print(v3)
  6. print(v4)
  7. ('刘', '小', '刘')
  8. (100,)

5.4 嵌套

6.dict字典类型{}

字典是无序,元素必须由键值对组成,键不可以重复,是可变的容器

无序在Python3.6字典就是有序了,之前的字典都是无序

  1. v1={"name='刘'"pw="123"}

6.1定义

键:必须是可以哈希的 int bool str tuple 且不能重复,重复只保存一个

值:任意类型

  1. v1={}
  2. v1=dict()

6.2独有功能

6.2.1 获取值.get(“键”)

根据键,获取值,key不存在返回None

  1. v1={"name":'刘'"pw":"123"}
  2. v2=v1.get("name")
  3. v3=v1.get("old") None

6.2.2所有的键.Keys()

python3中获取键后返回的是高仿列表可以被循环

  1. v1={"name":'刘'"pw":"123"}
  2. v2=v1.keys() (["name","pw"])

6.2.3所有的值.values()
  1. v1={"name":'刘'"pw":"123"}
  2. v2=v1.values() (["刘","123"])

6.2.4所有的键值.items()
  1. v1={"name":'刘'"pw":"123"}
  2. v2=v1.items() #([('name','刘'),('pw','123')])是一个迭代器

6.2.5 设置值.setdefault()

如果有key则不添加,返回值是字典中key对应的值

如果没有key则添加进去,返回字典中key对应的值

  1. v1={"name":'刘'"pw":"123"}
  2. v1.setdefault("name1",'王')
  3. {'name1':'王'"name":'刘''pw'"123"}

6.2.6更新键值对.update({})
  1. v1={"name":'刘'"pw":"123"}
  2. v1.update({"name":'王''six':6})//没有的键直接添加进去,有的更新掉

6.2.7移除指定的键值对.pop(键)
  1. v1={"name":'刘'"pw":"123"}
  2. v1.pop=("name")//返回值是刘,也就是返回删除的值
  3. {pw="123"}

6.2.8按照顺序移除,先移除后面的.popitem()
  1. v1={"name":'刘'"pw":"123"}
  2. v2=v1.popitem()// 返回值是("键""值"
  3. {"name"='刘'}

6.3公共功能

6.3.1 求并集 |

6.3.2 求长度
  1. v1={"name":'刘'"pw":"123"}
  2. v2=lenv1 #2

6.3.3 是否包含 in not in
  1. v1={"name":'刘'"pw":"123"}
  2. v2= "pw" in v1 True

6.3.4索引,是对键操作[]

如果键 不存在的会报错

  1. v1={"name":'刘'"pw":"123"}
  2. v1["name"]

6.3.5根据键,修改值,添加值,删除键值对
  1. v1={"name":'刘'"pw":"123"}
  2. v1["old"]=16 {"name":'刘'"pw":"123"'old':16}
  3. v1['name']= "王"
  4. del v1[name]

6.3.6 for循环

由于字典也属于是容器,内部可以包含多个键值对,可以通过循环对其中的:键、值、键值进行循环;

  1. info = {"age":12, "status":True,"name":"武沛齐"}
  2. for key,value in info.items():
  3. # 键 值
  4. print(key,value)

6.4转换

  1. v1=dict([("name","v2"),["A","B"]])
  2. {'name':"v2","A":"B"}
  1. keys = ['name','age','gender']
  2. 将列表的元素取出来作为字典的键,值为None
  3. d = {}.fromkeys(keys,None)
  4. 原理就是for循环keys将元素作为键,None作为值配对,添加到d

6.5为什么查询速度快
  1. data = {"张三"123,"王五"456,'李四'789}
  2. # 字典的每个key都先经过hash生成一段固定的hash值
  3. # 字典把生成的hash值放到一个列表里面比如:
  4. # [10,20,30]
  5. # 当我们想查找张三的信息时候会把张三先hash得到10这个值,然后拿这个值去列表里找,通过算法,只要找到了99的位置就可以定位到张三对应的value值

7.set集合类型{}

  • 无序不允许出现重复的值,可变类型,集合的元素必须要可哈希
  • 不能通过索引取值
  • 可以添加删除元素
  • 不允许元素重复
  • 用在维护数据量大且不重复的场景,如爬虫,避免找到重复的数据
  • 还用在关系运算
  1. data_set{11,12,13}
  2. 定义空集合的时候 v1=set() 不能v1={}这样是定义一个空字典

7.1 独有功能

7.1.1添加元素.add()
  1. data={"刘""王""李"}
  2. data.add("孙") {"刘""王""李","孙"}

7.1.2 删除元素.discard()

删除元素不存在 do nothing

  1. data={"刘""王""李"}
  2. data.discard("王") {"刘""李"}

7.1.3交集 .intersection()

取两个集合都有的元素

  1. data={"刘""王""李"}
  2. name={"刘""孙""子"}
  3. v1=data.intersection(name)
  4. v1=data & name

7.1.4并集.union()

取两个结合的并集

  1. data={"刘""王""李"}
  2. name={"刘""孙""子"}
  3. v1=data.union(name) # {"刘","王","李","孙","子"}

7.1.5差集.difference()
  1. data={"刘""王""李"}
  2. name={"刘""孙""子"}
  3. v1=data.difference(name) data中有但是name中没有的值 {“王“,”李”}
  4. v1=data - name

7.2公共功能

7.2.1 计算差集 -

7.2.2 计算交集 &

7.2.3 计算并集 |

7.2.4 计算长度

7.2.5 对称差集 ^

两个集合的差集进行合并

  1. data={"刘""王""李"}
  2. v1=len(data)

7.2.5 for循环
  1. v = {"刘能", "赵四", "尼古拉斯"}
  2. for item in v:
  3. print(item)

7.3转换

在转换的时候用set包裹一下就可以,并且数据如果有重复会自动删除

int list tuple dict str 都可以转换为集合

  1. v1 = "刘小刘"
  2. v2 = set(v1)
  3. print(v2) # {"刘","小","刘"}
  4. v1 = [1,2,1,4,5,5]
  5. v2 = set(v1)
  6. print(v2) # {1,2,4,5}
  7. v1 = (1,2,3,4)
  8. v2 = set(v1)
  9. print(v2) # {1,2,3,4}

7.4嵌套

7.4.1集合的存储原理

第一步,将存储的数据转换为一个数值,

第二步,取余数

第三步,将存储的数据放在余数的索引位置

1.数据类型 - 图1

7.4.2 元素必须可哈希

集合的元素必须和哈希,内同通过哈希函数把值转换成一个数字

可哈希的数据类型有 int bool str tuple 不可哈希的有list set

7.4.3对比和嵌套

True和False本质上存储的是 1 和 0 ,集合又不允许重复,所以在整数 0、1和False、True出现在集合中会去重复

类型 是否可变 是否有序 元素要求 是否可哈希 转换 定义空
list list(其他) v=[]或v=list()
tuple tuple(其他) v=()或v=tuple()
set 可哈希 set(其他) v=set()

8.float 浮点类型

4.类型之间的转换

想转换成什么数据类型就用什么类型的英文表示进行包裹

字符串转换整型时只支持数字类型的文本进行转换

0,空字符串,空列表,空元组,空集合,空字典,转换为bool时为false,其他转换为bool都为True

  1. str='666'
  2. int(str)

5.变量

变量名 :指向赋值符号右侧值的内存地址,用来访问赋值符号右侧的值

赋值符号:将变量值的内存地址绑定给变量名

变量值 :一组数据

变量先定义后引用

  1. id(变量名) # 查看内存地址
  2. type(变量名) # 查看类型
  3. is # 比较两个变量的内存地址是否一样
  4. == # 比较两个值是否一样 ,值相同内存地址不一样(pycharm里会一样)
  5. """
  6. 小整数池(-5,256) 在python解释器启动的时候就会在内存中先申请 ,当用到这些值的时候不再开辟新的内存空间直接引用
  7. """

变量名规范

  • 数字字母和下划线组成
  • 不能数字开头
  • 不能是python的内置关键字

    建议:

  • 下划线连接命名

  • 见明知意

常量

python中没有常量的概念,但是在程序开发过程中会涉及到常量的概念,人为定义变量名全大写为常量

6.内存的指向关系

1.数据类型 - 图2

1.数据类型 - 图3

1.数据类型 - 图4
1.数据类型 - 图5

1.数据类型 - 图6

内存管理:

1.数据类型 - 图7

垃圾回收机制(GC)管理的是堆区

垃圾:当一个变量值被绑定的变量名的引用个数为0时候,该变量值无法被访问到,该变量值就是垃圾

程序在运行过程中会申请大量的内存空间。对于一些无用的内存空间如果不及时清理的话会导致内存溢出,导致程序崩溃,因此内存管理是一件重要且繁杂的事情,而python解释器自带的垃圾回收机制会自动的帮我们去管理

python的gc模块主要运用了引用计数来跟踪和回收垃圾,在引用计数的基础上还可以通过 标记-清除 解决容器对象可能产生的循环引用的问题,并且通过分代回收以空间换取时间的方式来进一步提高垃圾回收的效率

引用计数增加:当变量值被多个变量名指向时就叫引用计数增加每有一个变量名指向该值 引用计数加1

变量值被关联次数的增加或减少,都会引发引用计数机制的执行(增加或减少值的引用计数),这存在明显的效率问题。

引用计数减少:当变量名为变量值的引用关系减少时引用计数减1

如: x = 8 ,del x 就是解除x与8的引用关系

标记清除

标记/清除算法的做法是当应用程序可用的内存空间被耗尽的时,就会停止整个程序,然后进行两项工作,第一项则是标记,第二项则是清除
1、标记 通俗地讲就是:标记的过程就行相当于从栈区出发一条线,“连接”到堆区,再由堆区间接“连接”到其他地址,凡是被这条自栈区起始的线连接到内存空间都属于可以访达的,会被标记为存活 具体地:标记的过程其实就是,遍历所有的GC Roots对象(栈区中的所有内容或者线程都可以作为GC Roots对象),然后将所有GC Roots的对象可以直接或间接访问到的对象标记为存活的对象,其余的均为非存活对象,应该被清除。
2、清除 清除的过程将遍历堆中所有的对象,将没有标记存活的对象全部清除掉。

通俗点就是:标记清除不是时刻都运行着的,而是当应用程序可用的内存空间被耗尽的时,就会停止整个程序,然后进行两项工作,第一项则是标记,第二项则是清除,扫描栈区,一栈区中的变量名为起始,判断该变量是否能直接引用到堆区的值,如果可以标记堆区中该直接引用的值为存活,如果该堆区中的值也间接引用着堆区中的其他值,则其他值也标记为存活,其他的就清除掉

循环引用情况下 变量循环引用的时候 存在内存泄露 此时标记清除可以避免这种情况
扫描栈区,变量名存在标记为存活

直接引用指的是从栈区出发直接引用到的内存地址,间接引用指的是从栈区出发引用到堆区后再进一步引用到的内存地址,以我们之前的两个列表l1与l2为例画出如下图像
image.png
当我们同时删除l1与l2时,会清理到栈区中l1与l2的内容
image.png
这样在启用标记清除算法时,发现栈区内不再有l1与l2(只剩下堆区内二者的相互引用),于是列表1与列表2都没有被标记为存活,二者会被清理掉,这样就解决了循环引用带来的内存泄漏问题。

  1. l1 = [111] #111引用加一
  2. l2 = [222] #222引用加一
  3. l1.append(l2) #222引用加一
  4. l2.append(l1) #111引用加一
  5. del l1 #111引用减一
  6. del l2 #222引用减一
  7. 此时已经无法取到111 但是 111的引用计数是不为0 造成内存泄露

分代回收

基于引用计数的回收机制,每次回收内存,都需要把所有对象的引用计数都遍历一遍,这是非常消耗时间,于是引入了分代回收机制来提高回收效率,分代回收采用的是空间换时间的策略

分代:分代回收的核心思想是在历经多次扫描的情况下,都没有被回收的变量,gc机制就会认为,该变量是常用变量,gc会对其扫描的频率降低

具体原理:分代指的是根据存活时间来为变量划分不同的等级

分代指的是根据存活时间来为变量划分不同等级(也就是不同的代) 新定义的变量,放到新生代这个等级中,假设每隔1分钟扫描新生代一次,如果发现变量依然被引用,那么该对象的权重(权重本质就是个整数)加一,当变量的权重大于某个设定得值(假设为3),会将它移动到更高一级的青春代,青春代的gc扫描的频率低于新生代(扫描时间间隔更长),假设5分钟扫描青春代一次,这样每次gc需要扫描的变量的总个数就变少了,节省了扫描的总时间,接下来,青春代中的对象,也会以同样的方式被移动到老年代中。也就是等级(代)越高,被垃圾回收机制扫描的频率越低

虽然分代回收可以起到提升效率的效果,但也存在一定的缺点:
例如一个变量刚刚从新生代移入青春代,该变量的绑定关系就解除了,该变量应该被回收,但青春代的扫描频率低于新生代,所以该变量的回收就会被延迟。

回收:依然是引用计数作为回收依据

1.数据类型 - 图10

8.None类型

python数据类型中有一个特殊的值None,表示为空

9.输入

输入可以实现程序和用户之间的交互

*输入的任何内容实际上都是字符串类型的

  1. name=input('请输入你的名字:')

10.条件语句

注意缩进的问题,4个空格

  1. if 条件:
  2. 成立执行的代码
  3. else
  4. 不成立执行的代码
  1. 多条件判断
  2. if 条件1
  3. 成立指向的代码
  4. elif 条件2
  5. 条件2成立后指向的代码
  6. else
  7. 都不成立后执行的代码

11.循环语句

1.while循环

  1. while 条件:
  2. 条件成立进入此循环,直到条件不成立的时候结束循环
  3. 或者循环中遇到break 则直接退出本层循环往下执行
  4. 当遇到contine时则退出本次循环,开始下一次循环
  5. #举例
  6. while True # 死循环,因为条件一直成立
  7. print'你好'
  8. break
  9. print'结束'
  10. #
  11. 你好
  12. 结束

2.while else

当while后的条件不成立的时候,else中的代码就会执行

  1. while 条件:
  2. 代码
  3. else
  4. 代码

3for循环

理论上for循环能做的事情while循环都可以做

之所以要for循环是因为for循环在循环取值,遍历取值比while循环好用

目前只有list str tuple dict set可以被for循环

  1. for 变量名 in 可迭代对象:
  2. 代码块

range()

  1. range(5)# [0,1,2,3,4]
  2. range(1,5) #[1,2,3,4,]
  3. range(1,10,2)#[1,3,5,7,9]
  4. range(len(list)-1)
  5. python3中是range(5) # range(0,5)迭代器

13.运算符

算数运算符

加减乘除 % ** //(返回商的整数部分)

比较运算符

大于 小于 != == >= <=

赋值运算符

= += -= *= /= %=

成员运算

字典判断的是key

in 在里面,如果在就返回True 不在返回False ,X in Y ,x是否在y里面

not in 不在里面,如果不在就返回True ,在就返回False ,X not in Y ,x不在Y里面

逻辑运算

and 与,都为真时则为真,有一个假则为假

or 或,有一个为真则为真

not 非,not(true)就是False

运算符的优先级

算数>比较>逻辑>not>and>or

有括号的时候括号优先级最大

注释

注释的内容,解释器会忽略不会执行

  1. # 单行注释
  2. ”“”
  3. 多行注释
  4. 多行注释
  5. “”“

链式赋值

x = y = z = 10

交叉赋值

  1. m = 10
  2. n = 20
  3. temp = m
  4. m = n
  5. n = temp
  6. mj,n = n,m

解压赋值

可以解压列表字典,解压字典的时候默认是解压的key

  1. s = [1,2,3,4,5]
  2. # 将5个元素赋值给不同的变量名
  3. # 变量名的个数必须和元素的个数相同
  4. s0,s1,s2,s3,s4=s
  5. #超出3个的会被*接收赋值给_
  6. x,y,z,*_ = s # 1 2 3
  7. *_,x,y,z =s # 3 4 5
  8. x,*_,y,z = s # 1 4 5

可变类型和不可变类型

可变类型:值改变,id不改变,证明改的是原值,证明原值是可以被改变的

list dict set

不可变类型,值改变,id也变了,证明是产生的新值,没有改变原值,证明原值不可以被改变,被设计为一个整体

int str float bool tuple

深浅拷贝

深拷贝

  • 拷贝一下原列表产生一个新的列表
  • 让两个列表完全独立开

浅拷贝
  1. list1 = ['ok','lrt',[1,2]]
  2. list2 = list1
  3. # 两者分隔不开list做修改list2也跟着修改,因为指向关系
  1. import copy
  2. list3 = copy.deepcopy(list1)
  3. #对于不可变类型内存地址是不改变的,可变类型的内存地址改变
  4. # list3和list1里的不可变类型的id值是一样的,但是可变类型的id是不一样的,这样在修改任意列表里的可变类型的数据时候不会影响另一个列表
  5. # 总结就是对于不可变类型拷贝一份id不改变,可变类型拷贝一份但是id会改变,
  1. list2 = list1.copy()
  2. # 此时list2 和 list1 的id是不一样的,但是list2列表里的元素的id和list1列表里的元素的id是一样的
  3. # 对于浅拷贝如果里面存放的都是不可变类型修改任意一个列表是不会影响另一个列表的,因为不可变类型是重现产生一个新的值,进行id的引用
  4. ,如果存放可变类型,修改任意一个列表是会影响另一个列表的因为两个列表里的元素id是一样的

队列和堆栈

都是数据结构

队列是先进先出

堆栈是后进先出

字符编码

1.什么是字符编码

  1. 计算机中说有的数据本质上都是01的组合来存储
  2. 计算机中有多种编码:使用不同的编码保存文件硬盘中存储的01也是不同的
  3. utf-8 python默认的读写编码
  4. gbk
  5. 以某种编码的形式保存文件以后就要以着用形式的编码去打开否则就会出现乱码
  6. 设置python解释编码:-- coding:utf-8 --
  1. ASCII
    1. 只支持英文字符串
    2. 采用8位二进制数对应一个英文字符串
    3. 8bit = 1Bytes = 1字节 = 1字符
  1. GBK
    1. 支持英文,中文字符
    2. 采用8位二进制对应一个英文字符
    3. 采用16位二进制对应一个中文字符
  1. unicode
    1. 万国码
    2. 采用16位二进制对应一个中文字符串(8bit = 1Bytes)
    3. 个别生僻字采用4Bytes , 8Bytes
    4. 与其他字符编码都有对应关系
  1. UTF-8
    1. 英文1Bytes 汉字 3Bytes
    2. 用uncode存储英文的时候会io慢,因为英文8bit就看可以表示,unicode用了16bit

2.过程

  • 写文件 指定的是保存到硬盘用的编码
  • 读文件 指定读文件用的编码
  • 解释器解释文件 ,内存中的编码固定都是unicode
  • 保证写文件和读文件用一样的编码,

3.python2和python3区别

  • python2用的是ascll码解释文件
  • python3是用的utf8 解释文件

4.解决python2乱码问题

  • 文件头指定读文件的编码 # coding:utf-8
  • 字符串前加u, x = u”weyt” 表示用unicode存

5.编码转换

  1. 借助 unicode 进行转换

HASH

hash 一般叫做散列 杂凑 或这是哈希,是把任意长度的输入通过散列算法变换成固定长度的输出,该输出就是散列值,这种转换是一种压缩映射,也就是散列值的空间通常小于输出的空间

hash算法是一个复杂的运算,他的输入可以是字符串,数据,任何文件,经过哈希运算后变成一个固定的长度输出,该输出就是哈希值,哈希算法有一个特点就是不能从结果推算出输入,又叫 不可逆运算

  1. hash()

Print

  1. 默认会在末尾加换行符
  2. 不换行的方式:print("你好",end="")