基础数据类型

基础数据类型,有 7 种类型,存在即合理。

1.int 整数

主要是做运算的 。比如加减乘除,幂,取余 + - / * %…

2.bool 布尔值

判断真假以及作为条件变量

3.str 字符串

存储少量的数据。‘太白’,’password’… 操作简单,便于传输。

4.list 列表

[1,2,’alex’,{name:’zhang’}] 存放大量的数据,大量的数据放到列表中便于操作

5.tuple 元组

也叫只读列表。(1,2,’alex’,{name:’zhang’}) 一些重要的数据或者不想被更改的数据,使用元组

6.dict 字典

{‘name_list’:’[zhang,lisi]’},存储关系型的数据,查询速度非常快,二分查找。

7.set 集合

交集,并集,差集…

分别举例

int 整形

  1. i = 4
  2. #转化成二进制的最小位数
  3. print(i.bit_length())
  4. '''
  5. 1 0000 0001
  6. 1 0000 0010
  7. 3 0000 0011
  8. 4 0000 0100
  9. '''

执行输出:3

str 这里就不举了

bool 布尔值

说一下

数据类型转换:

int —> str

  1. n = str(1)

执行输出:1

int —> bool

  1. n = bool(1)

执行输出:True

str —> bool

  1. n = bool('')

执行输出:False

空字符串是 False,其他都是 True

str 字符串索引与切片

先讲索引

字符串是有序的,有索引的,索引从 0 开始,默认取值是从左至右

  1. s = 'python是最好的语言'
  2. #取第一个字符
  3. s1 = s[0]
  4. #取索引值为2的元素
  5. s2 = s[2]
  6. #最后一个
  7. s3 = s[-1]
  8. print(s1)
  9. print(s2)
  10. print(s3)

执行输出:

p

t

切片

语法:

[起始索引:截止索引:步长]

步长默认为 1,表示从头开始取

切片,也就是取连续的多个值

切片原则,顾头不顾尾

什么意思?举例说明

  1. s = 'python是最好的语言'
  2. s1 = s[0:2]
  3. print(s1)

执行输出:

py

先看字符串的索引对应

p y t h o n

↓ ↓ ↓ ↓ ↓ ↓

0 1 2 3 4 5

我是取 0~2 的,发现 t 没有显示出来,因为根据切片原则,末尾的不显示

如果想输出末尾的,需要加 1 即可。比如 s[0:3]

中文字符串也是同样的,一个中文字,即一个索引

  1. s = 'python是最好的语言'
  2. s1 = s[7:9]
  3. print(s1)

执行输出:

最好

全取

  1. s = 'python是最好的语言'
  2. s1 = s[:]
  3. print(s1)

执行输出:

python 是最好的语言

切片会产生新的变量**,在内存中,原字符串和切片后的字符串,是 2 个变量**

s4 = s[:] 虽然结果是一样的,但它是 2 个变量

对字符串操作,都会产生新的变量,除了赋值以外。

取最后 5 个字符串

  1. s = 'python是最好的语言'
  2. s1 = s[-5:]
  3. print(s1)

执行输出:

最好的语言

步长

默认步长为 1

隔一个取 1 个,步长为 2

反向取值,也就是从后向前取,步长为-1

隔 1 个,取一个

  1. s = 'python是最好的语言'
  2. s1 = s[::2]
  3. print(s1)

执行输出:

pto 是好语

反向取 5 个

  1. s = 'python是最好的语言'
  2. s1 = s[:-5:-1]
  3. print(s1)

执行输出:

言语的好

反向全取

  1. s = 'python是最好的语言'
  2. s1 = s[::-1]
  3. print(s1)

执行输出:

言语的好最是 nohtyp

字符串常用操作方法

用以下✴表示使用程度

✴✴✴ 非常

✴✴ 常用

✴ 一般

✴✴✴capitalize() 首字母大写,其他字母小写
  1. s = 'laoshi'
  2. s1 = s.capitalize()
  3. print(s1)

执行输出:

Laoshi

✴✴✴**upper() 全部大写**

✴✴✴**lower() 全部小写**

  1. s = 'laoshi'
  2. s1 = s.upper()
  3. s2 = s.lower()
  4. print(s1)
  5. print(s2)

执行输出:

LAOSHI

laoshi

比如验证码判断功能

  1. code = 'aeQu'
  2. your_code = input('请输入验证码:')
  3. if your_code == 'aequ' or your_code == 'Aequ'...

如果不使用字符串内置方法,这需要写 16 个 if,代码质量非常 low

下面使用字符串内置方法

  1. code = 'aeQu'
  2. your_code = input('请输入验证码:')
  3. if your_code.upper() == code.upper():
  4. print('验证码验证成功')

执行输出:

  1. ![](https://cdn.nlark.com/yuque/0/2020/png/1484428/1597712985868-9a688f5b-ef7d-45e5-9809-a6de54c1145a.png)

代码优化一下

  1. code = 'aeQu'.upper()
  2. your_code = input('请输入验证码:').upper()
  3. if your_code == code:
  4. print('验证码验证成功')

执行效果同上

✴**center() 居中**

  1. s = 'laoshi'
  2. #总宽度为30,并且字符串居中,不足30,默认用空格填充
  3. s1 = s.center(30)
  4. #使用*填充
  5. s2 = s.center(30,'*')
  6. print(s1)
  7. print(s2)

执行输出:

  1. ![](https://cdn.nlark.com/yuque/0/2020/png/1484428/1597712985881-c81328e4-5a23-46f2-ba4b-38df48f0df7d.png)

如果宽度小于字符串,按照原来的字符串显示

  1. s = 'laoshi'
  2. s1 = s.center(3)
  3. print(s1)

执行输出:

laoshi

✴✴**swapcase() 大小写反转**

  1. s = 'LaoShi'
  2. s1 = s.swapcase()
  3. print(s1)

执行输出:

lAOsHI

✴✴**title() 每个单词的首字母大写(非字母隔开)**

  1. s = 'xiao wusir*nanhai21shui'
  2. s1 = s.title()
  3. print(s1)

执行输出:

Xiao Wusir*Nanhai21Shui

✴✴✴**startswith() 判断以什么为开头**

✴✴✴**endswith() 以什么为结尾**

startswith 的 start 和 end 参数是切片

如果想取到最后,end 参数,不需要指定

  1. s = 'xiao wusir*nanhai21shui'
  2. s1 = s.startswith('a')
  3. s2 = s.endswith('i')
  4. #切片,取索引访问1~4,再判断是否以i开头
  5. s3 = s.startswith('i',1,4)
  6. #切片,取索引范围5~结束,结束位置参数没给,默认一直取到尾
  7. s4 = s.startswith('w',5)
  8. print(s1)
  9. print(s2)
  10. print(s3)
  11. print(s4)

执行输出:

False

True

True

True

✴✴✴**strip() 去除首尾的空格,换行符(\n),tab键(4个空格 用\t表示)**

  1. s = '\nlaoshi\t '
  2. s1 = s.strip()
  3. print(s1)

执行输出:laoshi

在 input 程序中,会经常使用

  1. name = input('请输入用户名:')
  2. if name == 'xiao':
  3. print('ok')

如果用户输入的,不小心包含了空格,会导致验证失败

下面加入 strip()

即使输入有空格,也可以验证通过

  1. name = input('请输入用户名:').strip()
  2. if name == 'xiao':
  3. print('ok')

执行输出:

  1. ![](https://cdn.nlark.com/yuque/0/2020/png/1484428/1597712985904-f5224713-02fd-48f1-aac2-1079b28ff1aa.png)

后续操作文件读取一行内容的时候,也会带有换行符,虽然你看不见,使用 strip(),就可以去除了

类似功能的 2 个的方法

✴**lstrip() 去除左边的空格、换行符、tab键**

✴**rstrip() 去除右边的空格、换行符、tab键**

strip()还可以去除指定的字符串

  1. s = 'laoshijintianzalill'
  2. #去除字符串l
  3. s1 = s.strip('l')
  4. print(s1)

执行输出:

aoshijintianzali

解释一下执行过程

☻→ string ← ☻

strip()相当于 ☻,就像吃豆游戏一样。

strip()会同时向左右 2 边,挨个挨个字符寻找字符串 l 如果发现了 l,就去除,如果没有发现,终止寻找,最后输入结果

比如头部的 lao 找到了字符串 l,开始删除。再继续找下一个字符 a,发现不匹配,终止寻找

同时,尾部的 lill,找到 l,开始删除。继续找下一个,找到 l,删除。再继续下一个,发现字符串 i,不匹配,终止寻找

最终输出:aoshijintianzali

✴✴✴**find() 通过元素找索引**

还有一个函数 index(),也是同样的功能

不同的是,index()找不到,直接报错

find()找不到时,会返回-1

  1. s = 'xiaoxx'
  2. s1 = s.find('a')
  3. s2 = s.index('a')
  4. print(s1)
  5. print(s2)

执行输出:2

✴✴✴**count() 寻找元素出现的个数,可切片**

  1. s = 'xiaomingtongxue'
  2. s1 = s.count('x')
  3. #从第5个索引一直到最后,寻找字符串o出现的次数
  4. s2 = s.count('o',5)
  5. print(s1)
  6. print(s2)

执行输出:

2

1

✴✴✴**replace() 替换**

  1. s = '我的老家在东北,东北有很多人'
  2. #默认是全文替换
  3. s1 = s.replace('东北','黑龙江')
  4. #替换一次
  5. s2 = s.replace('东北','黑龙江',1)
  6. print(s1)
  7. print(s2)

执行输出:

我的老家在黑龙江,黑龙江有很多人

我的老家在黑龙江,东北有很多人

替换,是从左至右的

如果想要替换中间某部分,需要用到正则表达式

✴✴✴**split() 分割,将字符串转换为列表**

默认按照空格分隔

  1. s = 'wo zai tai bei'
  2. s1 = s.split()
  3. print(s1)

执行输出:

[‘wo’, ‘zai’, ‘tai’, ‘bei’]

指定分割符

  1. s = 'wo,zai,tai,bei'
  2. s1 = s.split()
  3. print(s1)

执行输出,效果同上

指定字符串 a

  1. s = 'awozaiataiabei'
  2. s1 = s.split('a')
  3. print(s1)

执行输出:

[‘’, ‘woz’, ‘i’, ‘t’, ‘i’, ‘bei’]

注意:如果关键字左边没有字符串,那么结果为[],也就是空字符串

结果不包含关键字,被剔除了

比如面试题:

有下面一段日志,包含了 IP 地址和时间…需要切割日志

216.244.66.227,[20/Mar/2018:17:03:52 +0800],”Mozilla/5.0”

114.215.45.101,[20/Mar/2018:17:16:30 +0800],”BUbiNG”

106.11.152.107,[20/Mar/2018:17:22:40 +0800],”YisouSpider”

可以用正则表达式,但是比较麻烦,有没有更简单的办法呢?用 split(),指定逗号分割,就可以实现

✴✴✴**format() 格式化输出**

这个很牛逼,一定要重点掌握!

有三种用法:

第一种用法:

  1. s = '我叫{},今年{},爱好{}'.format('MT',18,'打怪')
  2. print(s)

执行输出:

我叫 MT,今年 18,爱好打怪

{}表示一个占位符

第二种用法:

  1. s = '我叫{0},今年{1},爱好{2},我依然叫{0}'.format('MT',18,'打怪')
  2. print(s)

执行输出:

我叫 MT,今年 18,爱好打怪,我依然叫 MT

比如一篇文章,名字出现了几十次,那么可以直接用个{0}表示

修改 format 后面的参数,就可以生效了

{0} 表示索引值,如果使用这种方式,索引值必须指定,否则报错

第三种用法: 键值对

  1. s = '我叫{name},今年{age},爱好{hobby}'.format(age=18,name='MT',hobby='打怪')
  2. print(s)

执行输出:

我叫 MT,今年 18,爱好打怪

✴**isalnum() 字符串由字母或数字组成**

✴**isalpha() 字符串只能由字母组成**

✴✴✴**isdigit() 字符串只能由数字组成**

  1. name = 'jingsan123'
  2. s1 = name.isalnum()
  3. s2 = name.isalpha()
  4. s3 = name.isdigit()
  5. print(s1)
  6. print(s2)
  7. print(s3)

执行输出:

True

False

False

isdigit()比较常用,比如判断用户输入的,是否是数字。

或者将字符串转换为数字类型时,要判断字符串是否由纯数字组成,否则报错。

  1. name = '123a'
  2. if name.isdigit():
  3. name = int(name)
  4. else:
  5. print('您输入的含有非数字元素')

执行输出:

您输入的含有非数字元素

✴✴✴**len() 查看数据的长度**

  1. name = 'zhangsan'
  2. print(len(name))

执行输出:8

for 循环

先来使用 while 循环,打印每一个字符串

  1. s = 'abcdef'
  2. count = 0
  3. while count < len(s):
  4. print(s[count])
  5. count += 1

执行输出:

a

b

c

d

e

f

使用 for 循环完成上面的功能

  1. s = 'abcdef'
  2. for i in s:
  3. print(i)

执行程序,效果同上

for 循环和 while 循环的区别在于

for 循环是有限循环

while 循环是无限循环

有些情况,在不需要终止条件的情况下,使用 for 循环

有终止条件的,使用 while 循环

for 循环会自动停止

使用 for 循环实现九九乘法表:

  1. for i in range(1, 10):
  2. for j in range(1, i + 1):
  3. print('{}x{}={}\t'.format(j, i, i * j), end='')
  4. print('\n')

执行输出:

  1. 1x1=1
  2. 1x2=2 2x2=4
  3. 1x3=3 2x3=6 3x3=9
  4. 1x4=4 2x4=8 3x4=12 4x4=16
  5. 1x5=5 2x5=10 3x5=15 4x5=20 5x5=25
  6. 1x6=6 2x6=12 3x6=18 4x6=24 5x6=30 6x6=36
  7. 1x7=7 2x7=14 3x7=21 4x7=28 5x7=35 6x7=42 7x7=49
  8. 1x8=8 2x8=16 3x8=24 4x8=32 5x8=40 6x8=48 7x8=56 8x8=64
  9. 1x9=9 2x9=18 3x9=27 4x9=36 5x9=45 6x9=54 7x9=63 8x9=72 9x9=81

今日作业:

1,有变量name = “aleX leNb” 完成如下操作:

  1. 1) 移除 name 变量对应的值两边的空格,并输出处理结果
  2. 2) 移除name变量左边的'al'并输出处理结果
  3. 3) 移除name变量右面的'Nb',并输出处理结果
  4. 4) 移除name变量开头的a'与最后的'b',并输出处理结果
  5. 5) 判断 name 变量是否以 "al" 开头,并输出结果
  6. 6) 判断name变量是否以"Nb"结尾,并输出结果
  7. 7) 将 name 变量对应的值中的 所有的"l" 替换为 "p",并输出结果
  8. 8) 将name变量对应的值中的第一个'l'替换成'p',并输出结果
  9. 9) 将 name 变量对应的值根据 所有的"l" 分割,并输出结果。
  10. 10) 将name变量对应的值根据第一个'l'分割,并输出结果。
  11. 11) 将 name 变量对应的值变大写,并输出结果
  12. 12) 将 name 变量对应的值变小写,并输出结果
  13. 13) 将name变量对应的值首字母'a'大写,并输出结果
  14. 14) 判断name变量对应的值字母'l'出现几次,并输出结果
  15. 15) 如果判断name变量对应的值前四位'l'出现几次,并输出结果
  16. 16) 从name变量对应的值中找到'N'对应的索引(如果找不到则报错),并输出结果
  17. 17) 从name变量对应的值中找到'N'对应的索引(如果找不到则返回-1)输出结果
  18. 18) 从name变量对应的值中找到'X le'对应的索引,并输出结果
  19. 19) 请输出 name 变量对应的值的第 2 个字符?
  20. 20) 请输出 name 变量对应的值的前 3 个字符?
  21. 21) 请输出 name 变量对应的值的后 2 个字符?
  22. 22) 请输出 name 变量对应的值中 "e" 所在索引位置?
  23. 23)获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。

2,有字符串s = ‘123a4b5c’

  1. 1)通过对li列表的切片形成新的字符串s1,s1 = '123'
  2. 2)通过对li列表的切片形成新的字符串s2,s2 = 'a4b'
  3. 3)通过对li列表的切片形成新的字符串s3,s3 = '1345'
  4. 4)通过对li列表的切片形成字符串s4,s4 = '2ab'
  5. 5)通过对li列表的切片形成字符串s5,s5 = 'c'
  6. 6)通过对li列表的切片形成字符串s6,s6 = 'ba2'

3,使用while和for循环分别打印字符串s=’asdfer’中每个元素。


4,实现一个整数加法计算器(两个数相加):

如:content = input(‘请输入内容:’) # 如用户输入:5+9或5+ 9或5 + 9,然后进行分割再进行计算。

5,计算用户输入的内容中有几个整数(以个位数为单位)。

如:content = input(‘请输入内容:’) # 如fhdal234slfh98769fjdla

答案:

1,有变量 name = “aleX leNb” 完成如下操作:

…(具体需求看上面作业)

1.1~1.4

  1. name = "aleX leNb"
  2. s1 = name.strip()
  3. s2 = name.lstrip('al')
  4. s3 = name.rstrip('Nb')
  5. s4 = name.lstrip('a').rstrip('b')
  6. print(s1)
  7. print(s2)
  8. print(s3)
  9. print(s4)

执行输出:

aleX leNb

eX leNb

aleX le

leX leN

1.5~1.6

  1. s5 = name.startswith('al')
  2. s6 = name.endswith('Nb')
  3. print(s5)
  4. print(s6)

执行输出:

True

True

1.7~1.8

  1. s7 = name.replace('l','p')
  2. s8 = name.replace('1','p',1)
  3. print(s7)
  4. print(s8)

执行输出:

apeX peNb

aleX leNb

1.9~1.10

  1. s9 = name.split('l')
  2. s10 = name.split('l',1)
  3. print(s9)
  4. print(s10)

执行输出:

[‘a’, ‘eX ‘, ‘eNb’]

[‘a’, ‘eX leNb’]

1.11~1.12

  1. s11 = name.upper()
  2. s12 = name.lower()
  3. print(s11)
  4. print(s12)

执行输出:

ALEX LENB

alex lenb

1.13~1.15

  1. s13 = name.capitalize()
  2. s14 = name.count('l')
  3. s15 = name.count('l',4)
  4. print(s13)
  5. print(s14)
  6. print(s15)

执行输出:

Alex lenb

2

1

1.16~1.18

  1. s16 = name.index('N')
  2. s17 = name.find('N')
  3. s18 = name.find('X le')
  4. print(s16)
  5. print(s17)
  6. print(s18)

执行输出:

7

7

3

1.19~1.22

  1. s19 = name[2]
  2. s20 = name[:3]
  3. s21 = name[-2:]
  4. s22 = name.find('e')
  5. s23 = name[:-1:]
  6. print(s19)
  7. print(s20)
  8. print(s21)
  9. print(s22)

执行输出:

e

ale

Nb

2

1.23 获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo

序列,就表示是一个列表。之序列,表示列表中的一个元素。

字符串转换为列表,有种方法:

1.直接使用 list 强制转换。比如

name = "oldboay"
s1 = list(name)

2.使用 split 切割成字符串

题目表示需要去掉最后一个字符,并获取之序列,那么就需要使用第 2 种方法

先获取最后一个字符

name = "oldboay"
#获取最后一个字符
s1 = name[-1]
print(s1)

执行输出:y

再使用 split 指定最后一个字符,进行切割

name = "oldboay"
#使用split对最后一个字符分割
s2 = name.split(name[-1])
print(s2)

执行输出:

[‘oldboa’, ‘’]

最后取第一个元素,最终代码如下:

name = "oldboay"
#使用split对最后一个字符分割,并取第一个元素
s3 = name.split(name[-1])[0]
print(s3)

执行输出:

oldboa

2,有字符串 s = ‘123a4b5c’

…(具体需求看上面作业)

s = '123a4b5c'
s1 = s[0:3]
s2 = s[3:6]
s3 = s[0]+s[2]+s[4]+s[6]
s4 = s[1]+s[3]+s[5]
s5 = s[-1]
s6 = s[5]+s[3]+s[1]
print(s1)
print(s2)
print(s3)
print(s4)
print(s5)
print(s6)

执行输出:

123

a4b

1345

2ab

c

ba2

3,使用 while 和 for 循环分别打印字符串 s=’asdfer’中每个元素。

s = 'asdfer'
count = 0
while count < len(s):
    print(s[count])
    count += 1

执行输出:

a

s

d

f

e

r

4,实现一个整数加法计算器(两个数相加):

如:content = input(‘请输入内容:’) # 如用户输入:5+9 或 5+ 9 或 5 + 9,然后进行分割再进行计算。

先定义一个变量表示用户输入的内容,使用 split()分割,指定+为分隔符

content = '5+9'
num = content.split('+')
for i in num:
    print(i)

执行输出:

5

9

再定义一个变量计算总和

content = '5+9'
the_sum = 0
num = content.split('+')
for i in num:
    the_sum += i

执行报错

TypeError: unsupported operand type(s) for +=: ‘int’ and ‘str’

为什么呢?因为 split 分割出来的是字符串,需要转换一下。

content = '5+9'
the_sum = 0
num = content.split('+')
for i in num:
    the_sum += int(i)

print(the_sum)

执行输出:14

5+9 是连续一起的,如果是 5 + 9 呢?分割的时候,会有空格,使用 strip()方法,就可以去除

content = '5 + 9'
the_sum = 0
num = content.split('+')
for i in num:
    the_sum += int(i.strip())

print(the_sum)

执行输出:14

最后再把 content 换成 input(),终极代码如下:

content = input('请输入内容:').strip()
the_sum = 0
num = content.split('+')
for i in num:
    the_sum += int(i.strip())

print(the_sum)

执行输出:

    ![](https://cdn.nlark.com/yuque/0/2020/png/1484428/1597712985885-c81f7f64-d95b-48d0-83b4-aae1eda34909.png)      

5,计算用户输入的内容中有几个整数(以个位数为单位)。

如:content = input(‘请输入内容:’) # 如 fhdal234slfh98769fjdla

先把字符串,一个个打印出来

content = 'fhdal234slfh98769fjdla'
the_sum = 1
for i in content:
    print(i)

再定义变量 the_sum 计算总数,使用 isdigit()方法判断是否为数字,如果是,总数加 1

content = 'fhdal234slfh98769fjdla'
the_sum = 0
for i in content:
    #print(i)
    if i.isdigit():
        the_sum += 1

print(the_sum)

执行输出:8

最终代码如下:

content = input('请输入内容:').strip()
the_sum = 0
for i in content:
    if i.isdigit():
        the_sum += 1

print(the_sum)

执行输出:

    ![](https://cdn.nlark.com/yuque/0/2020/png/1484428/1597712985914-f0c9f658-4030-45bb-8220-45727b03eef6.png)      

请注意:234 前面的字符串是字母 l,而不是数字

明日默写内容:

分别用 while,for 循环输出字符串 s = input(‘你想输入的内容’)的每一个字符。

while 方式

s = input('请输入你想的内容:')
count = 0
while count < len(s):
    print(s[count])
    count += 1

执行输出:

    ![](https://cdn.nlark.com/yuque/0/2020/png/1484428/1597712985986-be6ce71c-c538-4662-9139-7c29472eb283.png)      

for方式

s = input('请输入你想的内容:')
for i in s:
    print(i)

执行程序,效果同上