字符串的定义

python定义字符串方式:由’ ‘,” “,’’’ ‘’’括起来的就叫字符串。
三个单引号或者双引号主要是用来作为文档注释的,所以尽量不要拿来定义字符串,虽然这样也不会报错。

PEP8有规定,一行代码的长度请勿超过120个字符,如果遇到长度超过120个字符的情况,可以使用以下方式:

  1. # 不推荐的使用方式:
  2. line = """
  3. Create a new string object from the given object.
  4. If encoding or errors is specified,
  5. then the object must expose a data buffer that will be
  6. decoded using the given encoding and error handler.
  7. """
  8. # 或者这样
  9. line = "Create a new string object from the given object. " \
  10. "If encoding or errors is specified," \
  11. "then the object must expose a data buffer that will be" \
  12. " decoded using the given encoding and error handler."
  13. # 更好的实现方式:
  14. line = ("Create a new string object from the given object."
  15. "If encoding or errors is specified,"
  16. "then the object must expose a data buffer that will be "
  17. "decoded using the given encoding and error handler."
  18. )

字符串中 .is()的用法

.is(),既然是is,那么它返回的结果只有两种,True or False
先来对比一下数字:

isdigit()
True:Uicode数字,byte数字(含单字节),全角数字(双字节),罗马数字
False:汉字数字
Error:无

isdecimal()
True:Unicoe数字,全角数字(双字节)
False:罗马数字,汉字数字
Error:byte数字(单字节)

isnumeric()
True:Unicode数字,全角数字(双字节),罗马数字,汉字数字
False:无
Error:byte数字(单字节)

偏门知识:

a='①②③④⑤'
isdigit()、isnumeric() 为True isdecimal()为False
b='一壹'
isnumeric()会认为是True的哦!

isalnum() = isdigit() + isalpha() + isspace()
isdigit()表示字符串内全部为数字
isalpha()表示字符串内全部为字符
isspace()表示字符串有一个或多个空格组成
isalnum()表示字符串内全部为数字和字符

a='12345'
b='①②③④⑤'
c='abc123'

print(a.isdigit()) # True
print(b.isalpha()) # True
print(c.isalnum()) # True

针对字符串大小写的方法:

.isupper() 字符串全部由大写组成
.islower() 字符串全部由小写组成
.istitle() 字符串形式为驼峰命名,eg:”Hello World”

以上这些用法去掉is,则会变为对应的字符串转化方法

最后一个不带.的is*—->isinstance(obj,type)

判断一个object是什么类型…
type可选类型为:int,float,bool,complex,str,bytes,unicode,list,dict,set,tuple
并且type可以为一个原组:isinstance(obj, (str, int))

判断字符串中的内容

.*with() starts ends 不仅支持开头结尾的匹配,还支持start和end两个参数来动态定义字符串的index位置

long_string = "To live is to learn,to learn is to better live"
long_string.startswith('To') # True
long_string.startswith('li', 3, 5) # True
long_string.endswith('live') # True
long_string.endswith('live', 0, 7) #True

同样支持start、end来判断字符串的还有 .find()、.rfind()和 .index()、.rindex()
这两类字符串寻址方法均支持从左到右、从右至左两种寻址方式,不同的是:
find在未找到时,返回-1,而index在未找到时,会抛出ValueError的异常…

long_string.index('live') # 3
long_string.rindex('live') # 42

字符串内容变更

狭义来说使用,字符串的替换使用.replace()即可,那为什么还要单独说呢?因为它有一个可选参数count

long_string = "To live is to learn,to learn is to better live"
long_string.count('live') # 2
long_string.replace('live','Live',1)
output:
'To Live is to learn,to learn is to better live'
# 可以看到,第二个live并未进行替换

刚才说了狭义,那么广义呢?

  1. (l/r)strip()
    将字符串左、右、两端的特定字符过滤掉,默认为空格…
    strip()要注意的地方是,strip(‘TolLive’) 中的字符并非完整匹配,而是针对每一个字符进行匹配,说起来混,直接上例子:
    long_string = "To live is to learn,to learn is to better live"
    long_string.strip('TolLive')
    ' live is to learn,to learn is to better '
  1. 字符串切片
    字符串的切片分为long_string[start:end;step] start、end区间为左闭右开…这个网上说的太多了,再拉出来详细讲就要挨打了…

(l/r)just(width,[fillchar])、center(width, [fillchar])、zfill(width)
这些均为填充固定长度的字符,默认使用空格(zfill为左补0,z是zero的意思…),看意思就明白了,不用多讲了….

字符串格式化输出

Python格式化输出分为两类,那是在pyton2的时代,即 % 和 format。

  1. % 格式化输出:
  • 如何在%的格式输出中,输出用来看做标记为的%符号呢?使用两个百分号(%%)
  • %(-)(width) width为设置长度,默认左填充空格,添加-号为右填充
  • width代表字符串截断,保留多少长度的字符串
  • type %s字符串 %d十进制整数 %f小数 …
  • 多个参数是,后面的参数需要使用括号包裹起来
'姓名:%-5s 年龄:%4d 爱好: %.8s' % ('王大锤',30,'python、Java')
output:
'姓名:王大锤   年龄:  30 爱好:python、J'
  1. format格式输出:
    format在python3开始官方就表示为替换%的输出方式,之所以还保留着%,主要是为了兼容性考虑
  • 对比%,format使用花括号{}表示变量
  • < > ^ 代表了format的对齐方式
'{:-^40s}'.format('华丽的分割线')
output:
'-----------------华丽的分割线-----------------'
  1. f-string
    Python3.6的版本更新时,新增了f-string,英文好的可以去看官方解释PEP 498 — Literal String Interpolation 。
    f-string是字符串引号前以f/F开头,并使用{}标注替换位置的使用形式。
    之所以官方推出f-string,主要是因为它的更高的性能、更强的功能。 例子走起:
name = 'Uranus'
f'Hello,{name}'
f'Hello,{name.lower()}'
f'Hello,{name:^10s}'
f'Hello,{(lambda x: x*2) (name)}'

output:
'Hello,Uranus'
'Hello,uranus'
'Hello,  Uranus  '
'Hello,UranusUranus'