如果采用面向对象的程序设计思想,我们首选思考的不是程序的执行流程,而是Student这种数据类型应该被视为一个对象,这个对象拥有name和score这两个属性(Property)。
如果要打印一个学生的成绩,首先必须创建出这个学生对应的对象,然后,给对象发一个print_score消息,让对象自己把自己的数据打印出来。
class Student(object):
def __init__(self, name, score)
self.name = name
self.score = score
def print_scope(self):
print('%s: %s' % (self.name, self.score))
给对象发消息实际上就是调用对象对应的关联函数,我们称之为对象的方法(Method)。面向对象的程序写出来就像这样:
bart = Student('Bart Simpson', 59)
lisa = Student('Lisa Simpson', 87)
bart.print_score()
lisa.print_score()
Class是一种抽象概念,比如我们定义的Class——Student,是指学生这个概念,而实例(Instance)则是一个个具体的Student,比如,Bart Simpson和Lisa Simpson是两个具体的Student。
所以,面向对象的设计思想是抽象出Class,根据Class创建Instance。
类和实例
在Python中,定义类是通过class
关键字。
# class后面紧跟着类名Student,类名通常是大写开头
# 紧接着是(object),表示该类是从哪个类继承下来的
# 通常如果没有合适的继承类就使用object类,这是所有类最终都会继承的类。
class Student(object):
pass
# 创建实例是通过类名+()
bart = Student()
可以自由地给一个实例变量绑定属性,比如,给实例bart绑定一个name属性:
>>> bart.name = 'Bart Simpson'
>>> bart.name
'Bart Simpson'
由于类可以起到模板的作用,因此,可以在创建实例的时候,把一些我们认为必须绑定的属性强制填写进去。通过定义一个特殊的__init__
方法,在创建实例的时候,就把name
,score
等属性绑上去:
class Student(object):
# __init__方法的第一个参数永远是self,表示创建的实例本身
def __init__(self, name, score):
self.name = name
self.score = score
bart = Student('Bart Simpson', 59)
数据分装
内部定义访问数据的函数,就把“数据”给封装起来了。
这些封装数据的函数是和Student类本身是关联起来的,我们称之为类的方法:
class Student(object):
def __init__(self, name, score):
self.name = name
self.score = score
# 除了第一个参数是self外,其他和普通函数一样。调用时self不用传
def print_score(self):
print('%s: %s' % (self.name, self.score))
访问限制
如果要让内部属性不被外部访问,可以把属性的名称前加上两个下划线__
,在Python中,实例的变量名如果以__
开头,就变成了一个私有变量(private),只有内部可以访问,外部不能访问。
class Student(object):
def __init__(self, name, score):
self.__name = name
self.__score = score
def print_score(self):
print('%s: %s' % (self.__name, self.__score)
如果外部代码需要获取name
和score
,可以给Student
增加get_name
和get_score
方法:
class Student(object):
...
def get_name(self):
return self.__name
def get_score(self):
return self.__score
如果外部代码需要修改score
,可以给Student
增加set_score
方法:
class Student(object):
...
def set_score(self, score):
if 0 <= score <= 100:
self.__score = score
else:
raise ValueError('bad scord')
在 Python 中,变量名类似
__xxx__
的,也就是双下划线开头且双下划线结尾的是特殊变量,特殊变量是可以直接访问的,不是私有变量,所以不能用__name__
、__score__
这样的变量名。可能会看到以一个下划线开头的实例变量名,比如
_name
,这样的实例变量外部是可以访问的,但是,按照约定俗成的规定,当你看到这样的变量时,意思就是,“虽然我可以被访问,但是,请把我视为私有变量,不要随意访问”。
双下划线开头的实例变量其实外部也可以访问。不能直接访问__name
是因为Python解释器对外把__name
变量改成了_Student__name
,所以仍然可以通过_Student__name
来访问__name
变量。
但是强烈建议你不要这么干,因为不同版本的Python解释器可能会把__name
改成不同的变量名。
继承和多态
在OOP程序设计中,当我们定义一个class的时候,可以从某个现有的class继承,新的class称为子类(Subclass),而被继承的class称为基类、父类或超类(Base class、Super class)。
# 编写一个名为`Animal`的class,有一个run()方法可以直接打印
class Animal(object):
def run(self):
print('Animal is running...')
# 需要编写DOg和Cat类的时候,可以直接从 Animal类继承
class Dog(Animal):
pass
class Cat(Animal):
pass
对于Dog
和Cat
来说,Animal
就是它的父类。对Animal
来说,Dog
和Cat
就是他的子类。
继承
子类获得了父类的全部功能:
>>> dog = Dog()
>>> dog.run()
Animal is running...
也可以对子类增加方法:
class Dog(Animal):
def run(self):
print('Dog is running...')
def eat(self):
print('Eating meat...')
- 要确定一个类是否是另一个类的子类,可使用内置方法
issubclass
```python class Filter: pass class SPAMFilter(Filter): pass
issubclass(SPAMFilter, Filter) True issubclass(Filter, SPAMFilter) False ```
如果你有一个类,并想知道它的基类,可访问其特殊属性
__bases__
。>>> SPAMFilter.__bases__
(<class __main__.Filter at 0x171e40>,)
>>> Filter.__bases__
(<class 'object'>,)
同样,要确定对象是否是特定类的实例,可使用
isinstance
。>>> s = SPAMFilter()
>>> isinstance(s, SPAMFilter)
True
>>> isinstance(s, Filter)
True
>>> isinstance(s, str)
False
如果你要获悉对象属于哪个类,可使用属性
__class__
。>>> s.__class__
<class __main__.SPAMFilter at 0x1707c0>
多态
当子类和父类都存在相同的run()
方法时,我们说,子类的run()
覆盖了父类的run()
,在代码运行的时候,总是会调用子类的run()
。这样,我们就获得了继承的另一个好处:多态。
在继承关系中,如果一个实例的数据类型是某个子类,那它的数据类型也可以被看做是父类。
a = Animal() # a是Animal的类型
d = Dog() # d是Dog的类型
isinstance(a, Animal) # True
isinstance(d, Dog) # True
# !!!注意:
isinstance(d, Animal) # True
上面代码中,d
不仅是Dog
的类型,还是Animal
的类型。
对于一个变量,我们只需要知道它是Animal类型,无需确切地知道它的子类型,就可以放心地调用run()
方法,而具体调用的run()
方法是作用在Animal
、Dog
、还是Cat
对象上,由运行时该对象的确切类型决定,这就是多态真正的威力:调用方只管调用,不管细节,而当我们新增一种Animal的子类时,只要确保run()方法编写正确,不用管原来的代码是如何调用的。这就是著名的“开闭”原则:
- 对扩展开放:允许新增Animal子类;
- 对修改封闭:不需要修改依赖Animal类型的run_twice()等函数。
>>> def run_twice(animal):
... animal.run()
>>>run_twice(Animal()):
Animal is running...
>>> run_twice(Dog())
Dog is running...
静态语言 vs 动态语言
对于静态语言(例如Java
)来说,如果需要传入Animal
类型,则传入的对象必须是Animal
类型或者它的子类,否则,将无法调用run()
方法。
对于Python这样的动态语言来说,则不一定需要传入Animal
类型。我们只需要保证传入的对象有一个run()
方法就可以了:
class Timer(object):
def run(self):
print('Start...')
这就是动态语言的“鸭子类型”,它并不要求严格的继承体系,一个对象只要“看起来像鸭子,走起路来像鸭子”,那它就可以被看做是鸭子。
Python的“file-like object
“就是一种鸭子类型。对真正的文件对象,它有一个read()
方法,返回其内容。但是,许多对象,只要有read()
方法,都被视为“file-like object
“。许多函数接收的参数就是“file-like object
“,你不一定要传入真正的文件对象,完全可以传入任何实现了read()
方法的对象。
获取对象信息
type()
判断对象类型。
# 基本类型都可以用type()判断:
>>> type(123)
<class 'int'>
>>> type('str')
<class 'str'>
>>> type(None)
<type(None) 'NoneType'>
# 如果一个变量指向函数或者类,也可以用type()判断:
>>> type(abs)
<class 'builtin_function_or_method'>
>>> type(a)
<class '__main__.Animal'>
# 判断一个对象是否是函数,可以使用types模块中定义的常量:
>>> import types
>>> def fn():
... pass
...
>>> type(fn)==types.FunctionType
True
>>> type(abs)==types.BuiltinFunctionType
True
>>> type(lambda x: x)==types.LambdaType
True
>>> type((x for x in range(10)))==types.GeneratorType
True
isinstance()
isinstance()
判断的是一个对象是否是该类型本身,或者位于该类型的父继承链上。
>>> a = Animal()
>>> d = Dog()
>>> h = Husky()
>>> isinstance(h, Dog)
True
>>> isinstance(h, Animal)
True
>>> isinstance(d, Dog) and isinstance(d, Animal)
True
>>> isinstance(d, Husky)
False
能用type()
判断的基本类型也可以用isinstance()
判断:
>>> isinstance('a', str)
True
>>> isinstance(123, int)
True
>>> isinstance(b'a', bytes)
True
并且还可以判断一个变量是否是某些类型中的一种,比如下面的代码就可以判断是否是list或者tuple:
>>> isinstance([1, 2, 3], (list, tuple))
True
>>> isinstance((1, 2, 3), (list, tuple))
True
isinstance() 与 type() 区别:
- type() 不会认为子类是一种父类类型,不考虑继承关系。
- isinstance() 会认为子类是一种父类类型,考虑继承关系。
如果要判断两个类型是否相同推荐使用 isinstance()。
class A(object):
pass
class B(A):
pass
b = B()
>>> print(type(b) == B)
True
>>>print(type(b) == A)
False
>>> print(isinstance(b, B))
True
>>> print(isinstance(b, A))
True
dir()
获得一个对象的所有属性和方法,返回一个包含字符串的list。
>>> dir('ABC')
['__add__', '__class__',..., 'capitalize',...]
类似__xxx__
的属性和方法在Python中都是有特殊用途的,比如__len__
方法返回长度。如果你调用len()
函数试图获取一个对象的长度,实际上,在len()
函数内部,它自动去调用该对象的__len__()
方法:
>>> len('ABC')
3
>>> 'ABC'.__len__()
3
自己写的类也想用len(myObj)
的话,就自己写一个__len__()
方法:
class MyDog(object):
def __len__(self):
return 100
dog = MyDog()
>>> len(dog)
100
配合getattr()
、setattr()
、hasattr()
,可以操作一个对象的状态:
class MyObject(object):
def __init__(self):
self.x = 9
def power(self):
return self.x * self.x
obj = MyObject()
hasattr(obj, 'x') # 有属性x吗? True
hasattr(obj, 'y') # False
setattr(ibj, 'y', 19) # 设置一个属性'y'
getattr(obj, 'y') # 获取属性'y', 19
obj.y # 获取属性'y', 19
# 可以传入一个default参数,如果属性不存在,就返回默认值(不设置默认值,查询不存在的属性会报错):
getattr(obj, 'z', 404) # 获取属性'z',不存在的话返回默认值404
也可以获得对象的方法:
>>> hasattr(obj, 'power') # 有属性'power'吗?
True
>>> getattr(obj, 'power') # 获取属性'power'
<bound method MyObject.power of <__main__.MyObject object at 0x10077a6a0>>
>>> fn = getattr(obj, 'power') # 获取属性'power'并赋值到变量fn
>>> fn # fn指向obj.power
<bound method MyObject.power of <__main__.MyObject object at 0x10077a6a0>>
>>> fn() # 调用fn()与调用obj.power()是一样的
81
小结
通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。
如果可以直接写:sum = obj.x + obj.y
就不要写sum = getattr(obj, 'x') + getattr(obj, 'y')
实例属性和类属性
根据类创建的实例可以绑定任意属性。
给实例绑定属性的方法是通过实例变量,或者通过self
变量:
class Student(object):
def __init__(self, name):
self.name = name
s = Student('Bob')
s.score = 90
如果Student
类本身需要绑定一个属性,可以直接在class中定义属性,这种属性是类属性,归Student
类所有,但是类的所有实例都可以访问到。
class Student(object):
name = 'Student'
s = Student()
print(s.name) # Student
s.name = 'Michael' # 给实例绑定name属性
print(s.name) # Michael
print(Student.name) # Student
del s.name # 如果删除实例的name属性
print(s.name) # Student
# 为了统计学生人数,可以给Student类增加一个类属性,每创建一个实例,该属性自动增加:
class Student(object):
count = 0
def __init__(self, name):
self.name = name
Student.count += 1