1. Day 3 - 编写ORM
    2. 阅读: 221299
    3. 在一个Web App中,所有数据,包括用户信息、发布的日志、评论等,都存储在数据库中。在awesome-python3-webapp中,我们选择MySQL作为数据库。
    4. Web App里面有很多地方都要访问数据库。访问数据库需要创建数据库连接、游标对象,然后执行SQL语句,最后处理异常,清理资源。这些访问数据库的代码如果分散到各个函数中,势必无法维护,也不利于代码复用。
    5. 所以,我们要首先把常用的SELECTINSERTUPDATEDELETE操作用函数封装起来。
    6. 由于Web框架使用了基于asyncioaiohttp,这是基于协程的异步模型。在协程中,不能调用普通的同步IO操作,因为所有用户都是由一个线程服务的,协程的执行速度必须非常快,才能处理大量用户的请求。而耗时的IO操作不能在协程中以同步的方式调用,否则,等待一个IO操作时,系统无法响应任何其他用户。
    7. 这就是异步编程的一个原则:一旦决定使用异步,则系统每一层都必须是异步,“开弓没有回头箭”。
    8. 幸运的是aiomysqlMySQL数据库提供了异步IO的驱动。
    9. 创建连接池
    10. 我们需要创建一个全局的连接池,每个HTTP请求都可以从连接池中直接获取数据库连接。使用连接池的好处是不必频繁地打开和关闭数据库连接,而是能复用就尽量复用。
    11. 连接池由全局变量__pool存储,缺省情况下将编码设置为utf8,自动提交事务:
    12. @asyncio.coroutine
    13. def create_pool(loop, **kw):
    14. logging.info('create database connection pool...')
    15. global __pool
    16. __pool = yield from aiomysql.create_pool(
    17. host=kw.get('host', 'localhost'),
    18. port=kw.get('port', 3306),
    19. user=kw['user'],
    20. password=kw['password'],
    21. db=kw['db'],
    22. charset=kw.get('charset', 'utf8'),
    23. autocommit=kw.get('autocommit', True),
    24. maxsize=kw.get('maxsize', 10),
    25. minsize=kw.get('minsize', 1),
    26. loop=loop
    27. )
    28. Select
    29. 要执行SELECT语句,我们用select函数执行,需要传入SQL语句和SQL参数:
    30. @asyncio.coroutine
    31. def select(sql, args, size=None):
    32. log(sql, args)
    33. global __pool
    34. with (yield from __pool) as conn:
    35. cur = yield from conn.cursor(aiomysql.DictCursor)
    36. yield from cur.execute(sql.replace('?', '%s'), args or ())
    37. if size:
    38. rs = yield from cur.fetchmany(size)
    39. else:
    40. rs = yield from cur.fetchall()
    41. yield from cur.close()
    42. logging.info('rows returned: %s' % len(rs))
    43. return rs
    44. SQL语句的占位符是?,而MySQL的占位符是%sselect()函数在内部自动替换。注意要始终坚持使用带参数的SQL,而不是自己拼接SQL字符串,这样可以防止SQL注入攻击。
    45. 注意到yield from将调用一个子协程(也就是在一个协程中调用另一个协程)并直接获得子协程的返回结果。
    46. 如果传入size参数,就通过fetchmany()获取最多指定数量的记录,否则,通过fetchall()获取所有记录。
    47. Insert, Update, Delete
    48. 要执行INSERTUPDATEDELETE语句,可以定义一个通用的execute()函数,因为这3SQL的执行都需要相同的参数,以及返回一个整数表示影响的行数:
    49. @asyncio.coroutine
    50. def execute(sql, args):
    51. log(sql)
    52. with (yield from __pool) as conn:
    53. try:
    54. cur = yield from conn.cursor()
    55. yield from cur.execute(sql.replace('?', '%s'), args)
    56. affected = cur.rowcount
    57. yield from cur.close()
    58. except BaseException as e:
    59. raise
    60. return affected
    61. execute()函数和select()函数所不同的是,cursor对象不返回结果集,而是通过rowcount返回结果数。
    62. ORM
    63. 有了基本的select()和execute()函数,我们就可以开始编写一个简单的ORM了。
    64. 设计ORM需要从上层调用者角度来设计。
    65. 我们先考虑如何定义一个User对象,然后把数据库表users和它关联起来。
    66. from orm import Model, StringField, IntegerField
    67. class User(Model):
    68. __table__ = 'users'
    69. id = IntegerField(primary_key=True)
    70. name = StringField()
    71. 注意到定义在User类中的__table__idname是类的属性,不是实例的属性。所以,在类级别上定义的属性用来描述User对象和表的映射关系,而实例属性必须通过__init__()方法去初始化,所以两者互不干扰:
    72. # 创建实例:
    73. user = User(id=123, name='Michael')
    74. # 存入数据库:
    75. user.insert()
    76. # 查询所有User对象:
    77. users = User.findAll()
    78. 定义Model
    79. 首先要定义的是所有ORM映射的基类Model
    80. class Model(dict, metaclass=ModelMetaclass):
    81. def __init__(self, **kw):
    82. super(Model, self).__init__(**kw)
    83. def __getattr__(self, key):
    84. try:
    85. return self[key]
    86. except KeyError:
    87. raise AttributeError(r"'Model' object has no attribute '%s'" % key)
    88. def __setattr__(self, key, value):
    89. self[key] = value
    90. def getValue(self, key):
    91. return getattr(self, key, None)
    92. def getValueOrDefault(self, key):
    93. value = getattr(self, key, None)
    94. if value is None:
    95. field = self.__mappings__[key]
    96. if field.default is not None:
    97. value = field.default() if callable(field.default) else field.default
    98. logging.debug('using default value for %s: %s' % (key, str(value)))
    99. setattr(self, key, value)
    100. return value
    101. Modeldict继承,所以具备所有dict的功能,同时又实现了特殊方法__getattr__()和__setattr__(),因此又可以像引用普通字段那样写:
    102. >>> user['id']
    103. 123
    104. >>> user.id
    105. 123
    106. 以及Field和各种Field子类:
    107. class Field(object):
    108. def __init__(self, name, column_type, primary_key, default):
    109. self.name = name
    110. self.column_type = column_type
    111. self.primary_key = primary_key
    112. self.default = default
    113. def __str__(self):
    114. return '<%s, %s:%s>' % (self.__class__.__name__, self.column_type, self.name)
    115. 映射varcharStringField
    116. class StringField(Field):
    117. def __init__(self, name=None, primary_key=False, default=None, ddl='varchar(100)'):
    118. super().__init__(name, ddl, primary_key, default)
    119. 注意到Model只是一个基类,如何将具体的子类如User的映射信息读取出来呢?答案就是通过metaclassModelMetaclass
    120. class ModelMetaclass(type):
    121. def __new__(cls, name, bases, attrs):
    122. # 排除Model类本身:
    123. if name=='Model':
    124. return type.__new__(cls, name, bases, attrs)
    125. # 获取table名称:
    126. tableName = attrs.get('__table__', None) or name
    127. logging.info('found model: %s (table: %s)' % (name, tableName))
    128. # 获取所有的Field和主键名:
    129. mappings = dict()
    130. fields = []
    131. primaryKey = None
    132. for k, v in attrs.items():
    133. if isinstance(v, Field):
    134. logging.info(' found mapping: %s ==> %s' % (k, v))
    135. mappings[k] = v
    136. if v.primary_key:
    137. # 找到主键:
    138. if primaryKey:
    139. raise RuntimeError('Duplicate primary key for field: %s' % k)
    140. primaryKey = k
    141. else:
    142. fields.append(k)
    143. if not primaryKey:
    144. raise RuntimeError('Primary key not found.')
    145. for k in mappings.keys():
    146. attrs.pop(k)
    147. escaped_fields = list(map(lambda f: '`%s`' % f, fields))
    148. attrs['__mappings__'] = mappings # 保存属性和列的映射关系
    149. attrs['__table__'] = tableName
    150. attrs['__primary_key__'] = primaryKey # 主键属性名
    151. attrs['__fields__'] = fields # 除主键外的属性名
    152. # 构造默认的SELECT, INSERT, UPDATE和DELETE语句:
    153. attrs['__select__'] = 'select `%s`, %s from `%s`' % (primaryKey, ', '.join(escaped_fields), tableName)
    154. attrs['__insert__'] = 'insert into `%s` (%s, `%s`) values (%s)' % (tableName, ', '.join(escaped_fields), primaryKey, create_args_string(len(escaped_fields) + 1))
    155. attrs['__update__'] = 'update `%s` set %s where `%s`=?' % (tableName, ', '.join(map(lambda f: '`%s`=?' % (mappings.get(f).name or f), fields)), primaryKey)
    156. attrs['__delete__'] = 'delete from `%s` where `%s`=?' % (tableName, primaryKey)
    157. return type.__new__(cls, name, bases, attrs)
    158. 这样,任何继承自Model的类(比如User),会自动通过ModelMetaclass扫描映射关系,并存储到自身的类属性如__table____mappings__中。
    159. 然后,我们往Model类添加class方法,就可以让所有子类调用class方法:
    160. class Model(dict):
    161. ...
    162. @classmethod
    163. @asyncio.coroutine
    164. def find(cls, pk):
    165. ' find object by primary key. '
    166. rs = yield from select('%s where `%s`=?' % (cls.__select__, cls.__primary_key__), [pk], 1)
    167. if len(rs) == 0:
    168. return None
    169. return cls(**rs[0])
    170. User类现在就可以通过类方法实现主键查找:
    171. user = yield from User.find('123')
    172. Model类添加实例方法,就可以让所有子类调用实例方法:
    173. class Model(dict):
    174. ...
    175. @asyncio.coroutine
    176. def save(self):
    177. args = list(map(self.getValueOrDefault, self.__fields__))
    178. args.append(self.getValueOrDefault(self.__primary_key__))
    179. rows = yield from execute(self.__insert__, args)
    180. if rows != 1:
    181. logging.warn('failed to insert record: affected rows: %s' % rows)
    182. 这样,就可以把一个User实例存入数据库:
    183. user = User(id=123, name='Michael')
    184. yield from user.save()
    185. 最后一步是完善ORM,对于查找,我们可以实现以下方法:
    186. findAll() - 根据WHERE条件查找;
    187. findNumber() - 根据WHERE条件查找,但返回的是整数,适用于select count(*)类型的SQL
    188. 以及update()和remove()方法。
    189. 所有这些方法都必须用@asyncio.coroutine装饰,变成一个协程。
    190. 调用时需要特别注意:
    191. user.save()
    192. 没有任何效果,因为调用save()仅仅是创建了一个协程,并没有执行它。一定要用:
    193. yield from user.save()
    194. 才真正执行了INSERT操作。
    195. 最后看看我们实现的ORM模块一共多少行代码?累计不到300多行。用Python写一个ORM是不是很容易呢?
    196. 参考源码
    197. day-03