一、前言

Celery是一个基于python开发的分布式任务队列,如果不了解请阅读笔者上一篇博文Celery入门与进阶,而做python WEB开发最为流行的框架莫属Django,但是Django的请求处理过程都是同步的无法实现异步任务,若要实现异步任务处理需要通过其他方式(前端的一般解决方案是ajax操作),而后台Celery就是不错的选择。倘若一个用户在执行某些操作需要等待很久才返回,这大大降低了网站的吞吐量。下面将描述Django的请求处理大致流程(图片来源于网络):

django-芹菜 - 图1

请求过程简单说明:浏览器发起请求—>请求处理—>请求经过中间件—>路由映射—>视图处理业务逻辑—>响应请求(template或response)

二、配置使用

celery很容易集成到Django框架中,当然如果想要实现定时任务的话还需要安装django-celery-beta插件,后面会说明。需要注意的是Celery4.0只支持Django版本>=1.8的,如果是小于1.8版本需要使用Celery3.1。

配置

新建立项目taskproj,目录结构(每个app下多了个tasks文件,用于定义任务):

  1. taskproj
  2. ├── app01
  3. ├── __init__.py
  4. ├── apps.py
  5. ├── migrations
  6. └── __init__.py
  7. ├── models.py
  8. ├── tasks.py
  9. └── views.py
  10. ├── manage.py
  11. ├── taskproj
  12. ├── __init__.py
  13. ├── settings.py
  14. ├── urls.py
  15. └── wsgi.py
  16. └── templates

在项目目录taskproj/taskproj/目录下新建celery.py:

  1. #!/usr/bin/env python3
  2. # -*- coding:utf-8 -*-
  3. # Author:wd
  4. from __future__ import absolute_import, unicode_literals
  5. import os
  6. from celery import Celery
  7. os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'taskproj.settings') # 设置django环境
  8. app = Celery('taskproj')
  9. app.config_from_object('django.conf:settings', namespace='CELERY') # 使用CELERY_ 作为前缀,在settings中写配置
  10. app.autodiscover_tasks() # 发现任务文件每个app下的task.py

taskproj/taskproj/init.py:

  1. from __future__ import absolute_import, unicode_literals
  2. from .celery import app as celery_app
  3. __all__ = ['celery_app']

taskproj/taskproj/settings.py

  1. CELERY_BROKER_URL = 'redis://10.1.210.69:6379/0' # Broker配置,使用Redis作为消息中间件
  2. CELERY_RESULT_BACKEND = 'redis://10.1.210.69:6379/0' # BACKEND配置,这里使用redis
  3. CELERY_RESULT_SERIALIZER = 'json' # 结果序列化方案

进入项目的taskproj目录启动worker:

  1. celery worker -A taskproj -l debug

定义与触发任务

任务定义在每个tasks文件中,app01/tasks.py:

  1. from __future__ import absolute_import, unicode_literals
  2. from celery import shared_task
  3. @shared_task
  4. def add(x, y):
  5. return x + y
  6. @shared_task
  7. def mul(x, y):
  8. return x * y

视图中触发任务

  1. from django.http import JsonResponse
  2. from app01 import tasks
  3. # Create your views here.
  4. def index(request,*args,**kwargs):
  5. res=tasks.add.delay(1,3)
  6. #任务逻辑
  7. return JsonResponse({'status':'successful','task_id':res.task_id})

访问http://127.0.0.1:8000/index

django-芹菜 - 图2

若想获取任务结果,可以通过task_id使用AsyncResult获取结果,还可以直接通过backend获取:

django-芹菜 - 图3

扩展

除了redis、rabbitmq能做结果存储外,还可以使用Django的orm作为结果存储,当然需要安装依赖插件,这样的好处在于我们可以直接通过django的数据查看到任务状态,同时为可以制定更多的操作,下面介绍如何使用orm作为结果存储。

1.安装

  1. pip install django-celery-results

2.配置settings.py,注册app

  1. INSTALLED_APPS = (
  2. ...,
  3. 'django_celery_results',
  4. )

4.修改backend配置,将redis改为django-db

  1. #CELERY_RESULT_BACKEND = 'redis://10.1.210.69:6379/0' # BACKEND配置,这里使用redis
  2. CELERY_RESULT_BACKEND = 'django-db' #使用django orm 作为结果存储

5.修改数据库

  1. python3 manage.py migrate django_celery_results

此时会看到数据库会多创建:

django-芹菜 - 图4 当然你有时候需要对task表进行操作,以下源码的表结构定义:

  1. class TaskResult(models.Model):
  2. """Task result/status."""
  3. task_id = models.CharField(_('task id'), max_length=255, unique=True)
  4. task_name = models.CharField(_('task name'), null=True, max_length=255)
  5. task_args = models.TextField(_('task arguments'), null=True)
  6. task_kwargs = models.TextField(_('task kwargs'), null=True)
  7. status = models.CharField(_('state'), max_length=50,
  8. default=states.PENDING,
  9. choices=TASK_STATE_CHOICES
  10. )
  11. content_type = models.CharField(_('content type'), max_length=128)
  12. content_encoding = models.CharField(_('content encoding'), max_length=64)
  13. result = models.TextField(null=True, default=None, editable=False)
  14. date_done = models.DateTimeField(_('done at'), auto_now=True)
  15. traceback = models.TextField(_('traceback'), blank=True, null=True)
  16. hidden = models.BooleanField(editable=False, default=False, db_index=True)
  17. meta = models.TextField(null=True, default=None, editable=False)
  18. objects = managers.TaskResultManager()
  19. class Meta:
  20. """Table information."""
  21. ordering = ['-date_done']
  22. verbose_name = _('task result')
  23. verbose_name_plural = _('task results')
  24. def as_dict(self):
  25. return {
  26. 'task_id': self.task_id,
  27. 'task_name': self.task_name,
  28. 'task_args': self.task_args,
  29. 'task_kwargs': self.task_kwargs,
  30. 'status': self.status,
  31. 'result': self.result,
  32. 'date_done': self.date_done,
  33. 'traceback': self.traceback,
  34. 'meta': self.meta,
  35. }
  36. def __str__(self):
  37. return '<Task: {0.task_id} ({0.status})>'.format(self)

三、Django中使用定时任务

如果想要在django中使用定时任务功能同样是靠beat完成任务发送功能,当在Django中使用定时任务时,需要安装django-celery-beat插件。以下将介绍使用过程。

安装配置

1.beat插件安装

  1. pip3 install django-celery-beat

2.注册APP

  1. INSTALLED_APPS = [
  2. ....
  3. 'django_celery_beat',
  4. ]

3.数据库变更

  1. python3 manage.py migrate django_celery_beat

4.分别启动woker和beta

  1. celery -A proj beat -l info --scheduler django_celery_beat.schedulers:DatabaseScheduler #启动beta 调度器使用数据库
  2. celery worker -A taskproj -l info #启动woker

5.配置admin

urls.py

  1. # urls.py
  2. from django.conf.urls import url
  3. from django.contrib import admin
  4. urlpatterns = [
  5. url(r'^admin/', admin.site.urls),
  6. ]

6.创建用户

  1. python3 manage.py createsuperuser

7.登录admin进行管理(地址http://127.0.0.1:8000/admin)并且还可以看到我们上次使用orm作为结果存储的表。

http://127.0.0.1:8000/admin/login/?next=/admin/

django-芹菜 - 图5

使用示例:

django-芹菜 - 图6

django-芹菜 - 图7

查看结果:

django-芹菜 - 图8

二次开发

django-celery-beat插件本质上是对数据库表变化检查,一旦有数据库表改变,调度器重新读取任务进行调度,所以如果想自己定制的任务页面,只需要操作beat插件的四张表就可以了。当然你还可以自己定义调度器,django-celery-beat插件已经内置了model,只需要进行导入便可进行orm操作,以下我用django reset api进行示例:

settings.py

  1. INSTALLED_APPS = [
  2. 'django.contrib.admin',
  3. 'django.contrib.auth',
  4. 'django.contrib.contenttypes',
  5. 'django.contrib.sessions',
  6. 'django.contrib.messages',
  7. 'django.contrib.staticfiles',
  8. 'app01.apps.App01Config',
  9. 'django_celery_results',
  10. 'django_celery_beat',
  11. 'rest_framework',
  12. ]

urls.py

  1. urlpatterns = [
  2. url(r'^admin/', admin.site.urls),
  3. url(r'^index$', views.index),
  4. url(r'^res$', views.get_res),
  5. url(r'^tasks$', views.TaskView.as_view({'get':'list'})),
  6. ]

views.py

  1. from django_celery_beat.models import PeriodicTask #倒入插件model
  2. from rest_framework import serializers
  3. from rest_framework import pagination
  4. from rest_framework.viewsets import ModelViewSet
  5. class Userserializer(serializers.ModelSerializer):
  6. class Meta:
  7. model = PeriodicTask
  8. fields = '__all__'
  9. class Mypagination(pagination.PageNumberPagination):
  10. """自定义分页"""
  11. page_size=2
  12. page_query_param = 'p'
  13. page_size_query_param='size'
  14. max_page_size=4
  15. class TaskView(ModelViewSet):
  16. queryset = PeriodicTask.objects.all()
  17. serializer_class = Userserializer
  18. permission_classes = []
  19. pagination_class = Mypagination

访问http://127.0.0.1:8000/tasks如下:

django-芹菜 - 图9