一文搞懂Django数据库查询操作

vlambda
2020-04-02

一文搞懂Django数据库查询操作

本文略长,读完约需十分钟。当做复习笔记效果更佳。

查询操作：

数据查询是数据库操作中一个非常重要的技术。查询一般就是使用filter、exclude以及get三个方法来实现。我们可以在调用这些方法的时候传递不同的参数来实现查询需求。在ORM层面，这些查询条件都是使用field+__+condition的方式来使用的。以下将那些常用的查询条件来一一解释。

1.exact：在底层会被翻译成=。使用精确的=进行查找。如果提供的是一个None，那么在SQL层面就是被解释为NULL。示例代码如下：

article = Article.objects.get(id__exact=14)
article = Article.objects.get(id__exact=None)

以上的两个查找在翻译为SQL语句为如下：

select ... from article where id=14;
select ... from article where id IS NULL;

2.iexact：在底层会被翻译成LIKE。示例代码如下：

article = Article.objects.filter(title__iexact='hello world')

那么以上的查询就等价于以下的SQL语句：

select ... from article where title like 'hello world';

注意上面这个sql语句，因为在MySQL中，没有一个叫做ilike的。所以exact和iexact的区别实际上就是LIKE和=的区别，在大部分collation=utf8_general_ci情况下都是一样的（collation是用来对字符串比较的）。

注意：

1.LIKE和=：大部分情况下都是等价的，只有少数情况下是不等价的。

2.exict和iexact：他们的区别其实就是LIKE和=的区别，因为exact会被翻译成=，而iexact会被翻译成LIKE。

3.因为field__exact=xxx其实等价于filed=xxx，因此我们直接使用filed=xxx就可以了，并且因为大部分情况exact和iexact又是等价的，因此我们以后直接使用field=xxx就可以了。

QuerySet.query：query可以用来查看这个ORM查询语句最终被翻译成的SQL语句。但是query只能被用在QuerySet对象上，不能用在普通的ORM模型上。因此如果你的查询语句是通过get来获取数据的，那么就不能使用query，因为get返回的是满足条件的ORM模型，而不是QuerySet。如果你是通过filter等其他返回QuerySet的方法查询的，那么就可以使用query。
contains：使用大小写敏感的判断，某个字符串是否在指定的字段中。这个判断条件会使用大小敏感，因此在被翻译成SQL语句的时候，会使用like binary，而like binary就是使用大小写敏感的。
icontains：使用大小写不敏感的判断，某个字符串是否被包含在指定的字段中。这个查询语句在被翻译成SQL的时候，使用的是like，而like在MySQL层面就是不区分大小写的。
contains和icontains：在被翻译成SQL的时候使用的是%hello%，就是只要整个字符串中出现了hello都能过够被找到，而iexact没有百分号，那么意味着只有完全相等的时候才会被匹配到。
in：可以直接指定某个字段的是否在某个集合中。示例代码如下：

articles = Article.objects.filter(id__in=[1,2,3])

也可以通过其他的表的字段来判断是否在某个集合中。示例代码如下：

categories = Category.objects.filter(article__id__in=[1,2,3])

如果要判断相关联的表的字段，那么也是通过__来连接。并且在做关联查询的时候，不需要写models_set，直接使用模型的名字的小写化就可以了。比如通过分类去查找相应的文章，那么通过article__id__in就可以了，而不是写成article_set__id__in的形式。当然如果你不想使用默认的形式，可以在外键定义的时候传递related_query_name来指定反向查询的名字。示例代码如下：

class Category(models.Model):
	name = models.CharField(max_length=100)

	class Meta:
		db_table = 'category'


class Article(models.Model):
	title = models.CharField(max_length=200)
	content = models.TextField()
	cateogry = models.ForeignKey("Category",on_delete=models.CASCADE,null=True,related_query_name='articles')

	class Meta:
		db_table = 'article'

因为在cateogry的ForeignKey中指定了related_query_name为articles，因此你不能再使用article来进行反向查询了。这时候就需要通过articles__id__in来进行反向查询。

反向查询是将模型名字小写化。比如article__in。可以通过related_query_name来指定自己的方式，而不使用默认的方式。反向引用是将模型名字小写化，然后再加上_set，比如article_set，可以通过related_name来指定自己的方式，而不是用默认的方式。

并且，如果在做反向查询的时候，如果查询的字段就是模型的主键，那么可以省略掉这个字段，直接写成article__in就可以了，不需要这个id了。

in不仅仅可以指定列表/元组，还可以为QuerySet。比如要查询“文章标题中包含有hello的所有分类”，那么可以通过以下代码来实现：

articles = Article.objects.filter(title__icontains='hello')
categories = Category.objects.filter(articles__in=articles)
for cateogry in categories:
	print(cateogry)

8.gt、gte、lt、lte：代表的是大于、大于等于、小于、小于等于的条件。示例代码如下：

articles = Article.objects.filter(id__lte=3)

9.startswith、istartswith、endswith、iendswith：表示以某个值开始，不区分大小写的以某个值开始、以某个值结束、不区分大小写的以某个值结束。示例代码如下：

articles = Article.objects.filter(title__endswith="hello")

10.关于时间的查询条件：

range：可以指定一个时间段。并且时间应该标记为 aware时间，不然django会报警告。示例代码如下：

start_time = make_aware(datetime(year=2020,month=4,day=4,hour=17,minute=0,second=0))
end_time = make_aware(datetime(year=2020,month=4,day=4,hour=18,minute=0,second=0))
articles = Article.objects.filter(create_time__range=(start_time,end_time))
print(articles.query)
print(articles)

date：用年月日来进行过滤。如果想要使用这个过滤条件，那么前提必须要在 MySQL中添加好那些时区文件。如何添加呢？参考教案。示例代码如下：

articles = Article.objects.filter(create_time__date=datetime(year=2020,month=4,day=4))

year/month/day：表示根据 年/月/日进行查找。示例代码如下：

articles = Article.objects.filter(create_time__year__gte=2020)

week_day：根据星期来进行查找。1表示星期天，7表示星期六，2-6代表的是星期一到星期五。比如要查找星期三的所有文章，那么可以通过以下代码来实现：

articles = Article.objects.filter(create_time__week_day=4)

time：根据分时秒来进行查找。如果要具体到秒，一般比较难匹配到，可以使用区间的方式来进行查找。区间使用 range条件。比如想要获取17时/10分/27-28秒之间的文章，那么可以通过以下代码来实现：

start_time = time(hour=17,minute=10,second=27)
end_time = time(hour=17,minute=10,second=28)
articles = Article.objects.filter(create_time__time__range=(start_time,end_time))

聚合函数：

如果你用原生SQL，则可以使用聚合函数来提取数据。比如提取某个商品销售的数量，那么可以使用Count，如果想要知道商品销售的平均价格，那么可以使用Avg。聚合函数是通过aggregate方法来实现的。1.所有的聚合函数都是放在django.db.models下面。2.聚合函数不能够单独的执行，需要放在一些可以执行聚合函数的方法下面中去执行。比如aggregate。示例代码如下：

result = Book.objects.aggregate(Avg("price"))

3.聚合函数执行完成后，给这个聚合函数的值取个名字。取名字的规则，默认是filed+__+聚合函数名字形成的。比如以上代码形成的名字叫做price__avg。如果不想使用默认的名字，那么可以在使用聚合函数的时候传递关键字参数进去，参数的名字就是聚合函数执行完成的名字。实示例代码如下：

result = Book.objects.aggregate(avg=Avg("price"))

以上传递了关键字参数avg=Avg("price")，那么以后Avg聚合函数执行完成的名字就叫做avg。4.aggregate：这个方法不会返回一个QuerySet对象，而是返回一个字典。这个字典中的key就是聚合函数的名字，值就是聚合函数执行后的结果。5.aggregate和annotate的相同和不同：

相同：这两个方法都可以执行聚合函数。

不同：

aggregate 返回的是一个字典，在这个字典中存储的是这个聚合函数执行的结果。而 annotate 返回的是一个 QuerySet 对象，并且会在查找的模型上添加一个聚合函数的属性。
aggregate不会做分组，而 annotate会使用 group by子句进行分组，只有调用了 group by子句，才能对每一条数据求聚合函数的值。

6.Count：用来求某个数据的个数。比如要求所有图书的数量，那么可以使用以下代码：

result = Book.objects.aggregate(book_nums=Count("id"))

并且Count可以传递distinct=True参数，用来剔除那些重复的值，只保留一个。比如要获取作者表中，不同邮箱的个数，那么这时候可以使用distinct=True。示例代码如下：

result = Author.objects.aggregate(email_nums=Count('email',distinct=True))

7.Max和Min：求指定字段的最大值和最小值。示例代码如下：

result = Author.objects.aggregate(max=Max("age"),min=Min("age"))

8.Sum：求某个字段值的总和。示例代码如下：

result = BookOrder.objects.aggregate(total=Sum('price'))

aggregate和annotate方法可以在任何的QuerySet对象上调用。因此只要是返回了QuerySet对象，那么就可以进行链式调用。比如要获取2018年度的销售总额，那么可以先过滤年份，再求聚合函数。示例代码如下：

BookOrder.objects.filter(create_time__year=2020).aggregate(total=Sum('price'))

7.F表达式：动态的获取某个字段上的值。并且这个F表达式，不会真正的去数据库中查询数据，他相当于只是起一个标识的作用。比如想要将原来每本图书的价格都在原来的基础之上增加10元，那么可以使用以下代码来实现：

from django.db.models import F
Book.objects.update(price=F("price")+10)

8.Q表达式：使用Q表达式包裹查询条件，可以在条件之间进行多种操作。与/或非等，从而实现一些复杂的查询操作。例子如下：

查找价格大于100，并且评分达到4.85以上的图书：

# 不使用Q表达式的
books = Book.objects.filter(price__gte=100,rating__gte=4.85)
# 使用Q表达式的
books = Book.objects.filter(Q(price__gte=100)&Q(rating__gte=4.85))

查找价格低于100元，或者评分低于4分的图书：

books = Book.objects.filter(Q(price__gte=100)&Q(rating__gte=4.85))

获取价格大于100，并且图书名字中不包含”传“字的图书：

books = Book.objects.filter(Q(price__gte=100)&~Q(name__icontains='传'))

vlambda博客
学习文章列表