第 10 篇 数据排序
《MySQL 入门教程》第 10 篇 数据排序
默认情况下,SELECT
语句不会对返回的结果进行排序,意味着查询结果的显示顺序是不确定的。如果想要将结果按照某种规则进行排序,例如按照入职先后顺序显示员工的信息,可以使用ORDER BY
子句。
10.1 基于单个字段排序
按照单个字段的值进行排序称为单列排序。单列排序的语法如下:
SELECT col1, col2, ...
FROM table_name
[WHERE conditions]
ORDER BY col1 [ASC | DESC];
其中,ORDER BY
用于指定排序的字段;ASC
表示升序排序(Ascending),DESC
表示降序排序(Descending),默认值为升序排序。
例如,以下查询按照员工的入职先后顺序进行排序显示:
select emp_name, hire_date
from employee
order by hire_date;
emp_name|hire_date |
---------|----------|
关羽 |2000-01-01|
张飞 |2000-01-01|
刘备 |2000-01-01|
孙尚香 |2002-08-08|
孙丫鬟 |2002-08-08|
赵云 |2005-12-19|
...
对于升序排序,数字按照从小到大的顺序排列,字符按照编码的顺序排列,日期时间按照从早到晚的顺序排列;降序排序正好相反。
在上面的查询结果中,入职日期为 2000-01-01 的员工有 3 位。那么他们谁排在前面,谁排在后面呢?答案是不确定。如果要解决这个问题,需要使用多列排序。
10.2 基于多个字段排序
多列排序是指基于多个字段的值排序,多个字段使用逗号进行分隔。多列排序的语法如下:
SELECT col1, col2, ...
FROM table_name
[WHERE conditions]
ORDER BY col1 [ASC | DESC], col2 [ASC | DESC], ...;
执行过程中,先基于第一个字段进行排序;对于第一个字段排序相同的数据,再基于第二个字段进行排序;依此类推。
例如,以下语句查询行政管理部(dept_id = 1)的员工信息;按照入职先后进行排序,入职日期相同再按照月薪从高到低排序:
select emp_name, sex, hire_date, salary
from employee
where dept_id = 1
order by hire_date asc, salary desc;
emp_name|sex |hire_date |salary |
---------|----|----------|--------|
刘备 |男 |2000-01-01|30000.00|
关羽 |男 |2000-01-01|26000.00|
张飞 |男 |2000-01-01|24000.00|
10.3 基于表达式排序
除了使用字段的值进行排序之外,也可以基于表达式的结果进行排序。例如,以下语句按照年度总收入(年薪加奖金)进行排序:
select emp_name, salary, bonus, salary * 12 + ifnull(bonus, 0) as total_income
from employee
order by total_income;
emp_name|salary |bonus |salary * 12 + ifnull(bonus, 0)|
emp_name|salary |bonus |total_income|
---------|--------|--------|------------|
邓芝 | 4000.00| | 48000.00|
蒋琬 | 4000.00| 1500.00| 49500.00|
黄权 | 4200.00| | 50400.00|
庞统 | 4100.00| 2000.00| 51200.00|
糜竺 | 4300.00| | 51600.00|
孙乾 | 4700.00| | 56400.00|
...
其中,ifnull(bonus, 0) 函数用于将 bonus 为空的数据转换为 0;该函数将会在后续文章中进行介绍。
另外,在指定排序字段时,除了使用字段名或者表达式之外,也可以使用它们在查询列表中出现的数字编号顺序。上面的示例可以改写如下:
select emp_name, salary, bonus, salary * 12 + ifnull(bonus, 0) as total_income
from employee
order by 4;
在查询列表中,total_income 是返回的第 4 个字段;因此该语句也是按照年度总收入从低到高进行排序。
10.4 空值排序
空值(NULL)在 SQL 中表示未知或者缺失的值。如果排序的字段中存在空值时,结果会怎么样呢?以下语句按照奖金从高到低进行排序:
select emp_name, bonus
from employee
where dept_id = 3
order by bonus desc;
emp_name|bonus |
----------|-------|
孙尚香 |5000.00|
孙丫鬟 | |
从查询结果可以看到,空值排在了最后。也就是说,MySQL 认为空值最小,升序时排在最前,降序时排在最后。
如果想要调整空值的排序位置,可以使用函数(例如 ifnull)将空值转换为一个指定的值。例如,以下语句将奖金为空的数据转换为 0:
select emp_name, ifnull(bonus, 0) as bonus
from employee
where dept_id = 3
order by ifnull(bonus, 0);
emp_name|bonus |
----------|-------|
孙丫鬟 | 0.00|
孙尚香 |5000.00|
10.5 中文排序
我们可以为数据库、表或者字段指定一个字符集(Charset)和排序规则(Collation)。字符集决定了能够存储哪些字符,比如 ASCII 字符集只能存储简单的英文、数字和一些控制字符;GB2312 字符集可以存储中文;Unicode 字符集能够支持世界上的各种语言。
排序规则定义了字符集中字符的排序顺序,包括是否区分大小写,是否区分重音等。对于中文而言,排序方式与英文有所不同;中文通常需要按照拼音、偏旁部首或者笔画进行排序。
MySQL 8.0 默认使用 utf8mb4 字符编码,默认的排序规则为 utf8mb4_0900_ai_ci,对于中文按照偏旁部首进行排序。以下语句按照员工的姓名进行排序:
select emp_name, email
from employee
where dept_id = 5
order by emp_name;
emp_name|email |
---------|--------------------|
孙乾 |sunqian@shuguo.net |
庞统 |pangtong@shuguo.com |
法正 |fazheng@shuguo.com |
简雍 |jianyong@shuguo.com |
糜竺 |mizhu@shuguo.com |
蒋琬 |jiangwan@shuguo.com |
邓芝 |dengzhi@shuguo.com |
黄权 |huangquan@shuguo.com|
如果想要按照拼音进行排序,可以指定排序规则。例如:
select emp_name, email
from employee
where dept_id = 5
order by emp_name collate 'utf8mb4_zh_0900_as_cs';
emp_name|email |
---------|--------------------|
邓芝 |dengzhi@shuguo.com |
法正 |fazheng@shuguo.com |
黄权 |huangquan@shuguo.com|
简雍 |jianyong@shuguo.com |
蒋琬 |jiangwan@shuguo.com |
糜竺 |mizhu@shuguo.com |
庞统 |pangtong@shuguo.com |
孙乾 |sunqian@shuguo.net |
按照拼音进行排序的另一种方法就是将数据转换为其他字符集。例如 gbk:
select emp_name, email
from employee
where dept_id = 5
order by convert(emp_name using gbk);
emp_name|email |
---------|--------------------|
邓芝 |dengzhi@shuguo.com |
法正 |fazheng@shuguo.com |
黄权 |huangquan@shuguo.com|
简雍 |jianyong@shuguo.com |
蒋琬 |jiangwan@shuguo.com |
糜竺 |mizhu@shuguo.com |
庞统 |pangtong@shuguo.com |
孙乾 |sunqian@shuguo.net |
CONVERT 是一个函数,用于转换数据的字符集编码;这里是中文 GBK 字符集,默认使用拼音排序。当然,我们也可以在创建数据库或者表(字段)时指定支持中文排序的排序规则,查询时就不需要再做任何操作了。
10.6 自定义排序
自定义排序可以按照我们预先定义好的特定顺序进行排序,关键在于如何定义每个数据的顺序。例如,以下查询通过 field() 函数实现自定义的排序:
select emp_name, field(emp_name, '刘备','关羽','张飞') as num
from employee
where dept_id = 1
order by field(emp_name, '刘备','关羽','张飞');
emp_name|num|
---------|---|
刘备 | 1|
关羽 | 2|
张飞 | 3|
通过查询结果可以看出,field(str,str1,str2,str3,...) 函数返回了 str 在后续列表中的下标位置,没有匹配到数据时返回 0。以上示例实际上相当于将“刘备”编号为 1,“关羽”编号为 2,“张飞”编号为 3。
除了 field() 函数之外,我们还可以通过 CASE 表达式实现类似的转换逻辑,在后续文章中会介绍 CASE 表达式的作用。
另一种实现自定义排序的方法就是在表中增加一个额外的排序字段,为数据设置不同的数字,然后通过这个字段进行排序。例如,应用程序中的菜单就可以通过这种方式进行排序显示。