MySQL 必知必会 --[英] Ben Forta
🏷️ MySQL
本书使用的表结构及数据可以在 https://forta.com/books/0672327120/ 上下载到。
第 1 章 了解 SQL
1.1 数据库基础
1.1.1 什么是数据库
数据库是以某种有组织的方式存储的数据集合。
人们通常用数据库这个术语来代表他们使用的数据库软件。这是不正确的,它是引起混淆的根源。确切地说,数据库软件应该称为DMBS(数据库管理系统)。
1.1.2 表
表 table :某种特定类型数据的结构化清单。
模式 schema :关于数据库和表的布局及特性的信息。1.1.3 列和数据类型
列 column :表中的一个字段。所有表都是由一个或多个列组成的。
数据类型 datatype :所容许的数据的类型。每个表列都有相应的数据类型,它限制(或容许)该列中储存的数据。1.1.4 行
行 row :表中的一个记录。
是记录( record )还是行( row )?从技术上来说,行才是正确的术语。
1.1.5 主键
主键 primary key :一列(或一组列),其值能够唯一区分表中的每个行。
应该总是定义主键。主键的最好习惯:
- 不更新主键列中的值
- 不重用主键列的值
- 不在主键列中使用可能会更改的值
1.2 什么是 SQL
SQL 是结构化查询语言(Structured Query Language)的缩写。
SQL 优点:
- SQL 不是某个特定数据库供应商专有的语言。几乎所有重要的 DBMS 都支持 SQL。
- SQL 简单易学。
- SQL 尽管看上去很简单,但它实际上是一种强有力的语言,灵活使用其语法元素,可以进行非常复杂和高级的数据库操作。
SQL 不是一种专利语言,而且存在一个标准委员会,他们试图定义可供所有 DBMS 使用的 SQL 语法,但事实上任意两个 DBMS 实现的 SQL 都不完全相同。
第 2 章 MySQL 简介
2.1 什么是 MySQL
MySQL 是一种 DBMS,即它是一种数据库软件。
MySQL 是开发源代码的,一般可以免费使用(甚至可以免费修改)。
2.1.1 客户机 - 服务器软件
DBMS 可以分为两类:
- 基于共享文件系统的 DBMS
- 基于客户机 - 服务器的 DBMS
MySQL、Oracle 以及 Microsoft SQL Server 等数据库是基于客户机 - 服务器的数据库。
2.1.2 MySQL 版本
JiaJia: 这本书英文版是 2009 年出版的,当时最新版是 5,现在最新版已经到 8 了。
2.2 MySQL 工具
- 2.2.1 mysql 命令行实用程序
每个 MySQL 安装都有一个名为 mysql 的简单命令行使用程序。 - 2.2.2 MySQL Administrator
MySQL 管理器是一个图形交互客户机,用来简化 MySQL 服务器的管理。
MySQL Administrator 需要额外下载安装。 - 2.2.3 MySQL Query Browser
MySQL Query Browser 是一个图形交互客户机,用来编写和执行 MySQL 命令。
第 3 章 使用 MySQL
3.1 连接
为了连接到 MySQL,需要提供以下信息:
- 主机名
- 端口(默认为 3306)
- 用户名
- 用户口令(如果需要)
3.2 选择数据
use [数据库名];
3.3 了解数据库和表
返回所有可用的数据库:
show databases;
获取一个数据库内的表的列表:
show tables;
显示表的字段信息:
show columns from [表名];
或者
describe [表名];
显示更详细的服务器状态信息:
show status;
显示创建数据库的语句:
show create database [数据库名];
显示创建表的语句:
show create table [表名];
显示授予当前登录用户的权限:
show grants;
显示服务器错误或警告信息:
show errors;
show warnings;
2
显示允许的 show 语句:
help 'show';
JiaJia:书中的写法是 help show;
,不带单引号,但是在 Navicat 中会报错,加上单引号就可以正常执行了。
执行结果如下(MySQL 版本: 5.7.30-0ubuntu0.16.04.1):
SHOW has many forms that provide information about databases, tables,
columns, or status information about the server. This section describes
those following:
SHOW {binary | MASTER} LOGS
SHOW BINLOG EVENTS [in 'log_name'] [from pos] [limit [offset,] row_count]
SHOW CHARACTER SET [like_or_where]
SHOW COLLATION [like_or_where]
SHOW [FULL] COLUMNS from tbl_name [from db_name] [like_or_where]
SHOW CREATE DATABASE db_name
SHOW CREATE EVENT event_name
SHOW CREATE FUNCTION func_name
SHOW CREATE PROCEDURE proc_name
SHOW create table tbl_name
SHOW CREATE TRIGGER trigger_name
SHOW CREATE VIEW view_name
SHOW DATABASES [like_or_where]
SHOW engine engine_name {STATUS | MUTEX}
SHOW [STORAGE] ENGINES
SHOW ERRORS [limit [offset,] row_count]
SHOW EVENTS
SHOW FUNCTION CODE func_name
SHOW FUNCTION STATUS [like_or_where]
SHOW GRANTS FOR user
SHOW INDEX from tbl_name [from db_name]
SHOW MASTER STATUS
SHOW OPEN TABLES [from db_name] [like_or_where]
SHOW PLUGINS
SHOW PROCEDURE CODE proc_name
SHOW PROCEDURE STATUS [like_or_where]
SHOW PRIVILEGES
SHOW [FULL] PROCESSLIST
SHOW PROFILE [types] [FOR QUERY n] [OFFSET n] [limit n]
SHOW PROFILES
SHOW RELAYLOG EVENTS [in 'log_name'] [from pos] [limit [offset,] row_count]
SHOW SLAVE HOSTS
SHOW SLAVE STATUS [FOR CHANNEL channel]
SHOW [GLOBAL | SESSION] STATUS [like_or_where]
SHOW TABLE STATUS [from db_name] [like_or_where]
SHOW [FULL] TABLES [from db_name] [like_or_where]
SHOW TRIGGERS [from db_name] [like_or_where]
SHOW [GLOBAL | SESSION] VARIABLES [like_or_where]
SHOW WARNINGS [limit [offset,] row_count]
like_or_where:
LIKE 'pattern'
| WHERE expr
If the syntax for a given SHOW statement includes a LIKE 'pattern'
part, 'pattern' is a string that can contain the SQL % and _ wildcard
characters. The pattern is useful for restricting statement output to
matching values.
Several SHOW statements also accept a WHERE clause that provides more
flexibility in specifying which rows to display. See
https://dev.mysql.com/doc/refman/5.7/en/extended-show.html.
URL: https://dev.mysql.com/doc/refman/5.7/en/show.html
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
第 4 章 检索数据
4.1 SELECT 语句
4.2 检索单个列
select prod_name
from products;
2
4.3 检索多个列
select prod_id, prod_name, prod_price
from products;
2
4.4 检索所有列
select *
from products;
2
检索不需要的列通常会降低检索和应用程序的性能。
4.5 检索不同的行
select distinct vend_id
from products;
2
4.6 限制结果
select prod_name
from products
limit 5;
2
3
检索出来的第一行为 行 0 而不是 行 1。
select prod_name
from products
limit 5, 5;
2
3
第一个数为开始的位置,第二个数为要检索的行数。
为了避免两个数字的混淆,MySQL 5 开始提供了另外一种写法:
select prod_name
from products
limit 5 offset 5;
2
3
4.7 使用完全限定的表名
select products.prod_name
from products;
2
第 5 章 排序检索数据
5.1 排序数据
select prod_name
from products
order by prod_name;
2
3
5.2 按多个列排序
select prod_id, prod_price, prod_name
from products
order by prod_price, prod_name;
2
3
5.3 指定排序方向
select prod_id, prod_price, prod_name
from products
order by prod_price desc;
2
3
select prod_id, prod_price, prod_name
from products
order by prod_price desc, prod_name;
2
3
第 6 章 过滤数据
6.1 使用 WHERE 子句
select prod_price, prod_name
from products
where prod_price = 2.50;
2
3
6.2 WHERE 子句操作符
操作符 | 说明 |
---|---|
= | 等于 |
<> | 不等于 |
!= | 不等于 |
< | 小于 |
<= | 小于等于 |
> | 大于 |
>= | 大于等于 |
between | 在指定的两个值之间 |
6.2.1 检查单个值
sqlselect prod_name, prod_price from products where prod_name = 'fuses';
1
2
3sqlselect prod_name, prod_price from products where prod_price < 10;
1
2
3sqlselect prod_name, prod_price from products where prod_price <= 10;
1
2
36.2.2 不匹配检查
sqlselect prod_name, prod_price from products where vend_id <> 1003;
1
2
3sqlselect prod_name, prod_price from products where vend_id != 1003;
1
2
36.2.3 范围值检查
sqlselect prod_name, prod_price from products where prod_price between 5 and 10;
1
2
36.2.4 空值检查
sqlselect cust_id from customers where cust_email is null;
1
2
3
第 7 章 数据过滤
7.1 组合 WHERE 子句
7.1.1 AND 操作符
sqlselect prod_id, prod_price, prod_name from products where vend_id = 1003 and prod_price <= 10;
1
2
37.1.2 OR 操作符
sqlselect prod_id, prod_price, prod_name from products where vend_id = 1002 or vend_id = 1003;
1
2
37.1.3 计算次序
sqlselect prod_id, prod_price, prod_name from products where vend_id = 1002 or vend_id = 1003 and prod_price >= 10;
1
2
3SQL(像多数语言一样)在处理
or
操作符前,优先处理and
sqlselect prod_id, prod_price, prod_name from products where (vend_id = 1002 or vend_id = 1003) and prod_price >= 10;
1
2
3
7.2 IN 操作符
select prod_name, prod_price
from products
where vend_id in (1002, 1003)
order by prod_name;
2
3
4
in
最大的优点是可以包含其它 select
语句。
7.3 NOT 操作符
select prod_name, prod_price
from products
where vend_id not in (1002, 1003)
order by prod_name;
2
3
4
第 8 章 用通配符进行过滤
8.1 LIKE 操作符
通配符(wildcard):用来匹配值的一部分的特殊字符。
搜索模式(search pattern):由字面值、通配符或两者组合构成的搜索条件。
8.1.1 百分号 (
%
) 通配符%
表示任何字符出现任意次数。sqlselect prod_id, prod_name from products where prod_name like 'jet%';
1
2
3根据 MySQL 的配置方式,搜索可以区分或者不区分大小写。
sqlselect prod_id, prod_name from products where prod_name like '%anvil%';
1
2
38.1.2 下划线 (
_
) 通配符_
只匹配单个字符。sqlselect prod_id, prod_name from products where prod_name like '_ ton anvil';
1
2
3
8.2 使用通配符的技巧
- 不要过度使用通配符。
- 在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
- 仔细注意通配符的位置。
第 9 章 用正则表达式进行搜索
9.1 正则表达式介绍
正则表达式是用来匹配文本的特殊的串(字符集合)。
9.2 使用 MySQL 正则表达式
MySQL 仅支持多数正则表达式实现的一个很小的子集。
9.2.1 基本字符匹配
sqlselect prod_name from products where prod_name regexp '1000' order by prod_name;
1
2
3
4sqlselect prod_name from products where prod_name regexp '.000' order by prod_name;
1
2
3
4使用
regexp
匹配不区分大小写,若需要区分,可使用binary
关键字:sqlselect prod_name from products where prod_name regexp binary 'JetPack .000' order by prod_name;
1
2
3
49.2.2 进行 OR 匹配
sqlselect prod_name from products where prod_name regexp '1000|2000' order by prod_name;
1
2
3
49.2.3 匹配几个字符之一
sqlselect prod_name from products where prod_name regexp '[123] Ton' order by prod_name;
1
2
3
4字符集合也可以被否定,在集合的开始处放置一个
^
即可。sqlselect prod_name from products where prod_name regexp '[^123] Ton' order by prod_name;
1
2
3
49.2.4 匹配范围
sqlselect prod_name from products where prod_name regexp '[1-5] Ton' order by prod_name;
1
2
3
49.2.5 匹配特殊字符
sqlselect vend_name from vendors where vend_name regexp '\\.' order by vend_name;
1
2
3
4\\
就是转义符,也可以用来引用元字符。\\f
:换页\\n
:换行\\r
:回车\\t
:制表\\v
:纵向制表
转义
\
本身需要使用\\\
。之所以要使用两个反斜杠是因为 MySQL 自己要解释一个,正则表达式解释另一个。
9.2.6 匹配字符类
字符类(character class)就是预定义的字符集。
[:alnum:]
:任意字母和数字(同[a-zA-Z0-9]
)[:alpha:]
:任意字符(同[a-zA-Z]
)[:blank:]
:空格和制表(同[\\t]
)[:cntrl:]
:ASCII 控制字符(ASCII 0 到 31 和 127)[:digit:]
:任意数字(同[0-9]
)[:graph:]
:与[:print:]
相同,但不包括空格[:lower:]
:任意小写字母(同[a-z]
)[:print:]
:任意可打印字符[:punct:]
:即不在[:alnum:]
又不在[:cntrl:]
中的任意字符[:space:]
:包括空格在内的任意空白字符(同[\\f\\n\\r\\t\\v]
)[:upper:]
:任意大写字母(同[A-Z]
)[:xdigit:]
:任意十六进制数字(同[a-fA-F0-9]
)
9.2.7 匹配多个实例
可以通过正则表达式重复元字符来完成。
*
:0 个或多个匹配+
:1 个或多个匹配(等于{1,}
)?
:0 个或 1 个匹配(等于{0,1}
){n}
:指定数目的匹配{n,}
:不少于指定数目的匹配{n,m}
:匹配数目的范围(m 不超过 255)
sqlselect prod_name from products where prod_name regexp '\\([0-9] sticks?\\)' order by prod_name;
1
2
3
4sqlselect prod_name from products where prod_name regexp '[[:digit:]]{4}' order by prod_name;z
1
2
3
49.2.8 定位符
为了匹配特定位置的文本,需要使用定位符。
^
:文本的开始$
:文本的结尾[[:<:]]
:词的开始[[:>:]]
:词的结尾
sqlselect prod_name from products where prod_name regexp '^[0-9\\.]' order by prod_name;
1
2
3
4
regexp
表达式总是返回 0(没有匹配)或者 1(匹配)。
可以通过这一点来验证表达式。
select 'hello' regexp '[0-9]';
第 10 章 创建计算字段
10.1 计算字段
计算字段是运行时在 select
语句内创建的。
字段(field) 基本上与列(column)的意思相同,经常互换使用,不过数据库列一般称为列,而术语字段通常用在计算字段的连接上。
10.2 拼接字段
拼接(concatenate) 将值联结到一起构成单个值。
select concat(vend_name, ' (', vend_country, ')')
from vendors
order by vend_name;
2
3
使用 rtrim()
函数来去除多余的空格:
select concat(rtrim(vend_name), ' (', rtrim(vend_country), ')')
from vendors
order by vend_name;
2
3
使用 as
关键字赋予别名(alias)
select concat(rtrim(vend_name), ' (', rtrim(vend_country), ')') as vend_title
from vendors
order by vend_name;
2
3
10.3 执行算术计算
select
prod_id,
quantity,
item_price,
quantity * item_price as expanded_price
from
orderitems
where
order_num = 20005
2
3
4
5
6
7
8
9
MySQL 算术操作符:
+
: 加-
: 减*
: 乘/
: 除
第 11 章 使用数据处理函数
11.1 函数
SQL 支持利用函数来处理数据。
函数没有 SQL 的可移植性强。
11.2 使用函数
11.2.1 文本处理函数
select
vend_name,
upper( vend_name ) as vend_name_upcase
from
vendors
order by
vend_name;
2
3
4
5
6
7
常用的文本处理函数:
函数 | 说明 |
---|---|
left() | 返回串左边的字符 |
length() | 返回串的长度 |
locate() | 找出串的一个子串 |
lower() | 将串转换为小写 |
ltrim() | 去掉串左边的空格 |
right() | 返回串右边的字符 |
rtrim() | 去掉串右边的空格 |
soundex() | 返回串的 soundex 值 |
substring() | 返回子串的字符 |
upper() | 将串转换为大写 |
soundex()
是一个将任意文本串转换为描述其语音表示的字母数字模式的算法。soundex()
考虑了类似的发音字符和音节,使得能对串进行发音比较而不是字母比较。
select
cust_name,
cust_contact
from
customers
where
soundex(cust_contact) = soundex('Y Lie');
2
3
4
5
6
7
cust_name | cust_contact |
---|---|
Coyote Inc. | Y Lee |
11.2.2 日期和时间处理函数
函数 | 说明 |
---|---|
adddate() | 增加一个日期(天、周等) |
addtime() | 增加一个时间(时、分等) |
curdate() | 返回当前日期 |
curtime() | 返回当前时间 |
date() | 返回日期时间的日期部分 |
datediff() | 计算两个日期之差 |
date_add() | 高度灵活的日期运算函数 |
date_format() | 返回一个格式化的日期或时间串 |
day() | 返回一个日期的天数部分 |
dayofweek() | 对于一个日期,返回对应的星期几 |
hour() | 返回一个时间的小时部分 |
minute() | 返回一个时间的分钟部分 |
month() | 返回一个日期的月份部分 |
now() | 返回当前日期和时间 |
second() | 返回一个时间的秒部分 |
time() | 返回一个日期时间的时间部分 |
year() | 返回一个日期的年份部分 |
日期必须为 yyyy-MM-dd
格式
select cust_id, order_num
from orders
where order_date = '2005-09-01';
2
3
如果仅比较日期部分,更可靠的写法是:
select cust_id, order_num
from orders
where date(order_date) = '2005-09-01';
2
3
比较日期区间:
select cust_id, order_num
from orders
where date(order_date) between '2005-09-01' and '2005-09-30';
2
3
比较年份和月份:
select cust_id, order_num
from orders
where year(order_date) = 2005 and month(order_date) = 9;
2
3
11.2.3 数值处理函数
数值处理函数一般没有文本和日期函数使用的那么频繁,但却是所有 DBMS 中最一致的。
函数 | 说明 |
---|---|
abs() | 返回一个数的绝对值 |
cos() | 返回一个角度的余弦 |
exp() | 返回一个数的指数值 |
mod() | 返回除操作的余数 |
pi() | 返回圆周率 |
rand() | 返回一个随机数 |
sin() | 返回一个角度的正弦 |
sqrt() | 返回一个数的平方根 |
tan() | 返回一个角度的正切 |
第 12 章 汇总数据
12.1 聚集函数
聚集函数(aggregate function):运行在行组上,计算和返回单个数的函数。
12.1.1
avg()
函数avg()
函数忽略列值为null
的行。sqlselect avg(prod_price) as avg_price from products;
1
2sqlselect avg(prod_price) as avg_price from products where vend_id = 1003;
1
2
312.1.2
count()
函数count()
函数有两种使用方式:count(*)
统计行数,不管表列中包含的是空值(null
)还是非空值count(column)
对特定列具有值的行进行统计,忽略null
值
sqlselect count(*) num_cust from customers;
1
2sqlselect count(cust_email) num_cust from customers;
1
212.1.3
max()
函数返回指定列中的最大值。
sqlselect max(prod_price) max_price from products;
1
212.1.4
min()
函数返回指定列的最小值。
sqlselect min(prod_price) min_price from products;
1
212.1.5
sum()
函数返回指定列值的和。
sqlselect sum(quantity) items_ordered from orderitems where order_num = 20005;
1
2
3sum()
也可以用来合计计算值。sqlselect sum(quantity) items_ordered from orderitems where order_num = 20005;
1
2
3
12.2 聚集不同值
select avg(distinct prod_price) as avg_price
from products
where vend_id = 1003;
2
3
12.3 组合聚集函数
select
count(*),
min(prod_price) as price_min,
max(prod_price) as price_max,
avg(prod_price) as price_avg
from
products;
2
3
4
5
6
7
第 13 章 分组数据
13.1 数据分组
分组允许把数据分为多个逻辑组,以便能为某个组进行聚集计算。
13.2 创建分组
select vend_id, count(*) as num_prods
from products
group by vend_id;
2
3
group by
子句可以包含任意数目的列。- 如果在
group by
子句中嵌套了分组,数据将在最后规定的分组上进行汇总。 group by
子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。
如果在select
中使用表达式,则必须在group by
子句中指定相同的表达式。不能使用别名。(JiaJia:可以使用别名)。- 除聚集计算语句外,
select
语句中的每个列都必须在group by
子句中给出。
关于这一点现在的版本中有些情况下已经不再强制了。如果这个非聚集的列可能对应多个行的值,现在貌似返回的是第一个匹配行的值。 - 如果分组列中具有
null
值,则null
将作为一个分组返回。 group by
子句必须出现在where
子句之后,order by
子句之前。
使用 with rollup
关键字,可以额外得到每个分组汇总级别的值。
select vend_id, count(*) as num_prods
from products
group by vend_id with rollup;
2
3
13.3 过滤分组
where
过滤行,having
过滤分组。having
支持所有 where
操作符。
select cust_id, count(*) as orders
from orders
group by cust_id
having count(*) >= 2;
2
3
4
where
在数据分组前进行过滤,having
在数据分组后进行过滤。
having
子句支持别名。
select cust_id, count(*) as orders
from orders
group by cust_id
having orders >= 2;
2
3
4
13.4 分组和排序
一般在使用 group by
子句时,应该也给出 order by
子句。这是保证数据正确排序的唯一方法。
select order_num, sum(quantity * item_price) as order_total
from orderitems
group by order_num
having order_total >= 50
order by order_total;
2
3
4
5
13.5 SELECT 子句顺序
No. | 子句 | 说明 | 是否必须使用 |
---|---|---|---|
1. | select | 要返回的列或表达式 | 是 |
2. | from | 从中检索数据的表 | 仅在从表选择数据时使用 |
3. | where | 行级过滤 | 否 |
4. | group by | 分组说明 | 仅在按组计算聚集时使用 |
5. | having | 组级过滤 | 否 |
6. | order by | 输出排序顺序 | 否 |
7. | limit | 要检索的行数 | 否 |
第 14 章 使用子查询
14.1 子查询
查询(query):任何 SQL 语句都是查询。但此术语一般指 select
语句。
子查询(subsquery):即嵌套在其它查询中的查询。
14.2 利用子查询进行过滤
select
cust_id
from
orders
where
order_num in (
select
order_num
from
orderitems
where
prod_id = 'TNT2'
);
2
3
4
5
6
7
8
9
10
11
12
13
在 select
语句中,子查询总是从内向外处理。
对于能嵌套的子查询的数量没有限制。
子查询并不总是执行这种类型的数据检索的最有效方法。
14.3 作为计算字段使用
select
cust_name,
cust_state,
(
select
count(*)
from
orders
where
orders.cust_id = customers.cust_id
) as orders
from
customers
order by
cust_name;
2
3
4
5
6
7
8
9
10
11
12
13
14
15
该子查询对检索出的每条数据执行一次。
这种类型的子查询称为 相关子查询(correlated subquery)。
第 15 章 联结表
15.1 联结
15.1.1 关系表
外键(foreign key):外键为某个表的一列,它包含另一个表的主键值,定义了两个表之间的关系。
可伸缩性(scale):能够适应不断增加的工作量而不失败。设计良好的数据库或应用称之为 可伸缩性好(scale well) 。
15.1.2 为什么要使用联结
联结是一种机制,用来在一条
select
语句中关联表,因此称之为联结。
联结有 MySQL 根据需要建立,它存在于查询的执行当中。
15.2 创建联结
select vend_name, prod_name, prod_price
from vendors, products
where vendors.vend_id = products.vend_id
order by vend_name, prod_name;
2
3
4
完全限定列名:在引用的列可能出现二义性时,必须使用完全限定列名(用一个点分隔的表名和列名)。
15.2.1 WHERE 子句的重要性
在联结时没有
where
子句,将会时表 1 中的每个行和表 2 中的每个行进行配对,而不管它们逻辑上是否可以配在一起。笛卡尔积(cartesian product) 由没有联结条件的表关系返回的结果为笛卡尔积。检索出的行数为表 1 的行数乘以表 2 的行数。
sqlselect vend_name, prod_name, prod_price from vendors, products order by vend_name, prod_name;
1
2
315.2.2 内部联结
sqlselect vend_name, prod_name, prod_price from vendors inner join products on vendors.vend_id = products.vend_id order by vend_name, prod_name;
1
2
3
415.2.3 联结多个表
SQL 对一条
select
语句中可以联结的表的数目没有限制。sqlselect prod_name, vend_name, prod_price, quantity from orderitems, products, vendors where products.vend_id = vendors.vend_id and orderitems.prod_id = products.prod_id and order_num = 20005;
1
2
3
4
5
第 16 章 创建高级联结
16.1 使用表别名
使用表别名可以:
- 缩短 SQL 语句;
- 允许在单条
select
语句中多次使用相同的表。
select cust_name, cust_contact
from customers as c, orders as o, orderitems as oi
where c.cust_id = o.cust_id
and oi.order_num = o.order_num
and prod_id = 'TNT2';
2
3
4
5
16.2 使用不同类型的联结
16.2.1 自联结
sqlselect p1.prod_id, p1.prod_name from products p1, products p2 where p1.vend_id = p2.vend_id and p2.prod_id = 'DTNTR';
1
2
3
4自联结通常作为外部语句用来替代从相同表中检索数据时使用的子查询。最然最终的结果是相同的,但有时候处理联结远比处理子查询快得多。应该试一下两种方法,以确定哪一种性能更好。
16.2.2 自然联结
标准联结返回所有数,甚至相同的列多次出现。
自然联结排除多次出现,使每个列只返回一次。但是系统不完成这项工作,由你自己完成它。sqlselect c.*, o.order_num, o.order_date, oi.prod_id, oi.quantity, oi.item_price from customers as c, orders as o, orderitems as oi where c.cust_id = o.cust_id and oi.order_num = o.order_num and prod_id = 'FB';
1
2
3
4
5
616.2.3 外部联结
外部联结包含了那些在相关表中没有关联行的行。
左外联结:
sqlselect customers.cust_id, orders.order_num from customers left outer join orders on customers.cust_id = orders.cust_id;
1
2
3右外联结:
sqlselect customers.cust_id, orders.order_num from customers right outer join orders on customers.cust_id = orders.cust_id;
1
2
3外联结中的
outer
关键字可以省略。
16.3 使用带聚集函数的联结
select
customers.cust_name,
customers.cust_id,
count(orders.order_num) as num_ord
from customers inner join orders
on customers.cust_id = orders.cust_id
group by customers.cust_id;
2
3
4
5
6
7
16.4 使用联结和联结条件
- 注意所使用的联结类型。
- 保证使用正确的联结条件,否则将返回不正确的数据。
- 应该总是提供联结条件,否则会得出笛卡尔积。
- 在一个联结中可以包含多个表,甚至对每个联结可以采用不同的联结类型。
虽然这样做是合法的,一般也很有用,但应该在一起测试它们前,分别测试每个联结。这将使故障排除更为简单。
第 17 章 组合查询
17.1 组合查询
MySQL 允许执行多个查询,并将结果作为单个查询结果返回。
这些组合查询通常称为并(union)或复合查询(compound query)。
17.2 创建组合查询
可用 union
操作符来组合数条 SQL 查询。
17.2.1 使用 UNION
sqlselect vend_id, prod_id, prod_price from products where prod_price <= 5 union select vend_id, prod_id, prod_price from products where vend_id in (1001, 1002);
1
2
3
4
5
6
717.2.2 UNION 规则
union
必须由两条或两条以上的select
语句组成,语句之间用关键字union
分隔。union
中的每个查询必须包含相同的列、表达式或聚集函数(不过各个列不需要以相同的次序给出)。
JiaJia:这边的说法有点容易让人误解。union
的结果并不是根据字段名来进行合并的,而是根据select
中各字段出现的顺序决定的。- 列数据类型必须兼容:类型不必完全相同,但必须是 DBMS 可以隐含地转换的类型。
17.2.3 包含或取消重复的行
union
从查询结果中自动去除了重复的行。
如果想返回所有匹配的行,可使用union all
关键字。17.2.4 对组合查询结果排序
在用
union
组合查询时,只能使用一条order by
子句,它必须出现在最后一条select
语句之后。sqlselect vend_id, prod_id, prod_price from products where prod_price <= 5 union select vend_id, prod_id, prod_price from products where vend_id in (1001, 1002) order by vend_id, prod_price;
1
2
3
4
5
6
7
8
第 18 章 全文本搜索
18.1 理解全文本搜索
两个最常使用的引擎为 MyISAM 和 InnoDB,前者支持全文本搜索,后者不支持。
like
和 regexp
存在的问题:
- 性能
通配符和正则表达式匹配通常要求 MySQL 尝试匹配表中所有行(而且这些搜索极少使用索引)。 - 明确控制
使用通配符和正则表达式匹配,很难明确地控制匹配什么和不匹配什么。 - 智能化的结果
虽然基于通配符和正则表达式的搜索提供了非常灵活的搜索,但它们都不能提供一种智能化的选择结果方法。
以上所有这些限制以及更多的限制都可以用全文本搜索来解决。
18.2 使用全文本搜索
为了进行全文本搜索,必须索引被搜索的列。
18.2.1 启用全文本搜索支持
一般在创建表时启用全文本搜索。
sqlcreate table productnotes ( note_id int not null auto_increment, prod_id char(10) not null, note_date datetime not null, note_text text null , primary key(note_id), fulltext(note_text) ) engine=MyISAM;
1
2
3
4
5
6
7
8
9这里的
fulltext
索引单个列,如果需要也可以指定多个列。如果正在导入数据到一个新表,此时不应该启用
fulltext
索引。
应该首先导入所有数据,然后再修改表,定义fulltext
。
这样有助于更快的导入数据。18.2.2 进行全文本搜索
match()
指定被搜索的列,against()
指定要使用的搜索表达式。sqlselect note_text from productnotes where match(note_text) against('rabbit')
1
2
3传递给
match()
的值必须与fulltext()
定义中的相同。如果指定多个列,则必须列出它们(而且次序正确)。除非使用
binary
方式,否则全文本搜索不区分大小写。全文本搜索返回以文本匹配的良好程度排序的数据。全文本搜索的一个重要部分就是对结果排序。
sqlselect note_text, match(note_text) against('rabbit') as ranks from productnotes;
1
2
3等级由 MySQL 根据行中词的数目、唯一词的数目、整个索引中词的总数以及包含该词的行的数目计算出来。
18.2.3 使用查询扩展
查询扩展用来设法放宽所返回的全文本搜索结果的范围。
在使用查询扩展时,MySQL 对数据和索引进行两遍扫描来完成搜索:
- 首先,进行一次基本的全文本搜索,找出与搜索条件匹配的所有行;
- 其次,MySQL 检查这些匹配行并选择所有有用的词;
- 再次其,MySQL 再次进行全文本搜索,这次不仅使用原来的条件,而且还使用所有有用的词。
sqlselect note_text from productnotes where match(note_text) against('rabbit' with query expansion);
1
2
318.2.4 布尔文本搜索
以布尔方式,可以提供关于如下内容的细节:
- 要匹配的词;
- 要排斥的词(如果某行包含这个词,则不返回该行,即使它包含其它指定的词也是如此);
- 排列提示(指定某些词比其它词更重要,更重要的词等级更高);
- 表达式分组;
- 另外一些内容。
即使没有
fulltext
索引也可以使用布尔方式搜索,但这是一种非常缓慢的操作。sqlselect note_text from productnotes where match(note_text) against('rabbit' in boolean mode);
1
2
3排除包含
rope*
(任何以 rope 开头的单次)的行:sqlselect note_text from productnotes where match(note_text) against('heavy -rope*' in boolean mode);
1
2
3全文本布尔操作符:
+
:包含,词必须存在-
:排除,词必须不存在>
:包含,而且增加等级值<
:包含,且减少等级值()
:把词组成子表达式(允许这些子表达式作为一个组被包含、排除、排列等)~
:取消一个词的排序值*
:词尾的通配符""
:定义一个短语(与单个词的列表不一样,它匹配整个短语以便包含或排除这个短语)
在布尔方式中,不按等级值降序排序返回的行。
18.2.5 全文本搜索的使用说明
- 在索引全文本数据时,短词被忽略且从索引中排除。短词定义为那些具有 3 个或 3 个以下字符的词(如需要,这个值可以更改)。
- MySQL 带有一个内建的非用词(stopword)列表,这些词在索引全文本数据时总是被忽略。如果需要,可以覆盖这个列表。
- 许多词出现的频率很高,搜索它们没有用处(返回太多结果)。因此 MySQL 规定了一条 50% 规则,如果一个词出现在 50% 以上的行中,则将它作为一个非用词忽略。50% 规则不用于
in boolean mode
。 - 如果表中的行数少于 3 行,则全文不搜索不返回结果(因为每个词或者不出现,或者至少出现在 50% 的行中)。
- 忽略词中的单引号。例如 don't 索引为 dont。
- 不具有词分隔符(包括日语和汉语)的语言不能恰当地返回全文本搜索结果。
- 如前所述,仅在 MyISAM 数据库引擎中支持全文本搜索。
第 19 章 插入数据
19.1 数据插入
insert
用来插入(或添加)行到数据库表的。
插入可以用几种方式使用:
- 插入完整的行;
- 插入行的一部分;
- 插入多行;
- 插入某些查询的结果。
19.2 插入完整的行
insert into `customers`
values (
null,
'Coyote Inc.',
'200 Maple Lane',
'Detroit',
'MI',
'44444',
'USA',
'Y Lee',
'ylee@coyote.com'
);
2
3
4
5
6
7
8
9
10
11
12
这种语法比较简单,但由于其高度依赖于字段定义的顺序,不推荐使用。
insert into `customers`
(
`cust_id`,
`cust_name`,
`cust_address`,
`cust_city`,
`cust_state`,
`cust_zip`,
`cust_country`,
`cust_contact`,
`cust_email`
)
values
(
null,
'Coyote Inc.',
'200 Maple Lane',
'Detroit',
'MI',
'44444',
'USA',
'Y Lee',
'ylee@coyote.com'
);
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
一般不要使用没有明确给出列的列名的 insert
语句。
如果表的定义允许,则可以在 insert
操作中省略某些列。省略的列必须满足以下某个条件:
- 该列定义为允许
null
值(无值或空值) - 在表定义中给出默认值。这表示如果不给出值,将使用默认值。
insert
操作可能很耗时(特别是有很多索引需要更新时),而且它可能降低等待处理 select
语句的性能。
如果数据检索是最重要的(通常是这样),则你可以通过在 insert
和 into
之间添加关键字 low_priority
,指示 MySQL 降低 insert
语句的优先级,如下所示:
insert low_priority into
low_priority
同样适用于 update
和 delete
语句。
19.3 插入多个行
insert into
`customers`(
`cust_id`,
`cust_name`,
`cust_address`,
`cust_city`,
`cust_state`,
`cust_zip`,
`cust_country`,
`cust_contact`,
`cust_email`
)
values
(
10001,
'Coyote Inc.',
'200 Maple Lane',
'Detroit',
'MI',
'44444',
'USA',
'Y Lee',
'ylee@coyote.com'
);
insert into
`customers`(
`cust_id`,
`cust_name`,
`cust_address`,
`cust_city`,
`cust_state`,
`cust_zip`,
`cust_country`,
`cust_contact`,
`cust_email`
)
values
(
10002,
'Mouse House',
'333 Fromage Lane',
'Columbus',
'OH',
'43333',
'USA',
'Jerry Mouse',
null
);
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
或者合并成如下形式:
insert into
`customers`(
`cust_id`,
`cust_name`,
`cust_address`,
`cust_city`,
`cust_state`,
`cust_zip`,
`cust_country`,
`cust_contact`,
`cust_email`
)
values
(
10001,
'Coyote Inc.',
'200 Maple Lane',
'Detroit',
'MI',
'44444',
'USA',
'Y Lee',
'ylee@coyote.com'
),
(
10002,
'Mouse House',
'333 Fromage Lane',
'Columbus',
'OH',
'43333',
'USA',
'Jerry Mouse',
null
);
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
19.4 插入检索出的数据
insert into
`customers`(
`cust_id`,
`cust_name`,
`cust_address`,
`cust_city`,
`cust_state`,
`cust_zip`,
`cust_country`,
`cust_contact`,
`cust_email`
)
select
`cust_id`,
`cust_name`,
`cust_address`,
`cust_city`,
`cust_state`,
`cust_zip`,
`cust_country`,
`cust_contact`,
`cust_email`
from
custnew;
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
第 20 章 更新和删除数据
20.1 更新数据
使用 update
语句更新数据。
可采用两种方式使用 update
:
- 更新表中特定行;
- 更新表中所有行。
update customers
set cust_name = 'The Fudds',
cust_email = 'elmer@fudd.com'
where cust_id = 10005;
2
3
4
如果用 update
更新多行,并且在更新这些行中的一行或多行时出现一个错误,则整个 update
语句被取消。
即使发生错误时,也继续进行更新时,可使用 ignore
关键字。
update ignore customers ...
为了删除某个列的值,可以将它设置为 null
。
update customers
set cust_email = null
where cust_id = 10005;
2
3
20.2 删除数据
使用 delete
语句删除数据。
可以用两种方式使用 delete
:
- 从表中删除特定的行;
- 从表中删除所有行。
不要省略 where
子句。
delete from customers
where cust_id = 10005;
2
如果想从表中删除所有行,不要使用 delete
。可使用 truncate table
语句,它完成相同的功能,但速度更快(truncate
实际上是删除原来的表并重新创建一个表,而不是逐行删除表中的数据)。
20.3 更新和删除指导原则
- 除非确实打算更新和删除每一行,否则绝对不要使用不带
where
子句的update
和delete
语句。 - 保证每个表都有主键,尽可能像
where
子句那样使用它。 - 在对
update
或delete
语句使用where
子句前,应该先用select
进行测试,保证它过滤的是正确的记录,以防编写的where
子句不正确。 - 使用强制实施引用完整性的数据库,这样 MySQL 将不允许删除具有与其它表相关联的数据的行。
第 21 章 创建和操纵表
一般有两种创建表的方法:
- 使用具有交互式创建和管理表的工具;
- 也可以直接用 MySQL 语句创建。
21.1 创建表
21.1.1 表创建基础
sqlCREATE TABLE customers ( cust_id int NOT NULL AUTO_INCREMENT, cust_name char(50) NOT NULL , cust_address char(50) NULL , cust_city char(50) NULL , cust_state char(5) NULL , cust_zip char(10) NULL , cust_country char(50) NULL , cust_contact char(50) NULL , cust_email char(255) NULL , PRIMARY KEY (cust_id) ) ENGINE=InnoDB;
1
2
3
4
5
6
7
8
9
10
11
12
13如果仅想在一个表不存在的时候创建它,应该在表名后给出
if not exists
。21.1.2 使用 NULL 值
每个表列或者是
null
列,或者是not null
列,这种状态在创建时由表的定义规定。null
值是没有值,它不是空串。21.1.3 主键再介绍
主键值必须是唯一的。即,表中的每个行必须具有唯一的主键值。
如果主键使用单个列,则它的值必须唯一。
如果使用多个列,则这些列的组合值必须是唯一的。sqlPRIMARY KEY (cust_id)
1主键中只能使用不允许
null
值的列。21.1.4 使用 AUTO_INCREMENT
AUTO_INCREMENT
告诉 MySQL,本列每当增加一行时自动增量。每个表只允许一个
AUTO_INCREMENT
列,而且它必须被索引。即使一个列是自增的,也可以在
insert
时指定一个值(只要这个值还未使用过),而且如果这个指定值比之前的自增值要大,那么后续的增量将从这个值开始增加。使用
last_insert_id()
获取最后插入的行的自动增量值。sqlselect last_insert_id();
121.1.5 指定默认值
如果在插入时没有给出值,MySQL 允许指定此时使用的默认值。
默认值用create table
语句的列定义中的default
关键字指定。sqlquantity int NOT NULL DEFAULT 1,
1许多数据库开发人员使用默认值而不是
null
列,特别是对用于计算或数据分组的列更是如此。21.1.6 引擎类型
MySQL 与其它 DBMS 不一样,它具有多种引擎。
它们具有各自不同的功能和特性,为不同的任务选择正确的引擎能获得良好的功能和灵活性。
如果省略engine=
语句,则使用默认引擎(很可能是 MyISAM),多数 SQL 语句都会默认使用它,但并不是所有的语句都默认使用它。- InnoDB:一个可靠的事务处理引擎,它不支持全文本搜索;
- MEMORY:在功能上等同于 MyISAM,但由于数据存储在内存中,速度很快(特别适合于临时表);
- MyISAM:一个性能极高的引擎,它支持全文本搜索,但不支持事务处理。
引擎类型可以混用。不同的表可以使用不同的引擎。
外键不能跨引擎。使用一个引擎的表不能引用具有使用不同引擎的表的外键。
21.2 更新表
使用 alter talbe
语句更新表定义。
理想状态下,当表中存储数据以后,该表不应该再被更新。
在表的设计过程中需要花费大量时间来考虑,以便后期不对该表进行大的改动。
添加列:
alter table vendors
add vend_phone char(20);
2
删除刚刚添加的列:
alter table vendors
drop column vend_phone;
2
alter table
的一种常见用途是定义外键。
alter table orderitems
add constraint fk_orderitems_orders
foreign key (order_num) references orders (order_num);
2
3
复杂的表结构更改可以参考以下步骤:
- 用新的列布局创建一个新表;
- 使用
insert select
语句从旧表复制数据到新表。如果有必要,可使用转换函数和计算字段; - 检验包含所需数据的新表;
- 重命名旧表(如果确定,可以删除它);
- 用旧表原来的名字重命名新表;
- 根据需要,重新创建触发器、存储过程、索引和外键。
使用 alter table
要极为小心,应该在进行改动前做一个完整的备份(模式和数据的备份)。
21.3 删除表
drop table cutomers2;
21.4 重命名表
rename table customers2 to customers;
一次可以重命名多张表:
rename table backup_customers to customers,
backup_vendors to vendors,
backup_products to products;
2
3
第 22 章 使用视图
视图是虚拟的表。
与包含数据的表不一样,视图只包含使用时动态检索数据的查询。
作为视图,它不包含表中应该有的任何列或数据,它包含的是一个 SQL 查询。
22.1 视图
22.1.1 为什么使用视图
- 重用 SQL 语句
- 简化复杂的 SQL 操作
- 使用表的组成部分而不是整个表
- 保护数据
- 更改数据格式和表示
22.1.2 视图的规则和限制
- 与表一样,视图必须唯一命名。
- 对于可以创建的视图数目没有限制。
- 为了创建视图,必须具有足够的访问权限。
- 视图可以嵌套,即可以利用从其他视图中检索数据的查询来构造一个视图。
order by
可以用在视图中,但如果从该视图检索数据的select
语句中也包含order by
,那么该视图中的order by
将被覆盖。- 视图不能索引,也不能有关联的触发器或默认值。
- 视图可以和表一起使用。
22.2 使用视图
22.2.1 利用视图简化复杂的联结
sqlcreate view product_customers as select cust_name, cust_contact, prod_id from customers, orders, orderitems where customers.cust_id = orders.cust_id and orderitems.order_num = orders.order_num;
1
2
3
4
5sqlselect cust_name, cust_contact from product_customers where prod_id = 'TNT2';
1
2
322.2.2 用视图重新格式化检索出的数据
sqlcreate view vendor_locations as select concat(rtrim(vend_name), ' (', rtrim(vend_country), ')') as vend_title from vendors order by vend_name;
1
2
3
4sqlselect * from vendor_locations;
1
222.2.3 用视图过滤不想要的数据
sqlcreate view customer_email_list as select cust_id, cust_name, cust_email from customers where cust_email is not null;
1
2
3
4sqlselect * from customer_email_list;
1
222.2.4 使用视图与计算字段
sqlcreate view orderitems_expaned as select order_num, prod_id, quantity, item_price, quantity * item_price as expanded_price from orderitems;
1
2
3
4
5sqlselect * from orderitems_expaned where order_num = 20005;
1
2
322.2.5 更新视图
通常,视图是可更新的。更新一个视图将更新其基表。
但是,并非所有的视图都是可更新的。基本上可以说,如果 MySQL 不能正确地确定被更新的的基数据,则不允许更新(包括插入和删除)。
这实际上意味着,如果视图定义中有以下操作,则不能进行视图的更新:- 分组(使用
group by
和having
); - 联结;
- 子查询;
- 并;
- 聚集函数(
min()
、count()
、sum()
等); distinct
;- 导出(计算)列。
- 分组(使用
第 23 章 使用存储过程
23.1 存储过程
存储过程简单来说,就是为以后的使用而保存的一条或多条 MySQL 语句的集合。
可将其视为批处理,虽然它们的作用不仅限于批处理。
23.2 什么要使用存储程
优点:
- 通过把处理封装在容易使用的单元中,简化复杂的操作。
- 由于不要求反复建立一系列处理步骤,这保证了数据的完整性。
- 简化对变动的管理。
- 提高性能。
- 存在一些只能用在单个请求中的 MySQL 元素和特性,存储过程可以使用它们来编写功能更强更灵活的代码。
缺点:
- 一般来说,存储过程的编写比基本 SQL 语句复杂,编写存储过程需要更高的技能,更丰富的经验。
- 你可能没有创建存储过程的安全访问权限。
23.3 使用存储程
23.3.1 执行存储过程
sqlcall productpricing(@pricelow, @pricehigh, @priceaverage);
123.3.2 创建存储过程
sqlcreate procedure productpricing() begin select avg(prod_price) as priceaverage from products; end;
1
2
3
4
5通过 MySQL 命令行客户端创建存储过程时,需要临时修改默认的分隔符。
sqldelimiter // create procedure productpricing() begin select avg(prod_price) as priceaverage from products; end // delimiter ;
1
2
3
4
5
6
7
8
923.3.3 删除存储过程
sqldrop procedure productpricing;
123.3.4 使用参数
变量(variable):内存中一个特定的位置,用来临时存储数据。
sqlcreate procedure productpricing( out pl decimal(8, 2), out ph decimal(8, 2), out pa decimal(8, 2)) begin select min(prod_price) into pl from products; select max(prod_price) into ph from products; select avg(prod_price) into pa from products; end;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15关键字
out
表示相应的参数从存储过程传出一个值(返回给调用者)。
除此之外,存储过程还支持in
和inout
类型的参数。调用存储过程:
sqlcall productpricing(@pricelow, @pricehigh, @priceaverage);
1所有变量名必须以
@
开始。显示存储过程返回的值:
sqlselect @pricelow, @pricehigh, @priceaverage;
1另一个包含
in
和out
参数的例子:sqlcreate procedure ordertotal( IN onumber INT, out ototal decimal(8,2) ) begin select sum(item_price * quantity) from orderitems where order_num = onumber into ototal; end;
1
2
3
4
5
6
7
8
9
10执行存储过程和显示返回的结果:
sqlcall ordertotal(20005, @total); select @total;
1
223.3.5 建立智能存储过程
sqlcreate procedure ordertotal( in onumber int, in taxable boolean, out ototal decimal(8,2) ) comment 'Obtain order total, optionally adding tax' begin -- Declare variable for total declare total decimal(8,2); -- Declare tax percentage declare taxrate int default 6; -- Get the order total select sum(item_price * quantity) from orderitems where order_num = onumber into total; -- Is this taxable? if taxable then -- yeas, so add taxrate to the total select total + (total / 100 * taxrate) into total; end if; -- And finally, save to out variable select total into ototal; end;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27上文中
comment
后的内容可以通过如下语句看到:sqlshow procedure status like 'ordertotal';
1通过传递不同的参数执行并查看结果:
sqlcall ordertotal(20005, 0, @total); select @total; call ordertotal(20005, 1, @total); select @total;
1
2
3
4
523.3.6 检查存储过程
sqlshow create procedure ordertotal;
1
第 24 章 使用游标
24.1 游标
游标(cursor)是一个存储在 MySQL 服务器上的数据库查询,它不是一条 SELECT 语句,而是被该语句检索出来的结果集。
MySQL 游标只能用于存储过程(和函数)。
24.2 使用游标
使用步骤:
使用游标,必须声明(定义)它。
这个过程实际上没有检索数据,它只是定义要使用的 SELECT 语句。一旦声明后,必须打开游标以供使用。
这个过程用前面定义的 SELECT 语句把数据实际检索出来。对于填有数据的游标,根据需要取出(检索)各行。
在结束游标使用时,必须关闭游标。
24.2.1 创建游标
sqlcreate procedure process_orders() begin declare order_numbers cursor for select order_num from orders; end;
1
2
3
4
5
624.2.2 打开和关闭游标
sqlopen order_numbers;
1sqlclose order_numbers;
124.2.3 使用游标数据
sqlcreate procedure process_orders() begin -- Declare local variables declare o int; -- Declare the cursor declare order_numbers cursor for select order_num from orders; -- Open the cursor open order_numbers; -- Get order number fetch order_numbers into o; select o; -- Close the cursor close order_numbers; end;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20fetch
用来检索当前行的 order_num 到一个名为 o 的局部变量中。检索出的数据不做任何处理。循环检索数据,从第一行到最后一行:
sqlcreate procedure process_orders() begin -- Declare local variables declare done boolean default 0; declare o int; -- Declare the cursor declare order_numbers cursor for select order_num from orders; -- Declare continue handler declare continue handler for sqlstate '02000' set done = 1; -- Open the cursor open order_numbers; -- Loop through all rows repeat -- Get order number fetch order_numbers into o; select o; -- End of loop until done end repeat; -- Close the cursor close order_numbers; end;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29continue handler
用来定义在条件出现时执行的代码。
上例中sqlstate '02000'
是一个未找到条件,当repeat
由于没有更多的行供循环而不能继续时,出现这个条件。用
declare
语句定义的局部变量必须在定义任意游标或句柄之前定义,而句柄必须在游标之后定义。一个修改后更为完善的存储过程示例:
sqldrop procedure process_orders; create procedure process_orders() begin -- Declare local variables declare done boolean default 0; declare o int; declare t decimal(8,2); -- Declare the cursor declare order_numbers cursor for select order_num from orders; -- Declare continue handler declare continue handler for sqlstate '02000' set done = 1; create table if not exists ordertotals (order_num int, total decimal(8,2)); -- Open the cursor open order_numbers; -- Loop through all rows repeat -- Get order number fetch order_numbers into o; -- Get the total for this order call ordertotal(o, 1, t); insert into ordertotals(order_num, total) values(o, t); -- End of loop until done end repeat; -- Close the cursor close order_numbers; end;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40执行存储过程:
sqlcall process_orders();
1此存储过程不返回数据,但它能创建和填充另一张表。
sqlselect * from ordertotals;
1
2
第 25 章 使用触发器
25.1 触发器
触发器是 MySQL 响应以下任意语句而自动执行的一条 MySQL 语句:
delete
insert
update
其他 MySQL 语句不支持触发器。
25.2 创建触发器
在 MySQL 5 中,触发器名必须在每个表中唯一,但不是在每个数据库中唯一。
但最好是在数据库范围内使用唯一的触发器名。
create trigger new_product after insert on products
for each row select 'Product added';
2
JiaJia:上面是书中给出的示例,不过在运行时报了如下错误(MySQL 版本:5.7.30-0ubuntu0.16.04.1):
1415 - Not allowed to return a result set from a trigger
可以改成在触发器中给变量赋值:
create trigger new_order after insert on orders
for each row select new.order_num into @newOrderNum;
2
插入数据后再检查变量内容:
INSERT INTO `orders`
(`order_date`, `cust_id`)
VALUES
('2022-02-06 00:00:00', 10001);
select @newOrderNum;
2
3
4
5
6
另外想在新增订单后,使用自增列的值来更新别的列:
create trigger new_order after insert on orders
for each row set new.order_code = concat(new.order_num, new.cust_id);
2
但是运行报了如下错误:
1362 - Updating of NEW row is not allowed in after trigger
查了一下,这个功能貌似暂时无法通过触发器实现。
书中后面也有讲到,仅支持在插入之前 before insert
中更新新行。
25.3 删除触发器
drop trigger new_order;
25.4 使用触发器
25.4.1 INSERT 触发器
insert
触发器在insert
语句执行之前或之后执行。- 在
insert
触发器代码内,可引用一个名为new
的虚拟表,访问被插入的行; - 在
before insert
触发器中,new
中的值也可以被更新(允许更改被插入的值); - 对于
auto_increment
列,new
在insert
之前包含 0,在insert
执行之后包含新的自动生成值。
sqlcreate trigger new_order after insert on orders for each row select new.order_num into @newOrderNum;
1
2通常,将
before
用于数据验证和净化(目的是保证插入表中的数据确实是需要的数据)。这也适用于update
触发器。- 在
25.4.2 DELETE 触发器
- 在
delete
触发器代码内,可以引用一个名为old
的虚拟表,访问被删除的行。 old
中的值全都是只读的,不能更新。
sqlcreate trigger delete_order before delete on orders for each row begin insert into archive_orders(order_num, order_date, cust_id) values (old.order_num, old.order_date, old.cust_id); end
1
2
3
4
5
6使用
before delete
的优点是,如果出于某种原因,订单不能存档,delete
本身将被放弃。- 在
25.4.3 UPDATE 触发器
update
触发器在update
语句执行之前或之后执行。- 在
update
触发器中,可以引用一个名为old
的虚拟表访问以前(UPDATE 语句前)的值,引用过一个名为new
的虚拟表访问新更新的值; - 在
before update
触发器中,new
中的值可能也被更新(允许更改将要用于 UPDATE 语句中的值); old
中的值全都是只读的,不能更新。
sqlcreate trigger updatevendor before update on vendors for each row set new.vend_state = upper(new.vend_state);
1
2- 在
25.4.4 关于触发器的进一步介绍
- 与其它 DMBS 相比,MySQL 5 中支持的触发器相当初级。
- 创建触发器可能需要特殊的安全访问权限,但是触发器的执行是自动的。
- 应该用触发器来保证数据的一致性(大小写,格式等)。
- 触发器的一种非常有意义的使用是创建审计跟踪。使用触发器,把更改记录到另一个表非常容易。
- 遗憾的是,MySQL 触发器中不支持
call
语句。所需的存储过程代码需要复制到触发器内。
第 26 章 管理事处理
26.1 事务处理
并非所有引擎都支持事务处理。MyISAM 和 InnoDB 是两种最常使用的引擎。前者不支持明确的事务处理管理,而后者支持。
事务处理(transaction processing)可以用来维护数据库的完整性,它保证成批的 MySQL 操作要么完全执行,要么完全不执行。
术语:
- 事务(transaction):指一组 SQL 语句;
- 回退(rollback):指撤销指定 SQL 语句的过程;
- 提交(commit):指将未存储的 SQL 语句结果写入数据库表;
- 保留点(savepoint):指事务处理中设置的临时占位符(placeholder),你可以对它发布回退(与回退整个事务处理不同)。
26.2 控制事务处理
开始事务:
start transaction
26.2.1 使用 ROLLBACK
sqlselect * from ordertotals; start transaction; delete from ordertotals; select * from ordertotals; rollback; select * from ordertotals;
1
2
3
4
5
6rollback
只能在一个事务处理内使用。事务处理用来管理
insert
、update
、delete
语句。
不能回退select
、create
、drop
操作。26.2.2 使用 COMMIT
一般的 MySQL 语句都是直接针对数据库表执行和编写的。这就是所谓的隐含提交(implicit commit),即提交(写或保存)操作是自动进行的。
但是,在事务处理块中,提交不会隐含地进行。为进行明确地提交,需使用
commit
语句。sqlstart transaction; delete from orderitems where order_num = 20010; delete from orders where order_num = 20010; commit;
1
2
3
4当
commit
或rollback
语句执行后,事务会自动关闭(将来的更改会隐含提交)。26.2.3 使用保留点
更复杂的事务处理可能需要部分提交或回退。为了支持部分回退,必须能在事务处理块中合适的位置放置占位符。这些占位符称为保留点。
sqlsavepoint delete1;
1每个保留点都取标识它的唯一的名字,以便在回退时,MySQL 知道要回退到何处。
sqlrollback to delete1;
1保留点越多越好。 保留点越多,意味着可以更加灵活的回退。
保留点在事务处理完成(执行一条
rollback
或commit
)后自动释放。也可以用release savepoint
明确地释放保留点。26.2.4 更改默认的提交行为
默认的 MySQL 行为是自动提交所有更改。为指示 MySQL 不自动提交更改,需要使用以下语句:
sqlset autocommit = 0;
1设置 autocommit 为 0(假)指示 MySQL 不自动提交更改(直到 autocommit 被设置为真为止)。
第 27 章 全球化和本地化
27.1 字符集和校对顺序
相关术语:
- 字符集为字母和符号的集合;
- 编码为某个字符集成员的内部表示;
- 校对为规定字符如何比较的指令。
27.2 使用字符集和校对顺序
查看所支持的字符集完整列表:
show character set;
查看所支持校对的完整列表:
show collation;
通常 _cs
后缀的校对表示区分大小写;_ci
后缀表示不区分大小写。
通常系统管理在安装时定义一个默认的字符集和校对。此外,也可以在创建数据库时,指定默认的字符集和校对。
确定所用的字符集和校对:
show variables like 'character%';
show variables like 'collation%';
2
create talbe
时可以指定字符集和校对。
create table mytable
(
columnn1 int,
columnn2 varchar(10)
) default character set hebrew
collate hebrew_general_ci;
2
3
4
5
6
MySQL 还允许对每个列设置字符集和校对:
create table mytable
(
columnn1 int,
columnn2 varchar(10),
columnn3 varchar(10) character set latin1 collate latin1_general_ci
) default character set hebrew
collate hebrew_general_ci;
2
3
4
5
6
7
select
时也可以指定与表定义中不同的校对顺序:
select * from customers
order by lastname, firstname collate latin1_general_cs;
2
另外 collate
还可以用于 group by
、having
、聚集函数、别名等。
第 28 章 安全管理
28.1 访问控制
MySQL 服务器的安全基础是:用户应该对他们需要的数据具有适当的访问权,既不能多也不能少。
MySQL Administrator 提供了一个图形用户界面,可用来管理用户及账号权限。
MySQL 默认创建了一个 root 的用户账号,它对整个 MySQL 服务器具有完全的控制。
在现实世界的日常工作中,绝不能使用 root。应该创建一系列的账号,有的用于管理,有的供用户使用,有的供开发人员使用,等等。
访问控制的目的不仅仅是防止用户的恶意企图。数据梦魇更为常见的是无意识错误的结果。
28.2 管理用户
MySQL 用户账号和信息存储在名为 mysql 的数据库中。
一般不需要直接访问 mysql 数据库和表。
获取所有用户账号列表:
use mysql;
select user from user;
2
28.2.1 创建用户账号
sqlcreate user ben identified by 'p@$$w0rd';
1创建用户时不一定需要口令。例子中通过
identified by
设置了口令。命令中口令为明文,存储到 user 表中的是加密后的数据。重命名账号:
sqlrename user ben to jiajia;
128.2.2 删除用户账号
sqldrop user jiajia;
128.2.3 设置访问权限
查看账户权限:
sqlshow grants for jiajia;
1授予账户权限(这里是授予查询权限):
sqlgrant select on crash.* to jiajia;
1grant
的反操作为revoke
,用它来撤销特定的权限。sqlrevoke select on crash.* from jiajia;
1grant
和revoke
可在几个层次上控制访问权限:- 整个服务器
grant all
revoke all
- 整个数据库
on database.*
- 特定的表
on database.table
- 特定的列
- 特定的存储过程
- 整个服务器
28.2.4 更改口令
sqlset password for jiajia = password('n3w p@$$w9rd');
1新口令必须传递到
password
函数进行加密。不指定用户名时,更新当前登录用户的口令:
sqlset password = password('n3w p@$$w9rd');
1
第 29 章 数据库维护
29.1 备份数据
- 使用命令行使用程序 mysqldump 转储所有数据库内容到某个外部文件。
- 可用命令行使用程序 mysqlhotcopy 从一个数据库复制所有数据。
- 可以使用 MySQL 的
backup table
或select into outfile
转储所有数据到某个外部文件。
数据可以用restore table
来复原。
为了保证所有数据被写到磁盘(包括索引数据),可能需要在进行备份前使用 flush tables
语句。
29.2 进行数据库维护
analyze table
用来检查表键是否正确。check tabble
用来针对许多问题对表进行检查。- 如果 MyISAM 表访问产生不正确和不一致的结果,可能需要
repair table
来修复相应的表。 - 如果从一个表中删除大量数据,应该使用 optimize table 来收回所用的空间,从而优化表的性能。
29.3 诊断启动问题
在排除系统启动问题时,首先应该尽量用手动启动服务器。
以下是几个重要的 mysqld 命令行选项:
--help
显示帮助--safe-mode
装载减去某些最佳配置的服务器--verbose
显示全文本消息(为获取更详细的帮助消息与--help
联合使用)--version
显示版本信息然后退出
29.4 查看日志文件
MySQL 主要有以下日志:
- 错误日志。
它包含启动和关闭问题以及任意关键错误的细节。
此日志通常名为 hostname.err,位于 data 目录中。
此日志名可用--log-error
命令行选项更改。 - 查询日志。
它记录所有 MySQL 活动,在诊断问题时非常有用。
此日志文件可能会很快地变得非常大,因此不应该长期使用它。
此日志通常名为 hostname.log,位于 data 目录中。
此名字可以用--log
命令行选项更改。 - 二进制日志。
它记录更新过数据的所有语句。
此日志通常名为 hostname-bin,位于 data 目录中。
此日志可以用--log-bin
命令行选项更改。
注意,这个日志文件是 MySQL 5 中添加的,此前的 MySQL 版本中使用的是更新日志。 - 缓慢查询日志。
此日志记录执行缓慢的任何查询。
此日志通常名为 hostname-slow.log,位于 data 目录中。
此名字可以用--log-slow-queries
命令行选项更改。
第 30 章 改善性能
30.1 改善性能
在诊断应用的滞缓现象和性能问题时,性能不良的数据库(以及数据库查询)通常是最常见的祸因。
- 首先,MySQL(与所有 DBMS 一样)具有特定的硬件建议。
- 一般来说,关键的生产 DBMS 应该运行在自己的专用服务器上,。
- MySQL 是用一系列的默认设置预先配置的,这些设置开始通常是很好的。但过一段时间后你可能需要调整内存分配、缓冲区大小等。(为查看当前设置,可使用
show variables;
和show status;
。) - MySQL 是一个多用户多线程的 DBMS,换言之,它经常同时执行多个任务。如果这些任务中的某一个执行缓慢,则所有请求都会执行缓慢。如果你遇到显著的性能不良,可使用
show processlist
显示所有活动进程(以及它们的线程 ID 和执行时间)。你还可以用kill
命令终结某个特定的进程(使用这个命令需要作为管理员登录)。 - 总有不止一种方法编写同一条
select
语句。应该实验联结、并、子查询等,找出最佳的方法。 - 使用
explain
语句让 MySQL 解释它将如何执行一条select
语句。 - 一般来说,存储过程执行的比一条一条地执行其中的各条 MySQL 语句快。
- 应该总是使用正确的数据类型。
- 绝不要检索比需求还要多的数据。换言之,不要用
select *
(除非你真正需要每个列)。 - 有的操作(包括
insert
)支持一个可选的delayed
关键字,如果使用它,将把控制立即返回给调用程序,并且一旦有可能就实际执行该操作。 - 在导入数据时,应该关闭自动提交。你可能还想删除索引(包括
fulltext
索引),然后在导入完成后再重建它们。 - 必须索引数据库表以改善数据检索的性能。确定索引什么不是一件微不足道的任务,需要分析使用的
select
语句以找出重复的where
和order by
子句。如果一个简单的where
子句返回结果所花的时间太长,则可以断定其中使用的列(或几个列)就是需要索引的对象。 - 你的
select
语句中有一系列复杂的or
条件吗?通过使用多条select
语句和连接它们的union
语句,你能看到极大的性能改进。 - 索引改善数据检索的性能,但损害数据插入、删除和更新的性能。如果你有一些表,它们收集数据且不经常被搜索,则在有必要之前不要索引它们。(索引可根据需要添加和删除)
like
很慢。一般来说,最好是使用fulltext
而不是like
。- 数据库是不断变化的实体。一组优化良好的表可能很快就面目全非了。由于表的使用和内容的更改,理想的优化和配置也会改变。
- 最重要的规则就是,每条规则在某些条件下都会被打破。
附录 C MySQL 语句的语法
ALTER TABLE
sqlalter table tablename ( add column datatype [null|not null] [constraints], change column columns datatype [null|not null] [constraints], drop column, ... );
1
2
3
4
5
6
7COMMIT
sqlcommit;
1CREATE INDEX
sqlcreate index indexname on tablename (column [asc|desc], ...);
1
2CREATE PROCEDURE
sqlcreate procedure procedurename([parameters]) begin ... end;
1
2
3
4CREATE TABLE
sqlcreate table tablename ( column datatype [null|not null] [constraints], column datatype [null|not null] [constraints], ... );
1
2
3
4
5
6CREATE USER
sqlcreate user username[@hostname] [identified by [password] 'password'];
1
2CREATE VIEW
sqlcreate [or replace] view viewname as select ...;
1
2
3DELETE
sqldelete from tablename [where ...];
1
2DROP
sqldrop database|index|procedure|table|trigger|user|view itemname;
1
2INSERT
sqlinsert into tablename [(columns, ...)] values (values, ...);
1
2INSERT SELECT
sqlinsert into tablename [(columns, ...)] select columns, .... from tablename, ... [where ...]
1
2
3ROLLBACK
sqlrollback [to savepointname];
1SAVEPOINT
sqlsavepoint sp1;
1SELECT
sqlselect columnname, ... from tablename, ... [where ...] [union ...] [group by ...] [having ...] [order by ...];
1
2
3
4
5
6
7START TRANSACTION
sqlstart transaction;
1UPDATE
sqlupdate tablename set columnname = value, ... [where ...];
1
2
3
附录 D MySQL 数据类型
书中列出的类型限制是对应当时的 MySQL 5 版本的,和最新的 MySQL 5 中的已经不太一致了。这里仅供参考,还是要以对应版本的官方文档为准。如 5.7 版本的可以参考这里:MySQL 5.7 Reference Manual / Data Types
D.1 串数据类型
数据类型 | 说明 |
---|---|
CHAR | 1~255 个字符的定长串。它的长度必须在创建时指定,否则 MySQL 假定为 CHAR(1) |
ENUM | 接收最多 64K 个串组成的一个预定义集合的某个串 |
LONGTEXT | 与 TEXT 相同,但最大长度为 4GB |
MEDIUMTEXT | 与 TEXT 相同,但最大长度为 16K |
SET | 接收最多 64 个串组成的一个预定义集合的零个或多个串 |
TEXT | 最多长度为 64K 的变长文本 |
TINYTEXT | 与 TEXT 相同,但最大长度为 255 字节 |
VARCHAR | 长度可变,最多不超过 VARCHAR(n) ,则可存储 0 到 n 个字符的变长串(其中 n <= |
D.2 数值数据类型
所有数值类型数据(除 BIT 和 BOOLEAN 之外),都可以有符号或无符号。默认为有符号。
数据类型 | 说明 |
---|---|
BIT | 位字段,1~64 位 |
BIGINT | 整数值 |
BOOLEAN(或 BOOL) | 布尔标识,或者为 0 或者为 1 |
DECIMAL(或 DEC) | 精度可变的浮点数 |
DOUBLE | 双精度浮点数 |
FLOAT | 单精度浮点数 |
INT(或 INTEGER) | 整数值 |
MEDIUMINT | 整数值 |
REAL | 4 字节的浮点数 |
SMALLINT | 整数值 -32768~32767 |
TINYINT | 整数值 -128~127 |
D.3 日期和时间数据类型
数据类型 | 说明 |
---|---|
DATE | 表示 1000-01-01 ~ 9999-12-31 的日期,格式为 YYYY-MM-DD |
DATETIME | DATE 和 TIME 的组合 |
TIMESTAMP | 功能和 DATETIME 相同,但范围较小 |
TIME | 格式为 HH:MM:SS |
YEAR | 用 2 位数字表示,范围是 70(1970 年)~69(2069 年),用 4 位数字表示,范围是 1901 年~2155 年 |
D.4 二进制数据类型
数据类型 | 说明 |
---|---|
BLOB | blob 最大长度为 64KB |
MEDIUMBLOD | blob 最大长度为 16MB |
LONGBLOB | blob 最大长度为 4GB |
TINYBLOD | blob 最大长度为 255 字节 |