数据库总结

16 August 2021 - 12 mins read time
Tags: 基础知识学习

1 SQL

1.1 基础

模式：定义了如何存储数据、存储了什么样的数据及数据如何分解信息。

主键：值不允许被更改或复用。

注释：

## comment
FROM mytable; --comment
/* comment
   comment
*/

创建数据库：

CREATE DATABASE myDatabase;
USE myDatabase;

1.2 创建表

CREATE TABLE myTable(
    id INT NOT NULL AUTO_INCREMENT,
    col_1 INT NOT NULL DEFAULT 1,
    col_2 VARCHAR(45) NULL,
    col_3 DATE NULL,
    PRIMARY KEY('id')
);

1.3 修改表

添加列

ALTER TABLE myTable
ADD col CHAR(20);

删除列

ALTER TABLE myTable;
DROP COLUMN col;

删除表

DROP TABLE myTable;

1.4 插入

普通插入

INSERT INTO myTable(col_1, col_2)
VALUES(val_1, val_2);

插入检索出来的数据

INSERT INTO myTable(col_1, col_2)
SELECT col_1, col_2
FROM myTable2;

将一个表中的内容插入到一个新表

CREATE TABLE newTable AS
SELECT * FROM myTable;

1.5 更新

UPDATE myTable
SET col = val
WHERE id = 1;

1.6 删除

DELETE FROM myTable
WHERE id = 1;

TRUNCATE TABLE用于删除表中所有行：

TRUNCATE TABLE myTable;

1.7 查询

DISTINCT: 相同值只会出现一次，其作用于所有列。

SELECT DISTINCT col_1, col_2
FROM myTable;

LIMIT：限制返回的行数。

前5行：

SELECT *
FROM myTable
LIMIT 5;

返回第3-5行，查询3条数据，索引从3-5，第3条记录到第5条记录

SELECT *
FROM myTable
LIMIT 2, 3;

1.8 排序

ASC：升序(默认)
DESC：降序

SELECT *
FROM myTable
ORDER BY col_1 DESC, col_2 ASC;

1.9 过滤

SELECT *
FROM myTable
WHERE col IS NULL;

WHERE子句可用的操作符：

| 操作符 | 说明 | | - | - | | = | | | < | | | > | | | <>!= | 不等于 | | <=!> | 小于等于 | | >=!< | 大于等于 | | BETWEEN | 在两个值之间 | | IS NULL | 为空 |

** NULL不等于0或空字符串

AND / OR：连接多个过滤条件 IN：匹配一组值 NOT：否定一个条件

1.10 通配符

% 匹配>=个任意字符
_ 匹配==1个任意字符
[] 匹配集合内的字符

SELECT *
FROM myTable
WHERE col LIKE '[^AB]'  -- 不以A或B开头的任意文本

1.11 计算字段

在数据库服务器上完成数据的转换和格式化的工作往往比客户端上快得多，并且转换和格式化后的数据量更少的话可以减少网络通信量。

计算字段通常需要使用 AS 来取别名，否则输出的时候字段名为计算表达式。

SELECT col_1 * col_2 AS alias
FROM myTable;

CONCAT() 用于连接两个字段。许多数据库会使用空格把一个值填充为列宽，因此连接的结果会出现一些不必要的空格，使用 TRIM() 可以去除首尾空格。

SELECT CONCAT(TRIM(col_1), '(', TRIM(col_2), ')') AS concat_col
FROM myTable;

1.12 函数

汇总

函数	说明
AVG()	返回某列的平均值
COUNT()	返回某列的行数
MAX()	返回某列的最大值
MIN()	返回某列的最小值
SUM()	返回某列值之和

AVG()会忽略NULL行。

SELECT AVG(DISTINCT col_1) AS avg_col
FROM myTable;

文本处理

函数	说明
LEFT()	左边的字符
RIGHT()	右边的字符
LTRIM()	去除左边的空格
RTRIM()	去除右边的空格
LOWER()	转换为小写字母
UPPER()	转换为大写字母
LENGTH()	长度
SOUNDEX()	转换为语音值

SOUNDEX() 可以将一个字符串转换为描述其语音表示的字母数字模式。

SELECT *
FROM myTable
WHERE SOUNDEX(col_1) = SOUNDEX('apple');

日期和时间处理

日期格式： YYYY-MM-DD
时间格式： HH:MM:SS

函数	说明
ADDDATE()	增加一个日期(天、周等)
ADDTIME()	增加一个时间(时、分等)
CURDATE()
CURTIME()
DATE()	返回日期时间的日期部分
DATEDIFF()	计算两个日期之差
DATE_ADD()
DATE_FORMAT()	返回一个格式化的日期或时间串
DAY()
DAYOFWEEK()	返回星期几
HOUR()
MINUTE()
MONTH()
NOW()
SECOND()
TIME()	返回一个日期时间的时间部分
YEAR()	返回一个日期的年份部分

SELECT NOW();

数值处理

函数	说明
SIN()
COS()
TAN()
ABS()
SQRT()
MOD()
EXP()
PI()
RAND()	返回0-1的随机数

1.13 分组

把具有相同的数据值的行放在同一组中。

可以对同一分组数据使用汇总函数进行处理，例如求分组数据的平均值等。

指定的分组字段除了能按该字段进行分组，也会自动按该字段进行排序。

SELECT col, COUNT(*) AS num
FROM myTable
GROUP BY col;

GROUP BY 自动按分组字段进行排序，ORDER BY 也可以按汇总字段来进行排序。

SELECT col, COUNT(*) AS num
FROM myTable
GROUP BY col
ORDER BY num;

WHERE 过滤行，HAVING 过滤分组，行过滤应当优先于行分组。

SELECT col, COUNT(*) AS num
FROM myTable
WHERE col > 2
GROUP BY col
HAVING num >= 2;

1.14 子查询

子查询中只能返回一个字段的数据。

可以将子查询的结果作为 WHRER 语句的过滤条件：

SELECT *
FROM myTable
WHERE col_1 IN ( SELECT col_2 FROM myTable2);

1.15 连接

连接用于连接多个表，使用 JOIN 关键字，并且条件语句使用 ON 而不是 WHERE。

连接可以替换子查询，并且比子查询的效率一般会更快。

可以用 AS 给列名、计算字段和表名取别名，给表名取别名是为了简化 SQL 语句以及连接相同表。

内连接

又称等值连接，使用INNER JOIN关键字。

SELECT A.value, B.value
FROM table_A AS A INNER JOIN table_B AS B
ON A.key = B.key

可以不明确使用 INNER JOIN，而使用普通查询并在 WHERE 中将两个表中要连接的列用等值方法连接起来。

SELECT A.value, B.value
FROM table_A AS A, table_B AS B
WHERE A.key = B.key;

自连接

自连接可以看成内连接的一种，只是连接的表是自身而已。

一张员工表，包含员工姓名和员工所属部门，要找出与 Jim 处在同一部门的所有员工姓名。

子查询版本：

SELECT name
FROM employee
WHERE department = (
    SELECT department
    FROM employee
    WHERE name = "Jim"
);

自连接版本：

SELECT e1.name
FROM employee AS e1 INNTER JOIN employee AS e2
ON e1.department = e2.department AND e2.name = "Jim";

自然连接

自然连接是把同名列通过等值测试连接起来的，同名列可以有多个。

内连接和自然连接的区别：内连接提供连接的列，而自然连接自动连接所有同名列。

SELECT A.value, B.value
FROM table_A AS A NATURAL JOIN table_B AS B;

外连接

外连接保留了没有关联的那些行。分为左外连接，右外连接以及全外连接，左外连接就是保留左表没有关联的行。

检索所有顾客的订单信息，包括还没有订单信息的顾客：

SELECT Customers.cust_id, Customers.cust_name, Orders.order_id
FROM Customers LEFT OUTER JOIN Orders
ON Customers.cust_id = Orders.cust_id;

customers表：

cust_id	cust_name
1	a
2	b
3	c

orders表：

order_id	cust_id
1	1
2	1
3	3
4	3

结果：

cust_id	cust_name	order_id
1	a	1
1	a	2
3	c	3
3	c	4
2	b	NULL

1.16 组合查询

使用 UNION 来组合两个查询，如果第一个查询返回 M 行，第二个查询返回 N 行，那么组合查询的结果一般为 M+N 行。

每个查询必须包含相同的列、表达式和聚集函数。

默认会去除相同行，如果需要保留相同行，使用 UNION ALL。

只能包含一个 ORDER BY 子句，并且必须位于语句的最后。

SELECT col
FROM myTable
WHERE col = 1
UNION
SELECT col
FROM myTable
WHERE col = 2;

1.17 视图

视图是虚拟的表，本身不包含数据，也就不能对其进行索引操作。

对视图的操作和对普通表的操作一样。

视图具有如下好处：

简化复杂的 SQL 操作，比如复杂的连接；
只使用实际表的一部分数据；
通过只给用户访问视图的权限，保证数据的安全性；
更改数据格式和表示。

CREATE VIEW myView AS
SELECT Concat(col_1, col_2) AS concat_col, col_3 * col_4 AS compute_col
FROM myTable
WHERE col_5 = val;

1.18 存储过程

存储过程可以看成是对一系列 SQL 操作的批处理。

使用存储过程的好处：

代码封装，保证了一定的安全性；
代码复用；
由于是预先编译，因此具有很高的性能。

命令行中创建存储过程需要自定义分隔符，因为命令行是以 ; 为结束符，而存储过程中也包含了分号，因此会错误把这部分分号当成是结束符，造成语法错误。

包含 in、out 和 inout 三种参数。

给变量赋值都需要用 select into 语句。

每次只能给一个变量赋值，不支持集合的操作。

delimiter //
create procedure myprocedure(out ret int)
    begin
        declare y int;
        select sum(col_1)
        from myTable
        into y;
        select y*y into ret;
    end //
delimiter ;

1.19 游标

在存储过程中使用游标可以对一个结果集进行移动遍历。

游标主要用于交互式应用，其中用户需要对数据集中的任意行进行浏览和修改。

使用游标的四个步骤：

声明游标，这个过程没有实际检索出数据；
打开游标；
取出数据；
关闭游标；

delimiter //
create procedure myprocedure(out ret int)
    begin
        declare done boolean default 0;

        declare mycursor cursor for
        select col_1 from myTable;

        declare continue handler for sqlstate '02000' set done = 1;

        open mycursor;

        repeat
            fetch mycursor into ret;
            select ret;
        until done end repeat;

        close mycursor;
    end //
delimiter ;

1.20 触发器

触发器会在某个表执行以下语句时而自动执行：DELETE、INSERT、UPDATE。

触发器必须指定在语句执行之前还是之后自动执行，之前执行使用 BEFORE 关键字，之后执行使用 AFTER 关键字。BEFORE 用于数据验证和净化，AFTER 用于审计跟踪，将修改记录到另外一张表中。

INSERT 触发器包含一个名为 NEW 的虚拟表。

CREATE TRIGGER myTrigger AFTER INSERT ON myTable
FOR EACH ROW SELECT NEW.col into @result;

SELECT @result; -- 获取结果

DELETE 触发器包含一个名为 OLD 的虚拟表，并且是只读的。

UPDATE 触发器包含一个名为 NEW 和一个名为 OLD 的虚拟表，其中 NEW 是可以被修改的，而 OLD 是只读的。

MySQL 不允许在触发器中使用 CALL 语句，也就是不能调用存储过程。

1.21 事务管理

基本术语：

事务（transaction）指一组 SQL 语句；
回退（rollback）指撤销指定 SQL 语句的过程；
提交（commit）指将未存储的 SQL 语句结果写入数据库表；
保留点（savepoint）指事务处理中设置的临时占位符（placeholder），你可以对它发布回退（与回退整个事务处理不同）。

不能回退 SELECT 语句，回退 SELECT 语句也没意义；也不能回退 CREATE 和 DROP 语句。

MySQL 的事务提交默认是隐式提交，每执行一条语句就把这条语句当成一个事务然后进行提交。当出现 START TRANSACTION 语句时，会关闭隐式提交；当 COMMIT 或 ROLLBACK 语句执行后，事务会自动关闭，重新恢复隐式提交。

设置 autocommit 为 0 可以取消自动提交；autocommit 标记是针对每个连接而不是针对服务器的。

如果没有设置保留点，ROLLBACK 会回退到 START TRANSACTION 语句处；如果设置了保留点，并且在 ROLLBACK 中指定该保留点，则会回退到该保留点。

START TRANSACTION
// ...
SAVEPOINT delete_1
// ...
ROLLBACK TO delete_1
// ...
COMMIT

1.22 字符集

基本术语：

字符集为字母和符号的集合；
编码为某个字符集成员的内部表示；
校对字符指定如何比较，主要用于排序和分组。
除了给表指定字符集和校对外，也可以给列指定：

CREATE TABLE myTable
(col VARCHAR(10) CHARACTER SET latin COLLATE latin1_general_ci)
DEFAULT CHARACTER SET hebrew COLLATE hebrew_general_ci;

可以在排序、分组时指定校对：

SELECT *
FROM myTable
ORDER BY col COLLATE latin1_general_ci;

1.23 权限管理

MySQL 的账户信息保存在 mysql 这个数据库中。

USE mysql;
SELECT user FROM user;

创建账户时，新账户没有任何权限：

CREATE USER myuser IDENTIFIED BY 'mypassword';

修改账户名：

RENAME USER myuser TO newuser;

删除账户：

DROP USER myuser;

查看权限：

SHOW GRANTS FOR myuser;

赠予权限：

账户用 username@host 的形式定义，username@% 使用的是默认主机名。

GRANT SELECT, INSERT ON mydatabase.* TO myuser;

删除权限： GRANT 和 REVOKE 可在几个层次上控制访问权限：

整个服务器，使用 GRANT ALL 和 REVOKE ALL；
整个数据库，使用 ON database.*；
特定的表，使用 ON database.table；
特定的列；
特定的存储过程。

更改密码：

必须使用Password()函数进行加密

SET PASSWORD FOR myUser = Password('new_password');