SQL 101 by Mick

Chapter 5 复杂查询

5-1 视图

学习重点:

从SQL的角度来看, 视图和表是相同的, 两者的区别在于表中保存的是实际的数据, 而视图中保存的是SELECT语句(视图本身并不存储数据).
使用视图, 可以轻松完成跨多表查询数据等复杂操作.
可以将常用的SELECT语句做成视图来使用.
创建视图需要使用CREATE VIEW语句.
视图包含"不能使用ORDER BY"和"可对其进行有限制的更新"两项限制.
删除视图需要使用DROP VIEW语句.

视图和表

一个新的工具-视图

视图究竟是什么呢?
- 如果用一句话概述的话, 就是"从SQL的角度来看视图就是一张表"
- 实际上, 在SQL语句中并不需要区分哪些是表, 哪些是视图, 只需要知道在更新时它们之间存在一些不同就可以了
那么视图和表的区别只有一个
- 就是"是否保存了实际的数据", 使用视图时并不会将数据保存到存储设备之中, 而且也不会将数据保存到其他任何地方
- 实际上视图保存的是SELECT语句, 我们从视图中读取数据时, 视图会在内部执行该SELECT语句并创建出一张临时表
视图的两个优点:
1. 由于视图无需保存数据, 因此可以节省存储设备的容量
2. 可以将频繁使用的SELECT语句保存成视图, 这样就不用每次都重新书写了

实例1: 通过视图等SELECT语句保存数据

SELECT product_type, SUM(sale_price), SUM(purchase_price)
FROM Product
GROUP BY product_type;
-- 一个SELECT语句把各类商品的总售价和进货价显示出来

创建视图的方法

语法1: 创建视图的CREATE VIEW语句

SELECT语句需要书写在AS关键字之后.
SELECT语句中列的排列顺序和视图中列的排列顺序相同, SELECT语句中的第1列就是视图中的第1列, SELECT语句中的第2列就是视图中的第2列
定义视图时可以使用任何SELECT语句, 既可以使用WHERE, GROUP BY, HAVING, 也可以通过SELECT *来指定全部列

CREATE VIEW 视图名称(<视图列名1>, <视图列名2>, ......)
AS
<SELECT语句>

实例1+2: 通过视图等SELECT语句保存数据

-- 实例1, 一个SELECT语句把各类商品的总售价和进货价显示出来
SELECT product_type, SUM(sale_price), SUM(purchase_price)
FROM Product
GROUP BY product_type;

-- 把实例1的语句变成一个VIEW
CREATE VIEW Product_Price_Summary (product_type, sale_sum, purchase_sum)
AS
SELECT product_type, SUM(sale_price), SUM(purchase_price)
FROM Product
GROUP BY product_type;

-- 实例2, ProductSum视图
CREATE VIEW ProductSum (product_type, cnt_product)
AS
SELECT product_type, COUNT(*)
FROM Product
GROUP BY product_type;

实例3: 使用视图(和查询表一样的)

SELECT product_type, cnt_product
FROM ProductSum;

需要频繁进行汇总时, 就不用每次都使用GROUP BY和COUNT函数写SELECT语句来从Product表中取得数据了.

创建出视图之后, 就可以通过非常简单的SELECT语句, 随时得到想要的汇总结果.

Product表中的数据更新之后, 视图也会自动更新, 非常灵活方便

注: 在Jetbrains IDE中, table和view会被区分在两个子路径内

使用视图的查询

首先执行定义视图的SELECT语句(从原表获得)
根据得到的结果, 再执行在FROM子句中使用视图的SELECT语句(从本视图中获得)
- 也就是说, 使用视图的查询通常需要执行至少2条以上的SELECT语句
- 因为可以在视图中再创建子视图, 从而得到多重视图
  - 虽然语法上没有错误, 但是我们还是应该尽量避免在视图的基础上创建视图.
  - 对多数DBMS来说, 多重视图会降低SQL的性能

实例4: 视图ProductSumJim (从ProductSum视图中再分离一个纯办公用品的视图)

CREATE VIEW ProductSumJim (product_type, cnt_product)
AS
SELECT product_type, cnt_product
FROM ProductSum
WHERE product_type = '办公用品';

视图的限制1 - 定义视图时不能使用ORDER BY子句

实例: 错误示范

CREATE VIEW ProductSum (product_type, cnt_product)
AS
SELECT product_type, COUNT(*)
FROM Product
GROUP BY product_type
ORDER BY product_type; -- 这里注意, 不是每个DBMS都支持

虽然之前我们说过在定义视图时可以使用任何SELECT语句

但其实有一种情况例外, 那就是不能使用ORDER BY子句
因为视图和表一样, 数据行都是没有顺序的
- 但是psql支持视图的排序

视图的限制2 - 对视图进行更新

对于INSERT, DELETE, UPDATE这类更新语句(更新数据的SQL)来说, 会怎么样呢?

实际上, 虽然这其中有很严格的限制, 但是某些时候也可以对视图进行更新.
标准SQL中有这样的规定: 如果定义视图的SELECT语句能够满足某些条件, 那么这个视图就可以被更新
- SELECT子句中未使用DISTINCT
- FROM子句中只有一张表
- 未使用GROUP BY子句
- 未使用HAVING子句
  - 视图归根结底还是从表派生出来的, 因此, 如果原表可以更新, 那么视图中的数据也可以更新.
  - 反之亦然, 如果视图发生了改变, 而原表没有进行相应更新的话, 就无法保证数据的一致性了

实例5: 可以更新的视图

CREATE VIEW ProductJim (product_id, product_name, product_type, sale_price, purchase_price, regist_date)
AS
SELECT *
FROM Product
WHERE product_type = '办公用品';

实例6: 向视图中添加数据行

INSERT INTO ProductJim VALUES ('0009', '印章', '办公用品', 95, 10, '2009-11-30');

不但在视图中添加了, 在原表中也加了一行数据

注意: psql视图如果为只读时的处理情况

由于PostgreSQL中的视图会被初始设定为只读, 所以执行实例6中的INSERT语句时, 会发生错误

似乎PostgreSQL 11中已经没有这个问题

实例6A: 允许PostgreSQL对视图进行更新

CREATE OR REPLACE RULE insert_rule
AS ON INSERT
TO ProductJim DO INSTEAD
INSERT INTO Product VALUES (
    new.product_id,
    new.product_name,
    new.product_type,
    new.sale_price,
    new.purchase_price,
    new.regist_date);

删除视图

语法2: 删除视图需要使用DROP VIEW语句

可以一次删除多个VIEW
psql不支持删除VIEW中的COLUMN

DROP VIEW 视图名称(<视图1>, <视图2>, ......)

实例7: 删除整个视图ProducSum

DROP VIEW ProductSum;         -- 若有关联视图可能出错
DROP VIEW ProductSum CASCADE; -- 顺便删除关联视图

在PostgreSQL中, 如果删除以视图为基础创建出来的多重视图, 由于存在关联的视图, 因此会发生错误

使用CASCADE后缀可以将关联视图删除

5-2 子查询

学习重点:

一言以蔽之, 子查询就是一次性视图(SELECT语句).
- 与视图不同, 子查询在SELECT语句执行完毕之后就会消失.
由于子查询需要命名, 因此需要根据处理内容来指定恰当的名称.
标量子查询就是只能返回一行一列的子查询.

子查询和视图

实例8+9: 对比创建一个ProductSum的视图 vs. 创建一个子查询

-- From实例2, ProductSum视图
CREATE VIEW ProductSum (product_type, cnt_product)
AS
SELECT product_type, COUNT(*)
FROM Product
GROUP BY product_type;

-- 等量子查询
SELECT product_type, cnt_product  -- 外层查询
    FROM ( 
        SELECT product_type, COUNT(*) AS cnt_product    --|
        FROM Product                                    --|- 内层查询
        GROUP BY product_type                           --|
    ) AS ProductSum   -- 这个是内层查询的alias, 名字只是一次性使用, 只供外层查询时调用, 不会被保存;

子查询就是将用来定义视图的SELECT语句直接用于FROM子句当中

实例10: 尝试增加子查询的嵌套层数

SELECT product_type, cnt_product
    FROM (SELECT *
        FROM (SELECT product_type, COUNT(*) AS cnt_product
                FROM Product
                GROUP BY product_type) AS ProductSum  -- 最内层alias
        WHERE cnt_product = 4) AS ProductSum2;  -- 中层alias

随着子查询嵌套层数的增加, SQL语句会变得越来越难读懂, 性能也会越来越差. 因此, 请大家尽量避免使用多层嵌套的子查询

子查询的名称

之前的例子中我们给子查询设定了ProductSum等名称.
原则上子查询必须设定名称, 因此请大家尽量从处理内容的角度出发为子查询设定恰当的名称

标量子查询

标量子查询Scalar Subquery就是返回单一值的子查询

标量的意思是单一
大部分子查询都会返回多行结果
而标量子查询则有一个限制,必须返回一行一列的结果, 也就是单一值
- 标量子查询的返回值可以用在 = 或者 <> 这样需要单一值的比较运算符之中

实例11: 计算平均销售单价的标量子查询

-- 错误示范: 在WHERE子句中不能使用聚合函数
SELECT product_id, product_name, sale_price
FROM Product
WHERE sale_price > AVG(sale_price);

-- 正确操作, 先算平均销售价
SELECT AVG(sale_price)
FROM Product;

-- 然后应用于前例中, 以避免Where子句中不能使用函数的问题:
SELECT product_id, product_name, sale_price
FROM Product
WHERE sale_price > (SELECT AVG(sale_price)   -- 这里就是标量子查询
                    FROM Product);

使用子查询的SQL会从子查询开始执行, 先查平均价

标量子查询的书写位置

标量子查询的书写位置并不仅仅局限于WHERE子句中
通常任何可以使用单一值的位置都可以使用
- 几乎所有的地方都可以使用

实例13: 在SELECT子句中使用标量子查询

SELECT product_id,
product_name,
sale_price,
(SELECT AVG(sale_price)
    FROM Product) AS avg_price
FROM Product;

实例14: 在HAVING子句中使用标量子查询

SELECT product_type, AVG(sale_price)
FROM Product
GROUP BY product_type
HAVING AVG(sale_price) > (SELECT AVG(sale_price)
                            FROM Product);

这里甄选出了平均售价高于全部商品平均售价的品类

使用标量子查询时的注意事项

该子查询绝对不能返回多行结果

也就是说, 如果子查询返回了多行结果, 那么它就不再是标量子查询, 而仅仅是一个普通的子查询了
- 因此不能被用在 = 或者 <> 等需要单一输入值的运算符当中, 也不能用在 SELECT 等子句当中

5-3 关联子查询

学习重点

关联子查询会在细分的组内进行比较时使用.
关联子查询和GROUP BY子句一样, 也可以对表中的数据进行切分.
关联子查询的结合条件如果未出现在子查询之中就会发生错误.

普通的子查询和关联子查询的区别

一个需求: 找出各类别中哪个商品的价格高于该类商品的平均价格

根据Product表, 厨房用具, 衣服, 办公用品简表:

商品名称	销售单价	商品名称	销售单价	商品名称	销售单价
菜刀	3000	T恤	1000	圆珠笔	100
高压锅	6800	运动T恤	4000	打孔器	500
叉子	500
擦菜板	880
平均价格	2795	平均价格	2500	均价格	300

根据以上, 每类产品中超过该类平均价格的产品为

厨房用具: 菜刀, 高压锅

衣服: 运动T恤

办公用品: 打孔器

实例15 + 16: 按照商品种类计算平均价格, 通过关联子查询按照商品种类对平均销售单价进行比较

-- 找出每类产品的平均价格
SELECT AVG(sale_price)
FROM Product
GROUP BY product_type;

-- 以上不能用于下列操作
SELECT product_id, product_name, sale_price
FROM Product
WHERE sale_price > (SELECT AVG(sale_price)
                    FROM Product
                    GROUP BY product_type);  -- 因为这里不是标量子查询, 出现了三个数据

-- 使用关联子查询就可以解决问题
SELECT product_type, product_name, sale_price
    FROM Product AS P1
WHERE sale_price > (SELECT AVG(sale_price)
                        FROM Product AS P2
                    WHERE P1.product_type = P2.product_type   --- 调用P1和P2的关联性来形成每个类别的单独子查询对比
                        GROUP BY product_type);

语法extra: 关联子查询

这里起到关键作用的就是在子查询中添加的WHERE子句的条件
- 这次由于作为比较对象的都是同一张Product表, 因此为了进行区别, 分别使用了P1和P2两个别名.
- 在使用关联子查询时, 需要在表所对应的列名之前加上表的别名, 以<表名>.<列名>的形式记述

SELECT product_type, product_name, sale_price
    FROM Product AS P1
WHERE sale_price > (SELECT AVG(sale_price)
                        FROM Product AS P2
                    WHERE P1.product_type = P2.product_type   --- 调用P1和P2的关联性来形成每个类别的单独子查询对比
                        GROUP BY product_type);

关联子查询也是用来对集合进行切分的

我们首先需要计算各个商品种类中商品的平均销售单价, 由于该单价会用来和商品表中的各条记录进行比较, 因此关联子查询实际只能返回1行结果. 这也是关联子查询不出错的关键. 如果商品种类发生了变化, 那么用来进行比较的平均单价也会发生变化, 这样就可以将各种商品的销售单价和平均单价进行比较了.

结合条件一定要写在子查询中

实例extra: 错误的关联子查询示范

SELECT product_type, product_name, sale_price
    FROM Product AS P1
WHERE P1.product_type = P2.product_type      --- 关联条件放在外层查询
    AND sale_price > (SELECT AVG(sale_price)
                        FROM Product AS P2
                    GROUP BY product_type);

上述SELECT语句只是将子查询中的关联条件移到了外层查询之中, 其他并没有任何更改.

但是, 该SELECT语句会发生错误, 不能正确执行.

允许存在这样的书写方法可能并不奇怪, 但是SQL的规则禁止这样的书写方法

原因就是关联名称的作用域

作用域(scope)就是生存范围, 也就是说, 关联名称存在一个有效范围的限制

子查询内部设定的关联名称, 只能在该子查询内部使用, "内部可以看到外部, 而外部看不到内部"

SQL是按照先内层子查询后外层查询的顺序来执行的.

这样, 子查询执行结束时只会留下执行结果, 作为抽出源的P2表其实已经不存在了

消失的其实只是P2这个名称而已, Product表以及其中的数据还是存在

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Chapter_5_Complex_Query.md

Chapter_5_Complex_Query.md

SQL 101 by Mick

Chapter 5 复杂查询

5-1 视图

视图和表

创建视图的方法

视图的限制1 - 定义视图时不能使用ORDER BY子句

视图的限制2 - 对视图进行更新

注意: psql视图如果为只读时的处理情况

删除视图

5-2 子查询

子查询和视图

子查询的名称

标量子查询

标量子查询的书写位置

使用标量子查询时的注意事项

5-3 关联子查询

普通的子查询和关联子查询的区别

关联子查询也是用来对集合进行切分的

结合条件一定要写在子查询中

Files

Chapter_5_Complex_Query.md

Latest commit

History

Chapter_5_Complex_Query.md

File metadata and controls

SQL 101 by Mick

Chapter 5 复杂查询

5-1 视图

视图和表

创建视图的方法

视图的限制1 - 定义视图时不能使用ORDER BY子句

视图的限制2 - 对视图进行更新

注意: psql视图如果为只读时的处理情况

删除视图

5-2 子查询

子查询和视图

子查询的名称

标量子查询

标量子查询的书写位置

使用标量子查询时的注意事项

5-3 关联子查询

普通的子查询和关联子查询的区别

关联子查询也是用来对集合进行切分的

结合条件一定要写在子查询中