管理执行计划 - 计划绑定 - 《OceanBase v2.2.30 官方教程》

OUTLINE 视图－gv$outline
创建 OUTLINE
- 使用 SQL_TEXT 创建 OUTLINE
- 使用 SQL_ID 创建 OUTLINE
删除 OUTLINE
确定 OUTLINE 创建生效
计划绑定与执行计划缓存关系

在系统上线前，可以直接在 SQL 语句中添加 HINT，控制优化器按 HINT 指定的行为进行计划生成。

但对于已上线的业务，如果出现优化器选择的计划不够优化时，则需要在线进行计划绑定，即无需业务进行 SQL 更改，而是通过 DDL 操作将一组 HINT 加入到 SQL 中，从而使优化器根据指定的一组 HINT，对该 SQL 生成更优计划。我们将该组 HINT 称为 OUTLINE，通过对某条 SQL 创建 OUTLINT 可实现计划绑定。

OUTLINE 视图－gv$outline

字段名称	类型	描述
tenant_id	bigint(20)	租户 ID
database_id	bigint(20)	数据库 ID
outline_id	bigint(20)	outline ID
database_name	varchar(128)	数据库名称
outline_name	varchar(128)	outline 名称
visible_signature	varchar(32768)	signature 的反序列化结果，为了便于查看 signature 的信息
sql_text	varchar(32768)	创建 outline 时，在 on clause 中指定的 SQL
outline_target	varchar(32768)	创建 outline 时，在 to clause 中指定的 SQL
outline_sql	varchar(32768)	具有完整 outline 信息的 SQL

创建 OUTLINE

OceanBase 数据库支持通过两种方式创建 OUTLINE，一种是通过 SQL\_TEXT (用户执行的带参数的原始语句)，另一种是通过 SQL\_ID 创建。

注意

创建 OUTLINE 需要进入对应 database 下执行。

使用 SQL_TEXT 创建 OUTLINE

使用 SQL_TEXT 创建 OUTLINE 后，会生成一个 key-value 对存储在 map 中，其中 key 为绑定的 SQL 参数化后的问题(具体参数化原则可参考快速参数化)，value 为绑定的 HINT。

使用 SQL_TEXT 创建 OUTLINE 的语法如下：

CREATE [OR REPLACE] OUTLINE outline_name ON stmt [ TO target_stmt ]

说明如下：

指定 OR REPLACE 后，可以对已经存在执行计划进行 replace。
其中 stmt 一般为一个带有 HINT 和原始参数的 DML 语句。
如果不指定 TO target_stmt，则表示如果数据库接受的 SQL 参数化后与 stmt 去掉 HINT 参数化文本相同，则将该 SQL 绑定 stmt 中 HINT 生成执行计划。
如果期望对含有 HINT 的语句进行固定计划，则需要 TO target_stmt 来指明原始的 SQL。

注意

在使用 target_stmt 时，严格要求 stmt 与 target_stmt 在去掉 HINT 后完全匹配。

示例如下：

CREATE TABLE t1 (c1 int primary key, c2 int, c3 int, index idx_c2(c2));
  INSERT INTO t1 values(1, 1, 1), (2, 2, 2), (3, 3, 3);
  SELECT * FROM t1 WHERE c2 = 1\G;
Query Plan: 
===================================
|ID|OPERATOR  |NAME|EST. ROWS|COST|
-----------------------------------
|0 |TABLE SCAN|t1  |1        |37  |
===================================

优化器选择了走主键扫描，而如果数据量很增大后，执行索引 idx_c2，该 SQL 会更优化。此时可以通过创建 OUTLINE 将该 SQL 绑定执行索引计划。

根据如下 SQL 语句，创建 OUTLINE：

CREATE OUTLINE otl_idx_c2 
       ON SELECT/*+ index(t1 idx_c2)*/ * FROM t1 WHERE c2 = 1;

使用 SQL_ID 创建 OUTLINE

使用 SQL_ID 创建 OUTLINE 的语法如下：

CREATE OUTLINE outline_name ON sql_id USING HINT  hint_text;

说明如下：

sql_id 为需要绑定的 SQL 对应的 SQL_ID。SQL_ID 可通过以下方式获取：
查询 gv$plan_cache_plan_stat 表获取
查询 gv$sql_audit 表获取
通过参数化的原始 SQL，使用 MD5 生成 SQL_ID 。可参考如下脚本生成对应 SQL 的 SQL_ID。

import hashlib
    sql_text='SELECT * FROM t1 WHERE c2 = ?'
    sql_id=hashlib.md5(sql_text.encode('utf-8')).hexdigest().upper()
    print(sql_id)

使用 SQL_ID 绑定 OUTLINE，如下例所示：

CREATE OUTLINE otl_idx_c2 
     ON "ED570339F2C856BA96008A29EDF04C74" 
     USING HINT /*+ index(t1 idx_c2)*/ ;

HINT 格式为 /+ xxx /，关于 HINT 说明的详细信息，请参考优化器HINT。
使用 SQL_TEXT 方式创建的 OUTLINE 会覆盖 sql_id 方式创建的 OUTLINE。SQL_TEXT 方式创建的优先级高。
如果 sql_id 对应的 SQL 语句已经有 HINT，则创建 OUTLINE 指定的 HINT 会覆盖原始语句中所有 HINT。

OUTLINE DATA

是优化器为了完全复现某一计划而生成的一组 HINT 信息，以 BEGIN_OUTLINE_DATA 开始，并以END_OUTLINE_DATA 结束。

OUTLINE DATA 可以通过 EXPLAIN EXTENDED 命令获得，如下例所示：

obclient> explain extended SELECT/*+ index(t1 idx_c2)*/ * FROM t1 WHERE c2 = 1;
 explain extended SELECT/*+ index(t1 idx_c2)*/ * FROM t1 WHERE c2 = 1;
| =========================================
|ID|OPERATOR  |NAME      |EST. ROWS|COST|
-----------------------------------------
|0 |TABLE SCAN|t1(idx_c2)|1        |88  |
=========================================
Outputs & filters: 
-------------------------------------
  0 - output([t1.c1(0x7ff95ab37448)], [t1.c2(0x7ff95ab33090)], [t1.c3(0x7ff95ab377f0)]), filter(nil), 
      access([t1.c2(0x7ff95ab33090)], [t1.c1(0x7ff95ab37448)], [t1.c3(0x7ff95ab377f0)]), partitions(p0), 
      is_index_back=true, 
      range_key([t1.c2(0x7ff95ab33090)], [t1.c1(0x7ff95ab37448)]), range(1,MIN ; 1,MAX), 
      range_cond([t1.c2(0x7ff95ab33090) = 1(0x7ff95ab309f0)])
Used Hint:
-------------------------------------
  /*+
      INDEX(@"SEL$1" "test.t1"@"SEL$1" "idx_c2")
  */
Outline Data:
-------------------------------------
  /*+
      BEGIN_OUTLINE_DATA
      INDEX(@"SEL$1" "test.t1"@"SEL$1" "idx_c2")
      END_OUTLINE_DATA
  */
Plan Type:
-------------------------------------
LOCAL
Optimization Info:
-------------------------------------
t1:table_rows:3, physical_range_rows:1, logical_range_rows:1, index_back_rows:1, output_rows:1, est_method:local_storage, optimization_method=cost_based, avaiable_index_name[idx_c2], pruned_index_name[t1]
level 0:
***********
   paths(@1101710651081553(ordering([t1.c2], [t1.c1]), cost=87.951827))

其中 OUTLINE DATA 如下例所示：

  /*+
      BEGIN_OUTLINE_DATA
      INDEX(@"SEL$1" "test.t1"@"SEL$1" "idx_c2")
      END_OUTLINE_DATA
  */

OUTLINE DATA 也是 HINT，因此可以用在计划绑定的过程中，如下例所示：

CREATE OUTLINE otl_idx_c2 
ON "ED570339F2C856BA96008A29EDF04C74" 
USING HINT /*+
      BEGIN_OUTLINE_DATA
      INDEX(@"SEL$1" "test.t1"@"SEL$1" "idx_c2")
      END_OUTLINE_DATA
  */;

删除 OUTLINE

OUTLINE 的语法如下：

DROP OUTLINE outline_name;

说明如下：

删除 OUTLINE 后，对应 SQL 重新生成计划时将不再依据绑定的 OUTLINE 生成。

注意

删除 OUTLINE 需要 outline_name 中指定 database 名或者 use database 后执行。

确定 OUTLINE 创建生效

确定创建的 OUTLINE 是否成功且符合预期，需要进行如下三步的验证：

确定是否创建 OUTLINE 成功。

通过查看 gv$outline 中的表，确认是否成功创建对应的 outline 名称的 OUTLINE。

select * from oceanbase.gv$outline where outline_name = 'otl_idx_c2'\G;
*************************** 1. row ***************************
        tenant_id: 1001
      database_id: 1100611139404776
       outline_id: 1100611139404777
    database_name: test
     outline_name: otl_idx_c2
visible_signature: SELECT * FROM t1 WHERE c2 = ?
         sql_text: SELECT/*+ index(t1 idx_c2)*/ * FROM t1 WHERE c2 = 1
   outline_target:
      outline_sql: SELECT /*+ BEGIN_OUTLINE_DATA INDEX(@"SEL$1" "test.t1"@"SEL$1" "idx_c2") END_OUTLINE_DATA*/* FROM t1 WHERE c2 = 1

确定新的 SQL 执行是否通过绑定的 outline 生成了新计划。

当绑定 OUTLINE 的 SQL 有新的流量查询后，查询 gv$plan_cache_plan_stat 表中该 SQL 对应的计划信息中 outline_id，如果 outline_id 是在 gv$outline 中查到的 outline_id 则表示该计划是按绑定的 outline 生成的执行计划，否则不是。

select sql_id, plan_id, statement, outline_id, outline_data 
     from oceanbase.gv$plan_cache_plan_stat 
     where statement like '%SELECT * FROM t1 WHERE c2 =%'\G
*************************** 1. row ***************************
      sql_id: ED570339F2C856BA96008A29EDF04C74
     plan_id: 17225
   statement: SELECT * FROM t1 WHERE c2 = ?
  outline_id: 1100611139404777
outline_data: /*+ BEGIN_OUTLINE_DATA INDEX(@"SEL$1" "test.t1"@"SEL$1" "idx_c2") END_OUTLINE_DATA*/

确定生成的执行计划是否符合预期。

确定是通过绑定的 outline 生成的计划后，需要确定生成的计划是否符合预期，可以通过查询gv$plan_cache_plan_stat 表查看 plan_cache 中缓存的执行计划形状, 具体查看方式可参考

实时执行计划展示。

select OPERATOR, NAME 
   from oceanbase.gv$plan_cache_plan_explain 
   where tenant_id = 1001 and ip = '10.101.163.87' 
   and port = 30474 and plan_id = 17225;
+--------------------+------------+
| OPERATOR           | NAME       |
+--------------------+------------+
|  PHY_ROOT_TRANSMIT | NULL       |
|   PHY_TABLE_SCAN   | t1(idx_c2) |
+--------------------+------------+

计划绑定与执行计划缓存关系

使用 SQL_TEXT 创建 OUTLINE 后, SQL 请求生成新计划查找 OUTLINE 使用的 key 与计划缓存使用的 key 相同，均是 SQL 参数化后的文本串；
当创建和删除 OUTLINE 后，对应 SQL 有新的请求时，会触发执行计划缓存中对应执行计划失效，更新为按绑定的 OUTLINE 生成的执行计划。