字符类型

相比于原始的openGauss,dolphin对于字符类型的修改主要为:

  1. 修改CHARACTER/NCHAR类型n的含义,n是指字符长度而不是字节长度。
  2. 所有的字符数据类型在对比时,均忽略尾部空格,如where条件过滤场景、join场景等。例如 ‘a’::text = ‘a ‘::text 为真。需要特别注意的是,对于VARCHAR、VARCHAR2、NVARCHAR2、NVARCHAR、TEXT、CLOB类型,只有GUC参数 string_hash_compatible 为on的情况下,hash join以及hash agg才会忽略尾部空格。
  3. 新增NATIONAL VARCHAR(n),为NVARCHAR2(n)类型的别名,n是指字符长度。
  4. 新增TEXT支持可选的修饰符(n),即支持TEXT(n)的用法,n无实际意义,不影响任何表现。
  5. 新增TINYTEXT(n)/MEDIUMTEXT(n)/LONGTEXT(n)数据类型,是TEXT的别名,n无实际作用,不影响任何表现。

表 1 字符类型

名称

描述

存储空间

CHAR(n)

CHARACTER(n)

NCHAR(n)

定长字符串,不足补空格。n是指字符长度,如不带精度n,默认精度为1。

最大为10MB。

NATIONAL VARCHAR(n)

变长字符串。是NVARCHAR2(n)类型的别名。n是指字符长度。

最大为10MB。

TEXT(n),

TINYTEXT(n),

MEDIUMTEXT(n),

LONGTEXT(n)

变长字符串。n无实际含义,不影响任何表现

最大为1GB-1,但还需要考虑到列描述头信息的大小, 以及列所在元组的大小限制(也小于1GB-1),因此TEXT类型最大大小可能小于1GB-1。

示例:

  1. --创建表。
  2. openGauss=# CREATE TABLE char_type_t1
  3. (
  4. CT_COL1 CHARACTER(4),
  5. CT_COL2 TEXT(10),
  6. CT_COL3 TINYTEXT(11),
  7. CT_COL4 MEDIUMTEXT(12),
  8. CT_COL5 LONGTEXT(13)
  9. );
  10. --查看表结构
  11. openGauss=# \d char_type_t1
  12. Table "public.char_type_t1"
  13. Column | Type | Modifiers
  14. ---------+--------------+-----------
  15. ct_col1 | character(4) |
  16. ct_col2 | text |
  17. ct_col3 | text |
  18. ct_col4 | text |
  19. ct_col5 | text |
  20. --插入数据
  21. openGauss=# INSERT INTO char_type_t1 VALUES('四个字符');
  22. openGauss=# INSERT INTO char_type_t1 VALUES('e ');
  23. --查看数据
  24. openGauss=# SELECT CT_COL1,length(CT_COL1) FROM char_type_t1;
  25. ct_col1 | length
  26. ----------+--------
  27. 四个字符 | 4
  28. e | 1
  29. (2 rows)
  30. --过滤数据
  31. openGauss=# SELECT CT_COL1 FROM char_type_t1 WHERE CT_COL1 = 'e';
  32. ct_col1
  33. ---------
  34. e
  35. (1 row)
  36. openGauss=# SELECT CT_COL1 FROM char_type_t1 WHERE CT_COL1 = 'e ';
  37. ct_col1
  38. ---------
  39. e
  40. (1 row)
  41. --删除表
  42. openGauss=# DROP TABLE char_type_t1;