使用CO_HASH分區策略實現多分區列的協同路由-雲原生資料庫 PolarDB-阿里雲

版本要求

PolarDB-X版本必須為5.4.18-17047709及以上。

適用情境

在電商情境，業務訂單表常常會出現以下現象：業務訂單表的兩個列或多個列之間的值存在一種協同關係，比如，常見的訂單表的order_id與buyer_id的後N位元字總是相同的。由於業務訂單表的資料量一般偏大，使用者考慮在對訂單表進行水平切分時，能讓訂單表同時按order_id或buyer_id的後N位元字進行水平切分。這樣業務應用在一些下單情境的事務中，應用無論是從order_id=維度讀寫還是buyer_id=?維度進行讀寫，均能路由到同一個物理分區，從而避免出現大量的跨庫事務。

那麼，PolarDB-X的CO_HASH分區策略就是專用來協助業務解決上述情境所碰到的分區問題：

分區表的多個分區列的取值之間存在特殊的協同關係（比如，後N位的數值相同、前N位的資料相同，等等）；
分區表支援同時按多個不同的分區列進行獨立路由（即這些分區列之間沒有首碼關係，查詢單獨帶上各個分區列的等值查詢條件均能進行分區裁剪）；

文法

要求PolarDB-X支援同時按多個不同的分區列的不同取值進行路由。

CREATE TABLE ... 
PARTITION BY CO_HASH(partition_expr_list) 
PARTITIONS number;

partition_expr_list:
  partition_expr, partition_expr [, partition_expr, ...]
  
partition_expr:
    partition_column	
  | partition_func(partition_column)


# 分區函數定義
partition_func：
    RIGHT
  | LEFT
  | SUBSTR
  | SUBSTRING

說明

CO_HASH分區策略與HASH/KEY分區策略的主要區別請參見與Hash/Key分區策略的主要區別。

限制

分區列使用分區函數時，不允許嵌套多層的分區函數，例如SUBSTR(SUBSTR(c1,-6),4)。
所有分區列的類型必須完全一致，包括：
- 分區列類型的charset與collation；
- 分區列類型的長度定義或精度定義等。
預設最大分區數目不允許超過8192。
預設最大分區列數目不允許超過5個。
分區函數的使用限制：
- RIGHT
- LEFT
- SUBSTR

樣本

假如業務有一張訂單表orders，它的每一行錄的order_id與buyer_id的後6位的數字總是相同的。

那麼，如果使用者想對訂單表orders同時按order_id與buyer_id兩個列的後6位元字進行分區，並期望同一行order_id與buyer_id這兩個列的等值查詢條件均能路由到同一個分區的話，可以使用如下的文法定義：

CREATE TABLE t_orders(
 id bigint not null auto_increment, 
 seller_id bigint,
 order_id bigint, 
 buyer_id bigint,
 order_time datetime not null,
 primary key(id)
) 
PARTITION BY CO_HASH(
  	RIGHT(`order_id`,6) /*取c1列的後6位字元*/,
  	RIGHT(`buyer_id`,6) /*取c2列的後6位字元*/
)  
PARTITIONS 8;

CO_HASH與其它分區函數的用法，請參見分區函數。

：CO_HASH分區

版本要求

適用情境

文法

限制

樣本

相關限制

資料類型限制

分區列相關限制