全部产品
Search
文档中心

云原生大数据计算服务 MaxCompute:REGEXP_EXTRACT

更新时间:Jun 15, 2023

将字符串source按照pattern的分组规则进行字符串匹配,返回第groupid个组匹配到的字符串内容。

命令格式

string regexp_extract(string <source>, string <pattern>[, bigint <groupid>])

参数说明

  • source:必填。STRING类型,待拆分的字符串。

  • pattern:必填。STRING类型常量或正则表达式。待匹配的模型。更多正则表达式编写规范,请参见正则表达式规范

  • groupid:可选。BIGINT类型常量,必须大于等于0。

说明

数据以UTF-8格式保存。对于中文字符可以用对应的16进制编码表示,中文字符编码的范围是[\\x{4e00},\\x{9fa5}]

返回值说明

返回STRING类型。返回规则如下:

  • 如果pattern为空串或pattern中没有分组,返回报错。

  • groupid非BIGINT类型或小于0时,返回报错。不指定时默认为1,表示返回第一个组。如果groupid等于0,则返回满足整个pattern的子串。

  • sourcepatterngroupid值为NULL时,返回NULL。

相关函数

REGEXP_EXTRACT函数属于字符串函数,更多查找字符串、转换字符串格式的相关函数请参见字符串函数