news 2026/6/9 17:17:58

GBase 8c regexp函数功能说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GBase 8c regexp函数功能说明

一、序言

本文基于 GBase 兼容 Oracle 的 5 大正则系列函数测试用例整理,覆盖 REGEXP_LIKE、REGEXP_COUNT、REGEXP_INSTR、REGEXP_SUBSTR、REGEXP_REPLACE,完全对标 Oracle 数据库正则语法、参数规则、匹配标记(i/m/n/in/im)、换行.匹配逻辑、捕获分组、空值入参、异常入参校验规则,是数据库 Oracle 兼容语法落地、开发自测、迁移改造的参考文档。
本用例核心基准:所有 SQL 预期结果与 Oracle 原版执行结果保持一致,用于验证国产数据库 Oracle 兼容层正则引擎正确性。

二、正则修饰符(匹配模式,核心差异点)

标记含义(Oracle 标准规则)
i大小写不敏感匹配
m多行模式:^ 匹配每行开头、$匹配每行结尾,换行\n 切分行
n.默认​不匹配换行符 CHR (10);无 n/m 时.不能跨换行匹配
组合 in/im多标记叠加,同时开启忽略大小写 + 多行 / 不跨行规则

关键规则:默认.不能匹配换行;m 改变锚点 ^/$作用域、n 控制.是否吞换行,是整套测试核心基准。

通用约束

  1. 负数入参(起始位置、匹配次数、分组号)Oracle 统一抛异常,兼容库需同步抛出报错;
  2. 任意参数传入 NULL 遵循 Oracle 空值返回规则,分函数差异化处理;
  3. 正则捕获分组()支持序号取值,从 1 开始,0 代表完整匹配内容。

三、五大正则函数详细说明

3.1 REGEXP_LIKE 正则匹配判断

作用:判断字符串是否匹配正则,返回布尔(true/false),对标 Oracle WHERE 条件判断逻辑。

语法:REGEXP_LIKE(源字符串,正则表达式[,修饰符])

换行测试:a||CHR(10)||d 场景:
无修饰、m:.不能跨换行,匹配 a.d 不命中;
n:.可匹配换行,命中返回 true;
大小写 i:GREEN 中重复元音 ee,不带 i 区分大小写不匹配,带 i 忽略大小写命中;
多行 m:跨行文本 foo\nbar\nbaz,^bar 在 m 模式匹配行首 bar,默认不匹配;
组合标记 in/im:同时控制大小写 + 换行锚点规则。

适用场景:WHERE 条件模糊筛选、数据规则校验。

3.2 REGEXP_COUNT 正则匹配次数统计

作用:统计源串中正则匹配成功的总次数,返回整数;参数支持:REGEXP_COUNT(源,正则[,起始位置[,修饰符]])
起始位置约束:起始位 ≤0 非法报错,同 Oracle ORA-01428;
贪婪匹配:123123123 匹配(12)3 重叠匹配计数,遵循 Oracle 非重叠匹配规则;
大小写 / 多行继承 REGEXP_LIKE 标记规则;
空源串、无匹配内容返回 0。

适用场景:统计字段手机号 / 身份证 / 关键词出现频次。

3.3 REGEXP_INSTR 正则匹配位置查找

作用:返回匹配内容起始下标(默认从 1 开始计数),Oracle 全参数语法:
REGEXP_INSTR(src,pattern[,pos[,occurrence[,opt[,flag[,group]]]]])
参数释义
pos:查找起始下标;occurrence:第 N 次匹配;
opt:0 返回匹配起始位,1 返回匹配结束后下标;
flag:i/m/n 修饰符;group:捕获分组编号,0 = 全匹配。
典型用例:
拆分英文语句单词,[^ ]+ 按空格分词,取第 6 个单词下标;
多级捕获(123)(4(56)(78)),通过 group=4 取最内层分组 78 位置;
非法值:pos/occurrence/group 传负数直接抛出异常。

适用场景:截取指定位置关键字、结构化文本字段拆分。

3.4 REGEXP_SUBSTR 正则内容截取

作用:按正则截取匹配字符串,参数同 REGEXP_INSTR,多分组取值。
语法:REGEXP_SUBSTR(源,正则[,起始位[,第几次匹配[,修饰符[,分组号]]]])
分组规则:group=0 返回完整匹配,≥1 返回对应括号内捕获内容;无匹配返回 NULL;
示例:,\s+([Zf][^,]+),i 忽略大小写,group=1 截取 zipcode town;
起始位、匹配次数负数入参报错。

适用场景:从混杂文本提取手机号、邮箱、编号、URL。

3.5 REGEXP_REPLACE 正则替换

作用:使用替换串替换正则匹配内容,Oracle 标准全参数:
REGEXP_REPLACE(src,pattern,repl[,pos[,occ[,flag]]])
参数:pos 起始位置,occ 第 N 个匹配开始替换(0 = 全局全部替换);flag 匹配修饰符;
特殊 NULL 规则(Oracle 独有,重点兼容)

入参情况返回结果
源串 NULLNULL
正则 pattern 为 NULL返回原字符串
替换 repl 为 NULL匹配内容被清空删除

常用示例:连续多个空格( ){2,}替换为单个空格、手机号格式化 512.123.4567→(512) 123-4567;
起始位、替换次数传负数触发异常;不支持 g 全局标记(Oracle 无 g,靠 occ=0 全局替换)。
适用场景:数据清洗、格式标准化、敏感信息脱敏。

四、空值与异常入参规范(Oracle 对齐重点)

1、NULL 参数规则

REGEXP_LIKE/COUNT/INSTR/SUBSTR:任一关键参数 NULL,返回 NULL;

REGEXP_REPLACE 特殊:pattern 为 NULL 直接返回原文本,区别其余函数。

2、非法数值入参

pos(起始下标)、occurrence(第 N 次匹配)、group(分组号)传入负数,全部抛出运行异常,对标 Oracle ORA-01428 错误。

3、非法修饰符:非 i/m/n 字符作为 flag,遵循 Oracle 原生容错逻辑。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 17:17:57

GBase 8s V8.8 运维管理:认识一个环境变量NODEFDAC

在数据库运维管理中,权限控制是保障数据安全的重要环节。今天我们来介绍GBase 8s(gbase database)中一个实用的环境变量——NODEFDAC,它可以帮助我们精细控制新建表的默认访问权限。 在非ANSI兼容的数据库中,通过设置N…

作者头像 李华
网站建设 2026/6/9 17:14:56

Arduino收音机开发终极指南:用SI4735库构建专业级广播接收系统

Arduino收音机开发终极指南:用SI4735库构建专业级广播接收系统 【免费下载链接】SI4735 SI473X Library for Arduino 项目地址: https://gitcode.com/gh_mirrors/si/SI4735 想要快速构建功能完整的Arduino收音机吗?SI4735开源库为你提供了从AM/FM…

作者头像 李华
网站建设 2026/6/9 17:10:02

掌握Prompt Caching,让你的大模型调用成本直降90%!小白程序员必备收藏

本文深入解析了大模型API调用的成本优化策略,重点介绍了Prompt Caching机制。通过对比KV Cache和Prompt Caching的区别,详细阐述了Prompt Caching的工作原理、不同厂商的收费模式以及如何通过调整prompt结构来提高缓存命中率,从而显著降低大模…

作者头像 李华
网站建设 2026/6/9 17:01:29

wxapkg-convertor终极指南:5分钟掌握微信小程序反编译专业技巧

wxapkg-convertor终极指南:5分钟掌握微信小程序反编译专业技巧 【免费下载链接】wxapkg-convertor 一个反编译微信小程序的工具,仓库也收集各种微信小程序/小游戏.wxapkg文件 项目地址: https://gitcode.com/gh_mirrors/wx/wxapkg-convertor wxap…

作者头像 李华