文本方式 与正则表达式方式的区别
文本方式 与正则表达式方式的区别
文本和正则表达式能匹配的关键字最短长度为3个字节,其中ASCII字符占1个字节,汉字占2个字节。
例如,关键字可以匹配到“abc”、“中国”、“a中”,但是不能匹配“a”、“ab”、“中”。
文本方式是使用文本的方式表示需要识别的关键字,例如管理员想要识别关键字“机密文件”,只需要自定义文本方式的关键字“机密文件”即可。文本方式配置简单,匹配精确。
正则表达式方式是使用正则表达式的方式表示需要识别的关键字。与文本方式不同的是一个正则表达式可以表示多个关键字。例如正则表达式“abc.de”中的“.”可以匹配任意单个字符,所以“abc.de”可以表示“abcxde”、“abcyde”、“abc8de”等等。
正则表达式方式匹配更加灵活和高效,但配置需要遵循正则表达式规则。正则表达式规则如表2所示。
正则表达式的常用操作符
操作符 说明 实例
. 表示任何单个字符
[ ] 字符集,对单个字符给出取值范围 [abc]表示a、b、c,[a-z]表示a到z单个字符
[ ^ ] 非字符集,对单个字符给出排除范围 [^abc]表示非a或b或c的单个字符
* 前一个字符0次或无限次扩展 abc*表示ab、abc、abcc、abcc等
+ 前一个字符1次或无限次扩展 abc+表示abc、abcc、abccc等
? 前一个字符0次或1次扩展 abc?表示av、abc
| (等同于或)左右表达式任意一个 abc|def表示abc、def
{m} 扩展前一个字符m次 ab{2}c表示abbc
{m,n} 扩展前一个字符m至n次(含n) ab{1,2}c表示abc、abbc
^ 匹配字符串开头 ^abc表示abc且在一个字符串的开头
$ 匹配字符串结尾 abc$表示abc且在一个字符串的结尾
() 分组标记,内部只能使用|操作符 (abc)表示abc,(abc|def)表示abc、def
\d 数字,等价于[0-9]
\w 单词字符,等价于[A-Za-z0-9]
2、本资源基本为原创,部分来源其他付费资源平台或互联网收集,如有侵权请联系及时处理。
3、本站大部分文章的截图来源实验测试环境,请不要在生产环境中随意模仿,以免带来灾难性后果。
转载请保留出处: www.zh-cjh.com珠海陈坚浩博客 » 文本方式 与正则表达式方式的区别
作者: cjh
手机扫一扫,手机上查看此文章: |
一切源于价值!
其他 模板文件不存在: ./template/plugins/comment/pc/index.htm