那么ab,abbb,abbbbb都符合这个特色,
而字符串ac显然不符合
在php里,一个正则表达式分为3个部分:分隔符、表达式和润色符
分隔符:标识一个正则表达式的开始和结束,一样平常用'/'或者'#'
如:
$pattern = '/[0-9]/';
$pattern = '#[0-9]#';
字符的分类字符分为2类:可见字符和不可见字符
可见字符:Unicode编码表中可用键盘输出后肉眼可见的字符。
例如:标点 ; . / ? 或者英笔墨母,汉字等等可见字符
不可见字符:Unicode编码表中可用键盘输出后肉眼不可见的字符。
例如:换行符 \n,Tab制表符\t等等,
字符的筛选办法:
| 匹配两个或者多个分支选择,即或匹配
[]匹配方括号中的任意字符
[^] 匹配除方括号中的字符之外的任意字符
区间匹配:[a-z]匹配a到z的字符, [0-9]匹配0到9的字符。也可以[a-z0-9] ,表示匹配数字或者小写字母
. 匹配除换行符之外的任意字符
\d 匹配任意一个十进制数字,即[0-9]
\D 匹配任意一个非十进制数字[^0-9] 相称于[^\d] ,与\d相反
\s 匹配一个不可见的字符,即[\f\n\r\t\v]
\S 匹配一个可见的字符,与\s相反
\w 匹配任意一个数字、字母或下划线,即[0-9a-zA-Z_]
\W 匹配任意一个非数字、字母或下划线,与\w相反
量词量词,描述字符匹配的次数
{n} 表示其前面的字符刚好涌现了n次。即=n
{n,} 表示其前面的字符最少涌现n次 ,即>=n
{n,m} 最少涌现n次,最多涌现m次 ,即>=n且<=m
匹配0次、一次或者多次,即{0,} ,即>=0
+匹配一次或多次,即{1,} ,即>=1
?匹配0或1次,即{0,1}
边界掌握边界掌握,描述字符涌现的位置。
^ 匹配字符串开始的位置 ,把稳不要和[^]搞混
$ 匹配字符串结尾的位置
例:^hello 可以匹配到:hello
但是匹配不到:123hello,由于规定了字符串以hello开头
模式单元() 匹配个中的整体为一个原子。
如: (X|x)iaomi , 可以匹配到 xiaomi
改动符用于开启或者关闭某种功能或模式
贪婪匹配
匹配结果存在歧义时取其长(默认)
匹配结果存在歧义时取其短,只需在正则表达式的后面'/'加上'U',
例如'/[0-9]/U';
贪婪模式与
字符串'test__123123123’知足模式'/test.+123/',的字符串组合有(1)test__123
(2)test__123123
(3)test__123123123
匹配结果有3个结果。
即匹配结果有歧义最长字符串为test__123123123,
故贪婪模式匹配的结果为test__123123123
最短字符串test__123,
故
贪婪模式代码:
$subject = "test__123123123";preg_match('/test.+123/', $subject, $matches); //贪婪模式 var_dump($matches);
贪婪模式输出结果如下:
array (size=1)0 => string 'test__123123123' (length=15)
$subject = "test__123123123";preg_match('/test.+123/U', $subject, $matches); //贪婪模式 var_dump($matches);
贪婪模式输出结果如下:
array (size=1)0 => string 'test__123' (length=9)
常见的改动模式U
i 忽略英笔墨母的大小写
x 忽略正则表达式的空缺符
s 让元字符'.' 匹配包括换行符在内的所有字符
php常用正则函数preg_match
实行匹配正则表达式
preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] ) : int
pattern: 要搜索的模式,字符串类型。
subject:输入字符串。
matches: 如果供应了参数matches,它将被添补为搜索结果,数据构造为一维数组。
flags: 可以设置为PREG_OFFSET_CAPTURE,利用搜索结果的第0个元素为匹配的字符串,第1个元素为对应的偏移量(位置)offset: 搜索从目标字符串的起始位置开始匹配。
返回值:匹配次数
类似函数preg_match_all,参数与preg_match同等
差异:preg_match:只匹配一次,搜索构造match的数据结果为一维数组
preg_match_all:匹配全部,搜索结果match的数据构造为二维数组。
preg_replace
实行一个正则表达式搜索和更换,返回值为更换后的字符串
preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] ) : mixed
pattern:要搜索的模式。可以是一个字符串或字符串数组。
replacement:用于更换的字符串或字符串数组
subject:要进行搜索和更换的字符串或字符串数组。
limit:更换的最大次数。默认是 -1(无限)。
count:更换次数。
preg_split
通过一个正则表达式分隔字符串
preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] ) : array
$pattrn:用于搜索的模式,字符串形式。
subject:输入字符串
limit:将限定分隔得到的子串最多只有limit个,返回的末了一个 子串将包含所有剩余部分。
flags:有以下标记的组合:-- 1.PREG_SPLIT_NO_EMPTY: 返回分隔后的非空部分。-- 2.PREG_SPLIT_DELIM_CAPTURE: 用分隔符'()'括号把匹配的捕获并返回。-- 3.PREG_SPLIT_OFFSET_CAPTURE: 匹配返回时将会附加字符串偏移量
PREG_SPLIT_DELIM_CAPTURE这个参数可能比较难解白,举个例子看看:
$subject = "1a23b"; $a = preg_split('/[\d]/', $subject, -1, PREG_SPLIT_NO_EMPTY); var_dump($a); //把稳是([\d])不是[\d]$a = preg_split('/([\d])/', $subject, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE); var_dump($a);
输出如下:
array (size=2)0 => string 'a' (length=1)1 => string 'b' (length=1)array (size=5)0 => string '1' (length=1)1 => string 'a' (length=1)2 => string '2' (length=1)3 => string '3' (length=1)4 => string 'b' (length=1)
php7进阶到架构师干系阅读https://www.kancloud.cn/gofor/gofor
末了,欢迎大家留言补充,谈论~~~