利用正则表达式将字符串分组示例代码

杰瑞26 7722 阅读 0 评论 0 点赞

前言

最近工作中遇到一个问题，需求是碰到'122333<<<<'这种字符串，要将其连贯的部分取出，得出['1', '22', '333', '<<<<']这样的列表，能想到的常规办法，遍历字符串，后一个与前一个逐个比较，这样真的很麻烦！又想到了另外两种方法，话不多说了，来一起看看详细的示例代码：

一、实际上可以借助itertools模块的groupby()方法来处理:

import itertools 
 
Str = '122333<<<<' 
Lst = [] 
for key,group in itertools.groupby(s): 
 Lst.append(list(group)) 
 
print map(lambda x: ''.join(x), Lst)

上面的处理，还是比较有技巧，也能得到想要的输出结果

['1', '22', '333', '<<<<']

二、但更酷点，更技巧处理方式是用正则表达式来处理:

import re 
 
Str = '122333<<<<' 
Lst = [] 
 
Pat = re.compile(r'((.)\2*)') 
Rst = [x[0] for x in re.findall(Pat, Str)] 
 
print Rst

备注:

1. (.) # .匹配任意字符;(.)做分组，方便后面反向引用

2. \2* # \2对里面括号的反向引用;*代表是0个到多个;

3. ((.)\2*) # 连起来就是任意一个或多个字符组成的分组；

4. (.)\1* # 这种方式则可以取出唯一的值['1', '2', '3', '<']；同样非常方便

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对阿兔在线工具的支持。

本文分类：正则表达式
本文标签：正则表达式字符串分组
浏览次数：7722 次浏览
发布日期：2022-02-22 16:41:29
本文链接：http://atool.online/zzbds/16291.html
原文链接：http://blog.csdn.net/jerry_1126/article/details/76598583

上一篇 > 关于正则表达式基本语法的应用详解(必看篇)
下一篇 > 正则表达式匹配(URL、电话、手机、邮箱)的实例代码

利用正则表达式将字符串分组示例代码

notepad++中使用正则表达式处理数据的步骤

Notepad++ 使用正则表达式匹配的方法

php使用正则验证密码字段的复杂强度原理详细讲解 原创

一文详解密码的正则表达式写法

php使用正则验证密码字段的复杂强度原理详细讲解原创