re 模块介绍
re模块是Python自带的正则表达式模块,它是提供了对正则表达式的完整支持,可以使用各种符号和操作来区分、匹配和替换字符串。
re.split函数的用法
re模块中的re.split
函数是用于正则式分割字符串,将字符串按照一定规则切割成一个列表。语法如下:
re.split(pattern, string, maxsplit=0, flags=0)
参数说明:
pattern
:匹配的正则表达式;string
:要匹配的字符串;maxsplit
:分割次数,最多分割maxsplit次,默认为0,表示不限制分割次数;flags
:正则表达式的匹配方式,例如re.I表示忽略大小写,re.S表示让"."匹配所有字符,re.M表示多行匹配等。
re.split 函数的使用
下面我们来看一下re.split
函数的使用示例:
示例
分割单词
import re
text = "Hello, my name is John. What's your name? "
words = re.split('\W+', text)
print(words)
# 输出结果: ['Hello', 'my', 'name', 'is', 'John', 'What', 's', 'your', 'name', '']
在这个示例中,我们首先导入了re模块,然后定义了一段文本字符串。我们的目标是将这段文本中的所有单词分割出来,这时候我们会想到使用空格、标点符号等来进行分割。而在我们这个例子中,我们采用了\W+
模式匹配规则,也就是匹配非字母数字字符来进行分割,最后输出了分割出来的单词列表。
分割年月日
import re
date = "2022-08-08"
parts = re.split('\-', date)
print(parts)
# 输出结果:['2022', '08', '08']
这个示例中,我们定义了一个日期字符串,我们的目标是把这个日期字符串分割出年月日三个部分。这里我们采用了-来进行分割,最后输出分割出来的三个部分。需要注意,在这个例子中,-这个符号在正则表达式中有特殊的含义,所以我们在使用它进行分割时,需要进行转义,即使用 \
进行转义。
到此,我们已经掌握了re模块re.split.string函数的基本语法和可以使用的方法,希望本文能够对大家有所帮助。