用replace函数,先把style.../style等不需要的的内容替换为空
再使用正则提取.
或者使用正则,只提取
p.../p之间的内容
不要用search,用findall
print(result)
①正则的简单介绍
首先你得导入正则方法 import re 正则表达式是用于处理字符串的强大工具,拥有自己独立的处理机制,效率上可能不如str自带的方法,但功能十分灵活给力.它的运行过程是先定一个匹配规则("你想要的内容+正则语法规则"),放入要匹配的字符串,通过正则内部的机制就能检索你想要的信息.
基本结构大致: nojoke = re.findall(r'匹配的规则','要检索的愿字符串') nojoke就是我们最后通过正则返回的结果,re正则findall查找全部r标识代表后面是正则的语句(这样在代码多的时候好查阅),下面我们看看几个例子好深入了解
这段代码是找出检索字符串中所有的bi并以列表的形式返回,这个会经常用到计算统一字符出现的次数.继续看下一个
这里加了个符号^表示匹配以abi开头的的字符串返回,也可以判断字符串是否以abi开始的.
这里在的用$符号表示以gbi结尾的字符串返回,判断是否字符串结束的字符串.
这里[...]的意思匹配括号内a和f,或者b和f,或者c和f的值返回列表.
"W"在正则里面代表匹配除了字母与数字以外的特殊符号,但这里斜杠的用法要注意在字符串是转义符号具体百度去学.
这里加re.I(大写的i)表示匹配无论公的母的大小写都通吃都要,不然后面有大小写就会出现上面匹配找不到返回空列表给你.
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none.re.search 扫描整个字符串并返回第一个成功的匹配.
以上就是土嘎嘎小编为大家整理的python函数名正则化相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦!!