用的是python3.3.5 IDE是pycharm
我想取出标签、汉字、单词、数字、和空格
代码如下
import re
regex = re.compile("<[^>]*>|[\u4e00-\u9fa5]|[a-zA-Z]*|\d*|\s*")
print(regex.findall('''<i> bob是</i>25岁<br/>'''))
结果是
['<i>', '', 'bob', '是', '</i>', '', '', '岁', '<br/>', '']
想请教一下为什么数字25取不出来?
我想取出标签、汉字、单词、数字、和空格
代码如下
import re
regex = re.compile("<[^>]*>|[\u4e00-\u9fa5]|[a-zA-Z]*|\d*|\s*")
print(regex.findall('''<i> bob是</i>25岁<br/>'''))
结果是
['<i>', '', 'bob', '是', '</i>', '', '', '岁', '<br/>', '']
想请教一下为什么数字25取不出来?
