#_*_ coding: utf-8 _*_ __author__ = 'wangyh' import re #提取年龄 line = ["xxx出生于2011年11月11日","xxx出生于2012.11.01","xxx出生于1991/01/03", "xxx出生于2011-1-11","xxx出生于2011/11","xxx出生于2011-11"] regex_str = ".*(\d{4}[.年/-]\d{1,2}([.月/-]\d{1,2}|[.月/-]$|$))" for l in line: match_obj = re.match(regex_str,l) if (match_obj): print(match_obj.group(1))
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程