#_*_ coding: utf-8 _*_
__author__ = 'wangyh'
import re
#提取年龄
line = ["xxx出生于2011年11月11日","xxx出生于2012.11.01","xxx出生于1991/01/03",
"xxx出生于2011-1-11","xxx出生于2011/11","xxx出生于2011-11"]
regex_str = ".*(\d{4}[.年/-]\d{1,2}([.月/-]\d{1,2}|[.月/-]$|$))"
for l in line:
match_obj = re.match(regex_str,l)
if (match_obj):
print(match_obj.group(1))带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程