1 2 3 4 5 6 7 8 9 10 11 | #_*_ coding: utf-8 _*_ __author__ = 'wangyh' import re #提取年龄 line = [ "xxx出生于2011年11月11日" , "xxx出生于2012.11.01" , "xxx出生于1991/01/03" , "xxx出生于2011-1-11" , "xxx出生于2011/11" , "xxx出生于2011-11" ] regex_str = ".*(\d{4}[.年/-]\d{1,2}([.月/-]\d{1,2}|[.月/-]$|$))" for l in line: match_obj = re.match(regex_str,l) if (match_obj): print (match_obj.group( 1 )) |
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程