33-第6步_类似程序的构想
第6步:类似程序的构想
识别文本的模式(并且可能用 sub()
方法替换它们)有许多不同潜在的应用。
- 寻找网站的URL,它们以http://或https://开始。
- 整理不同日期格式的日期(如3/14/2015、03-14-2015和2015/3/14),用唯一的标准格式替代。
- 删除敏感的信息,如社会保险号或信用卡号。
- 寻找常见打字错误,如单词间的多个空格、不小心重复的单词或句子末尾处多出的感叹号。
识别文本的模式(并且可能用 sub()
方法替换它们)有许多不同潜在的应用。