Python数据剖析实战-利用正则表达式提取文本中的URL网址和邮箱
实当代码:
import re#python正则表达式提取网址myString = 'https://github.com/milvus-io/milvus和https://github.com/milvus-io/bootcamp'url=re.findall(r"(http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+)",myString)print(url)#python正则表达式提取邮箱text='邮箱discussions@lists.aosc.io'emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text)print(emails)
实现效果:

本人读研期间揭橥5篇SCI数据挖掘干系论文,现在某研究院从事数据挖掘干系科研事情,对数据挖掘有一定认知和理解,会结合自身科研实践经历不定期分享关于python机器学习、深度学习、数据挖掘根本知识与案例。
致力于只做原创,以最大略的办法理解和学习,关注我一起互换发展。
关注本订阅号数据杂坛即可在后台联系我获取干系数据集和源码,送有关数据剖析、数据挖掘、机器学习、深度学习干系的电子书本。