Python 使用正则表达式提取字符串中的 URL

给定一个字符串，里面包含 URL 地址，需要我们使用正则表达式来获取字符串的 URL。

实例

import re 
  
def Find(string): 
    # findall() 查找匹配正则表达式的字符串
    url = re.findall('https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+', string)
    return url 
      
 
string = 'qianmu 的网页地址为：http://www.qianmu.net，Google 的网页地址为：https://www.google.com'
print("Urls: ", Find(string))

?:说明：

(?:x)

匹配x但是不记住匹配项。这种括号叫作非捕获括号，使得你能够定义与正则表达式运算符一起使用的子表达式。看看这个例子/(?:foo){1,2}/。如果表达式是/foo{1,2}/，{1,2} 将只应用于 'foo' 的最后一个字符 'o'。如果使用非捕获括号，则 {1,2} 会应用于整个 'foo' 单词。

执行以上代码输出结果为：

Urls:  ['http://www.qianmu.net', 'https://www.google.com']

Document 对象参考手册 Python3 实例

下一节： Python3 简介