Skip to main content

网址提取器 从文本中提取所有网址(http/https)并列出唯一结果。

网址提取器 illustration
📝

网址提取器

从文本中提取所有网址(http/https)并列出唯一结果。

1

粘贴文本

粘贴包含 URL 的文本。

2

自动提取

所有 HTTP/HTTPS URL 都会被找到并列出。

3

复制结果

复制提取出的唯一 URL 列表。

Loading tool...

What Is 网址提取器?

URL 提取器扫描文本并提取所有 HTTP 和 HTTPS URL,呈现为一个清洁的去重列表。它处理带有路径、查询字符串、片段和特殊字符的 URL。从提取的 URL 中清除尾部标点符号(句号、逗号、括号)。此工具适用于从文档、电子邮件、社交媒体帖子或包含 Web 地址的任何文本中提取链接。

Why Use 网址提取器?

  • 从文档或网页内容中提取所有链接
  • 自动清除 URL 后面的标点符号
  • 去除找到的 URL 中的重复项
  • 支持包含查询字符串的复杂 URL

Common Use Cases

链接审计

从内容中提取所有 URL,以进行链接检查和验证。

研究

从学术论文或文章中收集引用的 URL。

SEO 分析

从网页内容中提取外部链接。

数据挖掘

从日志文件、电子邮件或文本数据库中拉取 URL。

Technical Guide

提取器使用正则表达式 /https?:\/\/[^\s<>"{}|\\^`[\]]+/gi 匹配以 http:// 或 https:// 开头的 URL。字符类排除空白和在 URL 中无效的字符。在提取后,使用清理正则表达式去掉尾部标点符号(.,;:!?)和关闭括号。JavaScript 的 Set 用于去重。模式故意广泛以捕获不同文本上下文中的 URL,同时排除明显无效的字符。

Tips & Best Practices

  • 1
    URL 后面的标点符号会被自动清除
  • 2
    仅提取 HTTP 和 HTTPS URL
  • 3
    结果中重复的项会被删除
  • 4
    HTML 属性和源代码中的 URL 也会被找到

Related Tools

Frequently Asked Questions

Q 它能否找到 FTP 或其他协议的 URL?
目前仅支持提取 HTTP 和 HTTPS URL。
Q 它如何处理句末的 URL?
从提取出的 URL 中自动去除句末的标点符号,如句号、逗号等。
Q 重复的 URL 会被删除吗?
是的,每个唯一的 URL 只会在输出中出现一次。
Q 它是否验证 URL 的有效性?
它提取 URL 模式,但不检查它们是否可达或有效。
Q 它能否找到没有 http/https 前缀的 URL?
否,仅支持带有显式 http:// 或 https:// 协议的 URL。

About This Tool

网址提取器 is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.