Skip to main content

HTML 实体解码器 将 HTML 实体转换回原始字符。

HTML 实体解码器 illustration
📝

HTML 实体解码器

将 HTML 实体转换回原始字符。

1

粘贴编码文本

粘贴包含HTML实体的文本。

2

自动解码

HTML实体被转换回字符。

3

复制结果

复制已解码的文本。

Loading tool...

What Is HTML 实体解码器?

HTML 实体解码器可以将HTML实体转换回其原始字符。它支持命名实体,如&amp;(→ &)、&lt;(→ <)和&gt;(→ >),以及十进制数值实体(&#38;)和十六进制数值实体(&#x26;)。当处理HTML源代码、网页内容抓取或将编码文本转换回可读形式时,该工具非常有用。解码器支持所有常见的命名实体,以及任何十进制或十六进制数值实体。

Why Use HTML 实体解码器?

  • 将抓取的HTML内容转换为可读文本
  • 解码HTML源代码中的实体
  • 从编码内容中恢复原始字符
  • 处理非HTML上下文的HTML数据

Common Use Cases

网页抓取

解码抓取内容中的HTML实体以获取可读文本。

数据处理

将HTML编码的数据转换回纯文本进行分析。

内容迁移

在从HTML移到其他格式时解码实体。

调试

检查HTML实体所代表的字符。

Technical Guide

解码器分三个阶段工作。首先,它使用一个包含&amp;、&lt;、&gt;、&quot;、&nbsp;和符号实体(如&copy;、&trade;、&euro;等)的查找表替换常见的命名实体。其次,它使用String.fromCharCode(parseInt(code, 10))处理十进制数值实体(&#NNN;),将十进制字符代码转换为其对应的字符。第三,它类似地使用parseInt(code, 16)处理十六进制数值实体(&#xHHH;)。这涵盖了HTML实体编码方法的全部范围。命名实体首先被处理,以确保在数值实体阶段中不会出现部分解码文本造成的错误匹配。

Tips & Best Practices

  • 1
    支持命名(&amp;)和数字(&#38;)实体格式
  • 2
    用于清理HTML源代码以进行文本处理
  • 3
    支持货币、版权和特殊符号实体
  • 4
    与HTML标签剥离结合使用以实现全文提取

Related Tools

Frequently Asked Questions

Q 它可以解码什么类型的实体?
命名实体(如&amp;)、十进制数字(如&#38;)和十六进制数字(如&#x26;)。
Q 它是否处理所有命名实体?
它涵盖了大多数常见的命名实体。较不常见的可能需要以数字格式表示。
Q 它会剥离HTML标签吗?
否,它仅解码实体。使用HTML到Markdown工具来剥离标签并转换为文本。
Q 什么是&nbsp;?
&nbsp;是一个不间断的空格字符。解码器将其转换为一个普通的空格字符。
Q 它可以处理双重编码的实体吗?
它处理单级编码。对于双重编码的文本(如&amp;amp;),请运行解码器两次。

About This Tool

HTML 实体解码器 is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.