Skip to main content

Detector de Codificación Detecta la codificación de caracteres del archivo de texto (UTF-8, UTF-16, ASCII, Latin-1).

Detector de Codificación illustration
🔄

Detector de Codificación

Detecta la codificación de caracteres del archivo de texto (UTF-8, UTF-16, ASCII, Latin-1).

1

Subir archivo de texto

Arrastre o seleccione un archivo de texto para analizar.

2

Ver resultado de codificación

Vea la codificación detectada, el estado del BOM y el nivel de confianza.

3

Previsualizar contenido

Vea una previsualización del contenido de texto decodificado.

Loading tool...

What Is Detector de Codificación?

El detector de codificación analiza archivos de texto para determinar su codificación de caracteres. Verifica las marcas de orden de bytes (BOM) para la identificación definitiva de la codificación, y luego utiliza un análisis heurístico para los archivos sin BOM. La herramienta detecta las codificaciones UTF-8, UTF-16 (LE/BE), UTF-32 (LE/BE), ASCII e ISO-8859-1/Windows-1252. Los resultados incluyen la codificación detectada, el nivel de confianza, los detalles del BOM, la explicación del análisis y una vista previa del contenido decodificado.

Why Use Detector de Codificación?

  • Detecta la codificación mediante BOM y análisis heurístico de bytes.
  • Admite UTF-8, UTF-16, UTF-32, ASCII y Latin-1/Windows-1252.
  • Muestra el nivel de confianza y los detalles del método de detección.
  • Incluye una previsualización del contenido decodificado para verificar la precisión de la detección.

Common Use Cases

Problemas de caracteres

Diagnostique problemas de visualización de caracteres y mojibake identificando la codificación correcta del archivo.

Importación de datos

Determine la codificación del archivo antes de importar los datos de texto para garantizar el manejo correcto de caracteres.

Archivos heredados

Identifique la codificación de archivos de texto heredados que pueden utilizar codificaciones no UTF-8.

Desarrollo

Verifique la codificación de los archivos de código fuente, datos CSV y archivos de configuración.

Technical Guide

El detector utiliza un enfoque de múltiples etapas:

1. Detección de BOM: Verifica los primeros 4 bytes para secuencias de BOM conocidas (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF). La presencia del BOM proporciona una detección de alta confianza.

2. Heurística UTF-16: Analiza los patrones de bytes nulos. Los archivos UTF-16 tienen bytes nulos frecuentes en posiciones pares o impares que corresponden a caracteres ASCII codificados en 16 bits.

3. Validación UTF-8: Valida las secuencias de varios bytes. El UTF-8 válido tiene patrones específicos: 110xxxxx 10xxxxxx para 2 bytes, 1110xxxx 10xxxxxx 10xxxxxx para 3 bytes, etc.

4. Detección ASCII: Si todos los bytes están en el rango 0x00-0x7F, el archivo es puro ASCII (que también es UTF-8 válido).

5. Fallback Latin-1: Si existen bytes en el rango 0x80-0xFF pero no forman secuencias UTF-8 válidas, es probable que sea ISO-8859-1/Windows-1252.

Solo se analiza los primeros 8KB del archivo para mejorar el rendimiento.

Tips & Best Practices

  • 1
    La detección del BOM proporciona la mayor confianza - los archivos con BOM se identifican definitivamente.
  • 2
    UTF-8 sin BOM se detecta validando secuencias de bytes múltiples.
  • 3
    ISO-8859-1 y Windows-1252 se detectan como una opción de respaldo cuando falla la validación UTF-8.
  • 4
    La previsualización del contenido ayuda a verificar que la detección sea correcta - busque caracteres desordenados.

Related Tools

Frequently Asked Questions

Q ¿Cuán precisa es la detección?
La detección basada en BOM es del 100% precisa. La detección heurística para UTF-8 es muy confiable. La detección de Latin-1/Windows-1252 es una opción de respaldo.
Q ¿Qué es un BOM?
Un marcador de orden de bytes es una secuencia especial de bytes al comienzo de un archivo que identifica su codificación.
Q ¿Puede detectar Shift-JIS o GB2312?
Actualmente, el detector se centra en las codificaciones Unicode y Latin-1. Las codificaciones de Asia Oriental no se detectan específicamente.
Q ¿Cuánto del archivo se analiza?
Se analizan los primeros 8KB (8192 bytes), lo que es suficiente para una detección confiable de la codificación.
Q ¿Qué pasa con los archivos de codificación mixta?
El detector asume una sola codificación por archivo. Los archivos de codificación mixta mostrarán la codificación dominante.

About This Tool

Detector de Codificación is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.