Detector de Codificación Detecta la codificación de caracteres del archivo de texto (UTF-8, UTF-16, ASCII, Latin-1).
Detector de Codificación
Detecta la codificación de caracteres del archivo de texto (UTF-8, UTF-16, ASCII, Latin-1).
Subir archivo de texto
Arrastre o seleccione un archivo de texto para analizar.
Ver resultado de codificación
Vea la codificación detectada, el estado del BOM y el nivel de confianza.
Previsualizar contenido
Vea una previsualización del contenido de texto decodificado.
What Is Detector de Codificación?
El detector de codificación analiza archivos de texto para determinar su codificación de caracteres. Verifica las marcas de orden de bytes (BOM) para la identificación definitiva de la codificación, y luego utiliza un análisis heurístico para los archivos sin BOM. La herramienta detecta las codificaciones UTF-8, UTF-16 (LE/BE), UTF-32 (LE/BE), ASCII e ISO-8859-1/Windows-1252. Los resultados incluyen la codificación detectada, el nivel de confianza, los detalles del BOM, la explicación del análisis y una vista previa del contenido decodificado.
Why Use Detector de Codificación?
-
Detecta la codificación mediante BOM y análisis heurístico de bytes.
-
Admite UTF-8, UTF-16, UTF-32, ASCII y Latin-1/Windows-1252.
-
Muestra el nivel de confianza y los detalles del método de detección.
-
Incluye una previsualización del contenido decodificado para verificar la precisión de la detección.
Common Use Cases
Problemas de caracteres
Diagnostique problemas de visualización de caracteres y mojibake identificando la codificación correcta del archivo.
Importación de datos
Determine la codificación del archivo antes de importar los datos de texto para garantizar el manejo correcto de caracteres.
Archivos heredados
Identifique la codificación de archivos de texto heredados que pueden utilizar codificaciones no UTF-8.
Desarrollo
Verifique la codificación de los archivos de código fuente, datos CSV y archivos de configuración.
Technical Guide
El detector utiliza un enfoque de múltiples etapas:
1. Detección de BOM: Verifica los primeros 4 bytes para secuencias de BOM conocidas (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF). La presencia del BOM proporciona una detección de alta confianza.
2. Heurística UTF-16: Analiza los patrones de bytes nulos. Los archivos UTF-16 tienen bytes nulos frecuentes en posiciones pares o impares que corresponden a caracteres ASCII codificados en 16 bits.
3. Validación UTF-8: Valida las secuencias de varios bytes. El UTF-8 válido tiene patrones específicos: 110xxxxx 10xxxxxx para 2 bytes, 1110xxxx 10xxxxxx 10xxxxxx para 3 bytes, etc.
4. Detección ASCII: Si todos los bytes están en el rango 0x00-0x7F, el archivo es puro ASCII (que también es UTF-8 válido).
5. Fallback Latin-1: Si existen bytes en el rango 0x80-0xFF pero no forman secuencias UTF-8 válidas, es probable que sea ISO-8859-1/Windows-1252.
Solo se analiza los primeros 8KB del archivo para mejorar el rendimiento.
Tips & Best Practices
-
1La detección del BOM proporciona la mayor confianza - los archivos con BOM se identifican definitivamente.
-
2UTF-8 sin BOM se detecta validando secuencias de bytes múltiples.
-
3ISO-8859-1 y Windows-1252 se detectan como una opción de respaldo cuando falla la validación UTF-8.
-
4La previsualización del contenido ayuda a verificar que la detección sea correcta - busque caracteres desordenados.
Related Tools
Identificador de formato de archivo
Detecta el formato de archivo analizando los bytes mágicos (firma del archivo) en la cabecera.
🔄 File Conversion
Detector de finales de línea
Detecta y cuenta los tipos de finales de línea (CRLF, LF, CR) en archivos de texto.
🔄 File Conversion
Detector/Eliminador de BOM
Detectar y eliminar las marcas de orden de bytes (BOM) de los archivos de texto.
🔄 File Conversion
Visor de metadatos de archivo
Ver metadatos de archivo completos, incluyendo tamaño, tipo, entropía y encabezado hexadecimal.
🔄 File ConversionFrequently Asked Questions
Q ¿Cuán precisa es la detección?
Q ¿Qué es un BOM?
Q ¿Puede detectar Shift-JIS o GB2312?
Q ¿Cuánto del archivo se analiza?
Q ¿Qué pasa con los archivos de codificación mixta?
About This Tool
Detector de Codificación is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.