Codierungs-Erkennung Erkennen Sie die Zeichenkodierung von Textdateien (UTF-8, UTF-16, ASCII, Latin-1).
Codierungs-Erkennung
Erkennen Sie die Zeichenkodierung von Textdateien (UTF-8, UTF-16, ASCII, Latin-1).
Textdatei hochladen
Ziehen Sie eine Textdatei hierher oder wählen Sie sie aus, um ihre Kodierung zu analysieren.
Kodierungsresultat anzeigen
Sehen Sie die erkannte Kodierung, den BOM-Status und das Vertrauensniveau an.
Inhalte vorlesen
Betrachten Sie eine Vorschau des decodierten Textinhalts.
What Is Codierungs-Erkennung?
Der Encoding-Detector analysiert Textdateien, um ihre Zeichenkodierung zu bestimmen. Er überprüft auf Byte Order Marks (BOM) für eine definitive Kodierungsidentifizierung und verwendet dann eine heuristische Analyse für Dateien ohne BOM. Das Tool erkennt UTF-8-, UTF-16-(LE/BE)-, UTF-32-(LE/BE)-, ASCII- und ISO-8859-1/Windows-1252-Kodierungen. Die Ergebnisse umfassen die erkannte Kodierung, das Vertrauensniveau, BOM-Details, eine Analyseerklärung und eine Vorschau des decodierten Inhalts.
Why Use Codierungs-Erkennung?
-
Erkennt die Kodierung über BOM und heuristische Byte-Analyse.
-
Unterstützt UTF-8, UTF-16, UTF-32, ASCII und Latin-1/Windows-1252.
-
Zeigt das Vertrauensniveau und Details zur Erkennungsmethode an.
-
Enthält eine Vorschau des decodierten Inhalts, um die Erkennungsgenauigkeit zu überprüfen.
Common Use Cases
Zeichenprobleme
Diagnostizieren Sie Zeichendisplay-Probleme und Mojibake, indem Sie die korrekte Dateikodierung identifizieren.
Datenimport
Bestimmen Sie die Dateikodierung vor dem Import von Textdaten, um eine korrekte Zeichenerkennung zu gewährleisten.
Veraltete Dateien
Identifizieren Sie die Kodierung veralteter Textdateien, die möglicherweise nicht UTF-8-Kodierungen verwenden.
Entwicklung
Überprüfen Sie die Kodierung von Quellcode-Dateien, CSV-Daten und Konfigurationsdateien.
Technical Guide
Der Detector verwendet einen mehrstufigen Ansatz:
1. BOM-Erkennung: Überprüft die ersten 4 Bytes auf bekannte BOM-Folgen (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF). Die Anwesenheit eines BOM bietet eine hochvertrauenswürdige Erkennung.
2. UTF-16-Heuristik: Analysiert Nullbyte-Muster. UTF-16-Dateien haben häufig Nullbytes in geraden oder ungeraden Positionen, die ASCII-Zeichen entsprechen, die in 16 Bit kodiert sind.
3. UTF-8-Validierung: Validiert Mehrbyte-Folgen. Gültiges UTF-8 hat spezifische Muster: 110xxxxx 10xxxxxx für 2-Byte-, 1110xxxx 10xxxxxx 10xxxxxx für 3-Byte usw.
4. ASCII-Erkennung: Wenn alle Bytes im Bereich 0x00-0x7F liegen, ist die Datei reines ASCII (was auch gültiges UTF-8 ist).
5. Latin-1-Fallback: Wenn Bytes im Bereich 0x80-0xFF existieren, aber keine gültigen UTF-8-Folgen bilden, ist ISO-8859-1/Windows-1252 wahrscheinlich.
Nur die ersten 8 KB der Datei werden für die Leistung analysiert.
Tips & Best Practices
-
1Die BOM-Erkennung bietet das höchste Vertrauensniveau - Dateien mit BOM werden eindeutig identifiziert.
-
2UTF-8 ohne BOM wird durch die Validierung von Mehrbyte-Folgen erkannt.
-
3ISO-8859-1 und Windows-1252 werden als Fallback erkannt, wenn die UTF-8-Validierung fehlschlägt.
-
4Die Inhaltsvorschau hilft dabei, zu überprüfen, ob die Erkennung korrekt ist - suchen Sie nach unlesbaren Zeichen.
Related Tools
Dateiformat-Erkennung
Erkennen Sie das Dateiformat durch Analyse der Magic-Bytes (Dateisignatur) im Header.
🔄 File Conversion
Zeilenendung-Detektor
Erkennen und Zählen von Zeilenendungstypen (CRLF, LF, CR) in Textdateien.
🔄 File Conversion
BOM-Detektor/Entferner
Byte Order Marks (BOM) in Textdateien erkennen und entfernen.
🔄 File Conversion
Dateimetadaten-Anzeiger
Zeigen Sie umfassende Dateimetadaten an, einschließlich Größe, Typ, Entropie und Hex-Header.
🔄 File ConversionFrequently Asked Questions
Q Wie genau ist die Erkennung?
Q Was ist ein BOM?
Q Kann es Shift-JIS oder GB2312 erkennen?
Q Wie viel der Datei wird analysiert?
Q Was ist mit Dateien mit gemischter Kodierung?
About This Tool
Codierungs-Erkennung is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.