Skip to main content

Codierungs-Erkennung Erkennen Sie die Zeichenkodierung von Textdateien (UTF-8, UTF-16, ASCII, Latin-1).

Codierungs-Erkennung illustration
🔄

Codierungs-Erkennung

Erkennen Sie die Zeichenkodierung von Textdateien (UTF-8, UTF-16, ASCII, Latin-1).

1

Textdatei hochladen

Ziehen Sie eine Textdatei hierher oder wählen Sie sie aus, um ihre Kodierung zu analysieren.

2

Kodierungsresultat anzeigen

Sehen Sie die erkannte Kodierung, den BOM-Status und das Vertrauensniveau an.

3

Inhalte vorlesen

Betrachten Sie eine Vorschau des decodierten Textinhalts.

Loading tool...

What Is Codierungs-Erkennung?

Der Encoding-Detector analysiert Textdateien, um ihre Zeichenkodierung zu bestimmen. Er überprüft auf Byte Order Marks (BOM) für eine definitive Kodierungsidentifizierung und verwendet dann eine heuristische Analyse für Dateien ohne BOM. Das Tool erkennt UTF-8-, UTF-16-(LE/BE)-, UTF-32-(LE/BE)-, ASCII- und ISO-8859-1/Windows-1252-Kodierungen. Die Ergebnisse umfassen die erkannte Kodierung, das Vertrauensniveau, BOM-Details, eine Analyseerklärung und eine Vorschau des decodierten Inhalts.

Why Use Codierungs-Erkennung?

  • Erkennt die Kodierung über BOM und heuristische Byte-Analyse.
  • Unterstützt UTF-8, UTF-16, UTF-32, ASCII und Latin-1/Windows-1252.
  • Zeigt das Vertrauensniveau und Details zur Erkennungsmethode an.
  • Enthält eine Vorschau des decodierten Inhalts, um die Erkennungsgenauigkeit zu überprüfen.

Common Use Cases

Zeichenprobleme

Diagnostizieren Sie Zeichendisplay-Probleme und Mojibake, indem Sie die korrekte Dateikodierung identifizieren.

Datenimport

Bestimmen Sie die Dateikodierung vor dem Import von Textdaten, um eine korrekte Zeichenerkennung zu gewährleisten.

Veraltete Dateien

Identifizieren Sie die Kodierung veralteter Textdateien, die möglicherweise nicht UTF-8-Kodierungen verwenden.

Entwicklung

Überprüfen Sie die Kodierung von Quellcode-Dateien, CSV-Daten und Konfigurationsdateien.

Technical Guide

Der Detector verwendet einen mehrstufigen Ansatz:

1. BOM-Erkennung: Überprüft die ersten 4 Bytes auf bekannte BOM-Folgen (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF). Die Anwesenheit eines BOM bietet eine hochvertrauenswürdige Erkennung.

2. UTF-16-Heuristik: Analysiert Nullbyte-Muster. UTF-16-Dateien haben häufig Nullbytes in geraden oder ungeraden Positionen, die ASCII-Zeichen entsprechen, die in 16 Bit kodiert sind.

3. UTF-8-Validierung: Validiert Mehrbyte-Folgen. Gültiges UTF-8 hat spezifische Muster: 110xxxxx 10xxxxxx für 2-Byte-, 1110xxxx 10xxxxxx 10xxxxxx für 3-Byte usw.

4. ASCII-Erkennung: Wenn alle Bytes im Bereich 0x00-0x7F liegen, ist die Datei reines ASCII (was auch gültiges UTF-8 ist).

5. Latin-1-Fallback: Wenn Bytes im Bereich 0x80-0xFF existieren, aber keine gültigen UTF-8-Folgen bilden, ist ISO-8859-1/Windows-1252 wahrscheinlich.

Nur die ersten 8 KB der Datei werden für die Leistung analysiert.

Tips & Best Practices

  • 1
    Die BOM-Erkennung bietet das höchste Vertrauensniveau - Dateien mit BOM werden eindeutig identifiziert.
  • 2
    UTF-8 ohne BOM wird durch die Validierung von Mehrbyte-Folgen erkannt.
  • 3
    ISO-8859-1 und Windows-1252 werden als Fallback erkannt, wenn die UTF-8-Validierung fehlschlägt.
  • 4
    Die Inhaltsvorschau hilft dabei, zu überprüfen, ob die Erkennung korrekt ist - suchen Sie nach unlesbaren Zeichen.

Related Tools

Frequently Asked Questions

Q Wie genau ist die Erkennung?
BOM-basierte Erkennung ist 100% genau. Heuristische Erkennung für UTF-8 ist sehr zuverlässig. Latin-1/Windows-1252-Erkennung ist ein Fallback.
Q Was ist ein BOM?
Ein Byte Order Mark ist eine spezielle Byte-Folge am Anfang einer Datei, die ihre Kodierung identifiziert.
Q Kann es Shift-JIS oder GB2312 erkennen?
Derzeit konzentriert sich der Detector auf Unicode-Kodierungen und Latin-1. Ostasiatische Kodierungen werden nicht speziell erkannt.
Q Wie viel der Datei wird analysiert?
Die ersten 8 KB (8192 Bytes) werden analysiert, was für eine zuverlässige Erkennung der Kodierung ausreicht.
Q Was ist mit Dateien mit gemischter Kodierung?
Der Detector geht von einer einzigen Kodierung pro Datei aus. Dateien mit gemischter Kodierung zeigen die dominierende Kodierung an.

About This Tool

Codierungs-Erkennung is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.