Skip to main content

Karakter Kodlaması Tespit Edici Metin dosyası karakter kodlamasını tespit edin (UTF-8, UTF-16, ASCII, Latin-1).

Karakter Kodlaması Tespit Edici illustration
🔄

Karakter Kodlaması Tespit Edici

Metin dosyası karakter kodlamasını tespit edin (UTF-8, UTF-16, ASCII, Latin-1).

1

Metin dosyasını yükle

Analiz etmek için bir metin dosyası bırakın veya seçin.

2

Kodlama sonucunu görüntüle

Tespit edilen kodlamayı, BOM durumunu ve güven seviyesini görün.

3

İçeriği önizleme

Çözülen metin içeriğinin bir ön izlemesini görün.

Loading tool...

What Is Karakter Kodlaması Tespit Edici?

Karakter Kodlama Dedektörü, karakter kodlamalarını belirlemek için metin dosyalarını analiz eder. Kesin kodlama tanımı için Bayt Sırası İşaretçilerini (BOM) kontrol ettikten sonra, BOM'siz dosyalar için sezgisel分析 kullanır. Araç, UTF-8, UTF-16 (LE/BE), UTF-32 (LE/BE), ASCII ve ISO-8859-1/Windows-1252 kodlamalarını tanıyabilir. Sonuçlar, tespit edilen kodlama, güven düzeyi, BOM ayrıntıları, analiz açıklaması ve bir decoded içerik önizlemesini içerir.

Why Use Karakter Kodlaması Tespit Edici?

  • BOM ve heuristik bayt analizi aracılığıyla kodlama algılar.
  • UTF-8, UTF-16, UTF-32, ASCII ve Latin-1/Windows-1252'yi destekler.
  • Güven seviyesini ve tespit yöntemi ayrıntılarını gösterir.
  • Algılama doğruluğunu doğrulamak için çözülen içerik ön izlemesini içerir.

Common Use Cases

Karakter Sorunları

Doğru dosya kodlamasını belirleyerek mojibake ve karakter görüntüleme sorunlarını teşhis edin.

Veri İthalatı

Metin verilerini içe aktarmeden önce dosya kodlamasını belirleyin ve doğru karakter işlemini sağlayın.

Eski Dosyalar

UTF-8 olmayan kodlamaları kullanan eski metin dosyalarının kodlamasını belirleyin.

Geliştirme

Kaynak kodu dosyaları, CSV verileri ve yapılandırma dosyalarının kodlamalarını doğrulayın.

Technical Guide

Dedektör, çok aşamalı bir yaklaşım kullanır:

1. BOM Tespiti: İlk 4 baytı bilinen BOM dizileri için kontrol eder (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF). BOM varlığı yüksek güven düzeyli tanımı sağlar.

2. UTF-16 Sezgiseli: Null bayt kalıplarını analiz eder. UTF-16 dosyaları, ASCII karakterlerini 16-bit olarak kodladığına karşılık gelen sıralı veya tek null baytlara sahiptir.

3. UTF-8 Doğrulama: Çoklu bayt dizilerini doğrular. Geçerli UTF-8 belirli kalıplara sahiptir: 110xxxxx 10xxxxxx için 2 bayt, 1110xxxx 10xxxxxx 10xxxxxx için 3 bayt vb.

4. ASCII Tespiti: Tüm baytlar 0x00-0x7F aralığında ise, dosya saf ASCII'dir (bu aynı zamanda geçerli UTF-8'dir).

5. Latin-1 Varsayılanı: Baytlar 0x80-0xFF aralığında varsa ancak geçersiz UTF-8 dizileri oluşturmazsa, ISO-8859-1/Windows-1252 muhtemeldir.

Yalnızca performans için dosyanın ilk 8KB'si analiz edilir.

Tips & Best Practices

  • 1
    BOM algılaması en yüksek güvenliği sağlar - BOM içeren dosyalar kesin olarak belirlenir.
  • 2
    BOM'siz UTF-8, çoklu bayt dizilerini doğrulayarak algılanır.
  • 3
    ISO-8859-1 ve Windows-1252, UTF-8 doğrulaması başarısız olduğunda fallback olarak algılanır.
  • 4
    İçerik ön izlemesi, algılamanın doğru olduğunu doğrular - karışık karakterleri arayın.

Related Tools

Frequently Asked Questions

Q Tespit ne kadar doğrudur?
BOM tabanlı tespit %100 doğrudur. UTF-8 için heuristik tespit çok güvenilir. Latin-1/Windows-1252 algılaması fallback olarak kullanılır.
Q BOM nedir?
Bir Bayt Sırası İşareti, dosyanın başında bulunan ve kodlamasını belirleyen özel bir bayt dizisidir.
Q Shift-JIS veya GB2312'yi algılayabilir mi?
Şu anda, dedektör Unicode kodlamalarına ve Latin-1'e odaklanıyor. Doğu Asya kodlamaları özellikle algılanmıyor.
Q Dosyanın kaç kısmı analiz edilir?
İlk 8KB (8192 bayt) analiz edilir, bu güvenilir bir kodlama tespiti için yeterlidir.
Q Karma kodlama dosyaları nasıl işlenir?
Dedektör, her dosya için tek bir kodlama varsayar. Karma kodlama dosyaları, baskın kodu gösterir.

About This Tool

Karakter Kodlaması Tespit Edici is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.