Karakter Kodlaması Tespit Edici Metin dosyası karakter kodlamasını tespit edin (UTF-8, UTF-16, ASCII, Latin-1).
Karakter Kodlaması Tespit Edici
Metin dosyası karakter kodlamasını tespit edin (UTF-8, UTF-16, ASCII, Latin-1).
Metin dosyasını yükle
Analiz etmek için bir metin dosyası bırakın veya seçin.
Kodlama sonucunu görüntüle
Tespit edilen kodlamayı, BOM durumunu ve güven seviyesini görün.
İçeriği önizleme
Çözülen metin içeriğinin bir ön izlemesini görün.
What Is Karakter Kodlaması Tespit Edici?
Karakter Kodlama Dedektörü, karakter kodlamalarını belirlemek için metin dosyalarını analiz eder. Kesin kodlama tanımı için Bayt Sırası İşaretçilerini (BOM) kontrol ettikten sonra, BOM'siz dosyalar için sezgisel分析 kullanır. Araç, UTF-8, UTF-16 (LE/BE), UTF-32 (LE/BE), ASCII ve ISO-8859-1/Windows-1252 kodlamalarını tanıyabilir. Sonuçlar, tespit edilen kodlama, güven düzeyi, BOM ayrıntıları, analiz açıklaması ve bir decoded içerik önizlemesini içerir.
Why Use Karakter Kodlaması Tespit Edici?
-
BOM ve heuristik bayt analizi aracılığıyla kodlama algılar.
-
UTF-8, UTF-16, UTF-32, ASCII ve Latin-1/Windows-1252'yi destekler.
-
Güven seviyesini ve tespit yöntemi ayrıntılarını gösterir.
-
Algılama doğruluğunu doğrulamak için çözülen içerik ön izlemesini içerir.
Common Use Cases
Karakter Sorunları
Doğru dosya kodlamasını belirleyerek mojibake ve karakter görüntüleme sorunlarını teşhis edin.
Veri İthalatı
Metin verilerini içe aktarmeden önce dosya kodlamasını belirleyin ve doğru karakter işlemini sağlayın.
Eski Dosyalar
UTF-8 olmayan kodlamaları kullanan eski metin dosyalarının kodlamasını belirleyin.
Geliştirme
Kaynak kodu dosyaları, CSV verileri ve yapılandırma dosyalarının kodlamalarını doğrulayın.
Technical Guide
Dedektör, çok aşamalı bir yaklaşım kullanır:
1. BOM Tespiti: İlk 4 baytı bilinen BOM dizileri için kontrol eder (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF). BOM varlığı yüksek güven düzeyli tanımı sağlar.
2. UTF-16 Sezgiseli: Null bayt kalıplarını analiz eder. UTF-16 dosyaları, ASCII karakterlerini 16-bit olarak kodladığına karşılık gelen sıralı veya tek null baytlara sahiptir.
3. UTF-8 Doğrulama: Çoklu bayt dizilerini doğrular. Geçerli UTF-8 belirli kalıplara sahiptir: 110xxxxx 10xxxxxx için 2 bayt, 1110xxxx 10xxxxxx 10xxxxxx için 3 bayt vb.
4. ASCII Tespiti: Tüm baytlar 0x00-0x7F aralığında ise, dosya saf ASCII'dir (bu aynı zamanda geçerli UTF-8'dir).
5. Latin-1 Varsayılanı: Baytlar 0x80-0xFF aralığında varsa ancak geçersiz UTF-8 dizileri oluşturmazsa, ISO-8859-1/Windows-1252 muhtemeldir.
Yalnızca performans için dosyanın ilk 8KB'si analiz edilir.
Tips & Best Practices
-
1BOM algılaması en yüksek güvenliği sağlar - BOM içeren dosyalar kesin olarak belirlenir.
-
2BOM'siz UTF-8, çoklu bayt dizilerini doğrulayarak algılanır.
-
3ISO-8859-1 ve Windows-1252, UTF-8 doğrulaması başarısız olduğunda fallback olarak algılanır.
-
4İçerik ön izlemesi, algılamanın doğru olduğunu doğrular - karışık karakterleri arayın.
Related Tools
Dosya Biçim Tanımlayıcı
Dosyanın başlangıcındaki magic byte'ları (dosya imzasını) analiz ederek dosya biçimini belirler.
🔄 File Conversion
Satır Sonu Dedektörü
Metin dosyalarındaki satır sonu türlerini (CRLF, LF, CR) tespit edin ve sayın.
🔄 File Conversion
BOM Dedektörü/Kaldırıcı
Metin dosyalarından Bayt Sırası İşaretleri (BOM) tespit edin ve kaldırın.
🔄 File Conversion
Dosya Meta Verisi Görüntüleyicisi
Boyut, tür, entropi ve hex başlığı dahil kapsamlı dosya meta verilerini görüntüleyin.
🔄 File ConversionFrequently Asked Questions
Q Tespit ne kadar doğrudur?
Q BOM nedir?
Q Shift-JIS veya GB2312'yi algılayabilir mi?
Q Dosyanın kaç kısmı analiz edilir?
Q Karma kodlama dosyaları nasıl işlenir?
About This Tool
Karakter Kodlaması Tespit Edici is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.