Skip to main content

كاشف الترميز اكتشاف ترميز ملف النص (UTF-8، UTF-16، ASCII، Latin-1).

كاشف الترميز illustration
🔄

كاشف الترميز

اكتشاف ترميز ملف النص (UTF-8، UTF-16، ASCII، Latin-1).

1

تحميل ملف نصي

اسحب أو اختر ملفًا نصيًا لتحليله.

2

عرض نتيجة التشفير

انظر إلى التشفير المحسوس ، وحالة BOM ، ومستوى الثقة.

3

معاينة المحتوى

استعراض معاينة للمحتوى النصي المفسّر.

Loading tool...

What Is كاشف الترميز?

كاشف الترميز يقوم بتحليل الملفات النصية لتحديد ترميز الأحرف الخاصة بها. إنه يتحقق من علامات الترتيب البايت (BOM) للحصول على تعريف ترميز نهائي ، ثم يستخدم التحليل الإحصائي للملفات التي لا تحتوي على BOM. يتكتشف الأداة ترميزات UTF-8 و UTF-16 (LE/BE) و UTF-32 (LE/BE) و ASCII و ISO-8859-1/Windows-1252. وتشمل النتائج الترميز المكتشف ومستوى الثقة و تفاصيل BOM وشرح التحليل وعرض مسبق للمحتوى المفكك.

Why Use كاشف الترميز?

  • يكتشف التشفير عبر BOM وتحليل البايتات الإحصائي.
  • يدعم UTF-8 وUTF-16 وUTF-32 وASCII وLatin-1/Windows-1252.
  • يعرض مستوى الثقة وتفاصيل طريقة الكشف.
  • يضم معاينة للمحتوى المفسّر للتأكد من دقة الكشف.

Common Use Cases

مشاكل الأحرف

تشخيص مشاكل عرض الأحرف ومشاكل Mojibake عن طريق تحديد التشفير الصحيح للملف.

استيراد البيانات

تحديد تشفير الملف قبل استيراد بيانات النص لضمان التعامل الصحيح مع الأحرف.

الملفات القديمة

تحديد التشفير المستخدم في الملفات النصية القديمة التي قد تستخدم تشفيرًا غير UTF-8.

التطوير

التأكد من تشفير ملفات المصدر وبيانات CSV والملفات التكوينية.

Technical Guide

يستخدم الكاشف نهجًا متعددة المراحل:

1. كشف BOM: يتحقق من أول 4 بايت للترتيبات المعروفة من BOM (UTF-8: EF BB BF ، UTF-16 LE: FF FE ، UTF-16 BE: FE FF ، UTF-32 LE: FF FE 00 00 ، UTF-32 BE: 00 00 FE FF). توفر وجود BOM كشفًا ذا ثقة عالية.

2. نهج UTF-16 الإحصائي: يتحليل أنماط البايتات الفارغة. تحتوي ملفات UTF-16 على بايتات فارغة متكررة في المواضع الزوجية أو الفردية المقابلة للأحرف ASCII المرمزة ب 16 بت.

3. التحقق من صحة UTF-8: يتحقق من تسلسلات البايتات المتعددة. UTF-8 الصحيح له أنماط محددة: 110xxxxx 10xxxxxx للبايتين ، 1110xxxx 10xxxxxx 10xxxxxx للبايت الثلاثة ، إلخ.

4. كشف ASCII: إذا كانت جميع البايتات في النطاق 0x00-0x7F ، فإن الملف هو ASCII خالص (وهو أيضًا UTF-8 صحيح).

5. تسرب Latin-1: إذا وجدت بايتات في النطاق 0x80-0xFF ولكنها لا تشكل تسلسلات UTF-8 صالحة ، فمن المحتمل أن يكون ISO-8859-1/Windows-1252.

يتم تحليل أول 8 كيلوبايت فقط من الملف لأداء أفضل.

Tips & Best Practices

  • 1
    يكون الكشف عن BOM هو الأعلى ثقة - الملفات التي تحتوي على BOM يتم تحديدها بشكل قاطع.
  • 2
    يتم كشف UTF-8 بدون BOM من خلال التحقق من تسلسلات البايت المتعددة.
  • 3
    يتم الكشف عن ISO-8859-1 وWindows-1252 كخلفية عند فشل التحقق من UTF-8.
  • 4
    تساعد معاينة المحتوى على التأكد من صحة الكشف - ابحث عن الأحرف المضطربة.

Related Tools

Frequently Asked Questions

Q ما مدى دقة الكشف؟
الكشف القائم على BOM هو دقيق بنسبة 100%. الكشف الإحصائي لUTF-8 موثوق به للغاية. كشف Latin-1/Windows-1252 هو خلفية.
Q ما هي العلامة البارزة للترتيب؟
العلامة البارزة للترتيب هي تسلسل بايت خاص في بداية الملف الذي يحدد تشفيره.
Q هل يمكن الكشف عن Shift-JIS أو GB2312؟
يُركز الكاشف حاليًا على ترميزات Unicode وLatin-1. لا يتم الكشف بشكل خاص عن ترميزات شرق آسيا.
Q كم من الملف يتم تحليله؟
يتضمن التحليل أول 8 كيلوبايت (8192 بايت) ، وهو ما يكفي للكشف الموثوق عنه عن التشفير.
Q ماذا في حالة ملفات الترميز المختلط؟
ي假ف الكاشف أن هناك ترميزًا واحدًا لكل ملف. سوف تظهر الملفات ذات الترميز المختلط الترميز السائد.

About This Tool

كاشف الترميز is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.