كاشف الترميز اكتشاف ترميز ملف النص (UTF-8، UTF-16، ASCII، Latin-1).
كاشف الترميز
اكتشاف ترميز ملف النص (UTF-8، UTF-16، ASCII، Latin-1).
تحميل ملف نصي
اسحب أو اختر ملفًا نصيًا لتحليله.
عرض نتيجة التشفير
انظر إلى التشفير المحسوس ، وحالة BOM ، ومستوى الثقة.
معاينة المحتوى
استعراض معاينة للمحتوى النصي المفسّر.
What Is كاشف الترميز?
كاشف الترميز يقوم بتحليل الملفات النصية لتحديد ترميز الأحرف الخاصة بها. إنه يتحقق من علامات الترتيب البايت (BOM) للحصول على تعريف ترميز نهائي ، ثم يستخدم التحليل الإحصائي للملفات التي لا تحتوي على BOM. يتكتشف الأداة ترميزات UTF-8 و UTF-16 (LE/BE) و UTF-32 (LE/BE) و ASCII و ISO-8859-1/Windows-1252. وتشمل النتائج الترميز المكتشف ومستوى الثقة و تفاصيل BOM وشرح التحليل وعرض مسبق للمحتوى المفكك.
Why Use كاشف الترميز?
-
يكتشف التشفير عبر BOM وتحليل البايتات الإحصائي.
-
يدعم UTF-8 وUTF-16 وUTF-32 وASCII وLatin-1/Windows-1252.
-
يعرض مستوى الثقة وتفاصيل طريقة الكشف.
-
يضم معاينة للمحتوى المفسّر للتأكد من دقة الكشف.
Common Use Cases
مشاكل الأحرف
تشخيص مشاكل عرض الأحرف ومشاكل Mojibake عن طريق تحديد التشفير الصحيح للملف.
استيراد البيانات
تحديد تشفير الملف قبل استيراد بيانات النص لضمان التعامل الصحيح مع الأحرف.
الملفات القديمة
تحديد التشفير المستخدم في الملفات النصية القديمة التي قد تستخدم تشفيرًا غير UTF-8.
التطوير
التأكد من تشفير ملفات المصدر وبيانات CSV والملفات التكوينية.
Technical Guide
يستخدم الكاشف نهجًا متعددة المراحل:
1. كشف BOM: يتحقق من أول 4 بايت للترتيبات المعروفة من BOM (UTF-8: EF BB BF ، UTF-16 LE: FF FE ، UTF-16 BE: FE FF ، UTF-32 LE: FF FE 00 00 ، UTF-32 BE: 00 00 FE FF). توفر وجود BOM كشفًا ذا ثقة عالية.
2. نهج UTF-16 الإحصائي: يتحليل أنماط البايتات الفارغة. تحتوي ملفات UTF-16 على بايتات فارغة متكررة في المواضع الزوجية أو الفردية المقابلة للأحرف ASCII المرمزة ب 16 بت.
3. التحقق من صحة UTF-8: يتحقق من تسلسلات البايتات المتعددة. UTF-8 الصحيح له أنماط محددة: 110xxxxx 10xxxxxx للبايتين ، 1110xxxx 10xxxxxx 10xxxxxx للبايت الثلاثة ، إلخ.
4. كشف ASCII: إذا كانت جميع البايتات في النطاق 0x00-0x7F ، فإن الملف هو ASCII خالص (وهو أيضًا UTF-8 صحيح).
5. تسرب Latin-1: إذا وجدت بايتات في النطاق 0x80-0xFF ولكنها لا تشكل تسلسلات UTF-8 صالحة ، فمن المحتمل أن يكون ISO-8859-1/Windows-1252.
يتم تحليل أول 8 كيلوبايت فقط من الملف لأداء أفضل.
Tips & Best Practices
-
1يكون الكشف عن BOM هو الأعلى ثقة - الملفات التي تحتوي على BOM يتم تحديدها بشكل قاطع.
-
2يتم كشف UTF-8 بدون BOM من خلال التحقق من تسلسلات البايت المتعددة.
-
3يتم الكشف عن ISO-8859-1 وWindows-1252 كخلفية عند فشل التحقق من UTF-8.
-
4تساعد معاينة المحتوى على التأكد من صحة الكشف - ابحث عن الأحرف المضطربة.
Related Tools
محدد صيغة الملف
اكتشاف صيغة الملف عن طريق تحليل البايتات السحرية (توقيع الملف) في الرأس.
🔄 File Conversion
كاشف نهاية السطر
اكتشاف وعد نهايات الأسطر (CRLF، LF، CR) في ملفات النص.
🔄 File Conversion
كاشف ومحذف العلامة الترتيبية للبايتات
اكتشاف وإزالة علامات ترتيب البايتات (BOM) من الملفات النصية.
🔄 File Conversion
مُشاهد بيانات ملف
استعراض بيانات ملف شاملة الحجم، النوع، الإنتروبيا، والرأس السداسي.
🔄 File ConversionFrequently Asked Questions
Q ما مدى دقة الكشف؟
Q ما هي العلامة البارزة للترتيب؟
Q هل يمكن الكشف عن Shift-JIS أو GB2312؟
Q كم من الملف يتم تحليله؟
Q ماذا في حالة ملفات الترميز المختلط؟
About This Tool
كاشف الترميز is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.