Skip to main content

एन्कोडिंग डिटेक्टर पाठ फ़ाइल वर्ण एन्कोडिंग (UTF-8, UTF-16, ASCII, Latin-1) का पता लगाएं.

एन्कोडिंग डिटेक्टर illustration
🔄

एन्कोडिंग डिटेक्टर

पाठ फ़ाइल वर्ण एन्कोडिंग (UTF-8, UTF-16, ASCII, Latin-1) का पता लगाएं.

1

टेक्स्ट फ़ाइल अपलोड करें

विश्लेषण के लिए एक टेक्स्ट फ़ाइल चुनें या ड्रॉप करें।

2

एन्कोडिंग परिणाम देखें

पता लगाए गए एन्कोडिंग, बीओएम स्थिति, और विश्वास स्तर देखें।

3

सामग्री का पूर्वावलोकन करें

डिकोडेड टेक्स्ट सामग्री का एक पूर्वावलोकन देखें।

Loading tool...

What Is एन्कोडिंग डिटेक्टर?

एन्कोडिंग डिटेक्टर टेक्स्ट फ़ाइलों का विश्लेषण करके उनकी वर्ण एन्कोडिंग निर्धारित करता है। यह स्पष्ट पहचान के लिए बाइट ऑर्डर मार्क (BOM) की जाँच करता है, और फिर BOM रहित फ़ाइलों के लिए अनुमानित विश्लेषण का उपयोग करता है। यह टूल UTF-8, UTF-16 (LE/BE), UTF-32 (LE/BE), ASCII, और ISO-8859-1/Windows-1252 एन्कोडिंग्स का पता लगाता है। परिणामों में पहचानी गई एन्कोडिंग, विश्वास स्तर, BOM विवरण, विश्लेषण व्याख्या, और एक डीकोडेड सामग्री पूर्वावलोकन शामिल होते हैं।

Why Use एन्कोडिंग डिटेक्टर?

  • बीओएम और ह्यूरिस्टिक बाइट विश्लेषण के माध्यम से एन्कोडिंग का पता लगाता है।
  • यूटीएफ़-8, यूटीएफ़-16, यूटीएफ़-32, एएससीआईआई, और लैटिन-1/विंडोज़-1252 को सपोर्ट करता है।
  • विश्वास स्तर और पता लगाने वाली विधि के विवरण दिखाता है।
  • पता लगाने की सटीकता को सत्यापित करने के लिए डिकोडेड सामग्री पूर्वावलोकन शामिल करता है।

Common Use Cases

अक्षर समस्याएं

फ़ाइल एन्कोडिंग को पहचानकर मोजीबेक और अक्षर प्रदर्शन समस्याओं का निदान करें।

डेटा आयात

टेक्स्ट डेटा आयात करने से पहले फ़ाइल एन्कोडिंग का पता लगाएं ताकि अक्षरों को सही ढंग से संभाला जा सके।

विरासत फ़ाइलें

यूटीएफ़-8 के अलावा एन्कोडिंग वाली विरासत टेक्स्ट फ़ाइलों को पहचानें।

विकास

स्रोत कोड फ़ाइलों, सीएसवी डेटा, और कॉन्फ़िगरेशन फ़ाइलों के एन्कोडिंग को सत्यापित करें।

Technical Guide

डिटेक्टर एक बहु-चरण दृष्टिकोण का उपयोग करता है:

1. BOM पहचान: पहले 4 बाइट्स में ज्ञात BOM अनुक्रमों (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF) की जाँच करता है। BOM उपस्थिति उच्च-स्तरीय पहचान प्रदान करती है।

2. UTF-16 अनुमान: शून्य बाइट पैटर्न का विश्लेषण करता है। UTF-16 फ़ाइलों में सम या विषम स्थितियों में ASCII वर्णों के लिए 16-बिट एन्कोडिंग के अनुसार शून्य बाइट्स होती हैं।

3. UTF-8 सत्यापन: बहु-बाइट अनुक्रमों को सत्यापित करता है। वैध UTF-8 में विशिष्ट पैटर्न होते हैं: 110xxxxx 10xxxxxx दो बाइट्स के लिए, 1110xxxx 10xxxxxx 10xxxxxx तीन बाइट्स के लिए, आदि।

4. ASCII पहचान: यदि सभी बाइट्स 0x00-0x7F सीमा में हैं, तो फ़ाइल शुद्ध ASCII (जो वैध UTF-8 भी है) है।

5. लैटिन-1 फॉलबैक: यदि 0x80-0xFF सीमा में बाइट्स मौजूद हैं लेकिन वैध UTF-8 अनुक्रम नहीं बनाते हैं, तो ISO-8859-1/Windows-1252 की संभावना अधिक होती है।

केवल फ़ाइल के पहले 8KB का विश्लेषण प्रदर्शन के लिए किया जाता है।

Tips & Best Practices

  • 1
    बीओएम पता लगाने से उच्चतम विश्वास मिलता है - बीओएम वाली फ़ाइलें निश्चित रूप से पहचानी जाती हैं।
  • 2
    यूटीएफ़-8 को बहु-बाइट अनुक्रमों को सत्यापित करके पहचाना जाता है।
  • 3
    आईएसओ-8859-1 और विंडोज़-1252 को यूटीएफ़-8 सत्यापन असफल होने पर फॉलबैक के रूप में पहचाना जाता है।
  • 4
    सामग्री पूर्वावलोकन पता लगाने की सटीकता को सत्यापित करने में मदद करता है - गड़बड़ी वाले अक्षरों को देखें।

Related Tools

Frequently Asked Questions

Q पता लगाने की सटीकता कितनी है?
बीओएम-आधारित पता लगाना 100% सटीक है। यूटीएफ़-8 के लिए ह्यूरिस्टिक पता लगाना बहुत विश्वसनीय है। लैटिन-1/विंडोज़-1252 पता लगाना एक फॉलबैक है।
Q बीओएम क्या है?
एक बाइट ऑर्डर मार्क एक विशेष बाइट अनुक्रम है जो फ़ाइल की शुरुआत में इसके एन्कोडिंग की पहचान करता है।
Q क्या यह शिफ्ट-जेआईएस या जीबी2312 का पता लगा सकता है?
वर्तमान में, डिटेक्टर यूनिकोड एन्कोडिंग और लैटिन-1 पर ध्यान केंद्रित करता है। पूर्वी एशियाई एन्कोडिंग विशेष रूप से पहचानी नहीं जाती हैं।
Q फ़ाइल का कितना भाग विश्लेषण किया जाता है?
पहले 8केबी (8192 बाइट्स) का विश्लेषण किया जाता है, जो विश्वसनीय एन्कोडिंग पता लगाने के लिए पर्याप्त है।
Q मिश्रित एन्कोडिंग फ़ाइलों के बारे में क्या?
डिटेक्टर एक फ़ाइल प्रति एकल एन्कोडिंग मानता है। मिश्रित एन्कोडिंग वाली फ़ाइलें प्रमुख एन्कोडिंग दिखाएंगी।

About This Tool

एन्कोडिंग डिटेक्टर is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.