एन्कोडिंग डिटेक्टर पाठ फ़ाइल वर्ण एन्कोडिंग (UTF-8, UTF-16, ASCII, Latin-1) का पता लगाएं.
एन्कोडिंग डिटेक्टर
पाठ फ़ाइल वर्ण एन्कोडिंग (UTF-8, UTF-16, ASCII, Latin-1) का पता लगाएं.
टेक्स्ट फ़ाइल अपलोड करें
विश्लेषण के लिए एक टेक्स्ट फ़ाइल चुनें या ड्रॉप करें।
एन्कोडिंग परिणाम देखें
पता लगाए गए एन्कोडिंग, बीओएम स्थिति, और विश्वास स्तर देखें।
सामग्री का पूर्वावलोकन करें
डिकोडेड टेक्स्ट सामग्री का एक पूर्वावलोकन देखें।
What Is एन्कोडिंग डिटेक्टर?
एन्कोडिंग डिटेक्टर टेक्स्ट फ़ाइलों का विश्लेषण करके उनकी वर्ण एन्कोडिंग निर्धारित करता है। यह स्पष्ट पहचान के लिए बाइट ऑर्डर मार्क (BOM) की जाँच करता है, और फिर BOM रहित फ़ाइलों के लिए अनुमानित विश्लेषण का उपयोग करता है। यह टूल UTF-8, UTF-16 (LE/BE), UTF-32 (LE/BE), ASCII, और ISO-8859-1/Windows-1252 एन्कोडिंग्स का पता लगाता है। परिणामों में पहचानी गई एन्कोडिंग, विश्वास स्तर, BOM विवरण, विश्लेषण व्याख्या, और एक डीकोडेड सामग्री पूर्वावलोकन शामिल होते हैं।
Why Use एन्कोडिंग डिटेक्टर?
-
बीओएम और ह्यूरिस्टिक बाइट विश्लेषण के माध्यम से एन्कोडिंग का पता लगाता है।
-
यूटीएफ़-8, यूटीएफ़-16, यूटीएफ़-32, एएससीआईआई, और लैटिन-1/विंडोज़-1252 को सपोर्ट करता है।
-
विश्वास स्तर और पता लगाने वाली विधि के विवरण दिखाता है।
-
पता लगाने की सटीकता को सत्यापित करने के लिए डिकोडेड सामग्री पूर्वावलोकन शामिल करता है।
Common Use Cases
अक्षर समस्याएं
फ़ाइल एन्कोडिंग को पहचानकर मोजीबेक और अक्षर प्रदर्शन समस्याओं का निदान करें।
डेटा आयात
टेक्स्ट डेटा आयात करने से पहले फ़ाइल एन्कोडिंग का पता लगाएं ताकि अक्षरों को सही ढंग से संभाला जा सके।
विरासत फ़ाइलें
यूटीएफ़-8 के अलावा एन्कोडिंग वाली विरासत टेक्स्ट फ़ाइलों को पहचानें।
विकास
स्रोत कोड फ़ाइलों, सीएसवी डेटा, और कॉन्फ़िगरेशन फ़ाइलों के एन्कोडिंग को सत्यापित करें।
Technical Guide
डिटेक्टर एक बहु-चरण दृष्टिकोण का उपयोग करता है:
1. BOM पहचान: पहले 4 बाइट्स में ज्ञात BOM अनुक्रमों (UTF-8: EF BB BF, UTF-16 LE: FF FE, UTF-16 BE: FE FF, UTF-32 LE: FF FE 00 00, UTF-32 BE: 00 00 FE FF) की जाँच करता है। BOM उपस्थिति उच्च-स्तरीय पहचान प्रदान करती है।
2. UTF-16 अनुमान: शून्य बाइट पैटर्न का विश्लेषण करता है। UTF-16 फ़ाइलों में सम या विषम स्थितियों में ASCII वर्णों के लिए 16-बिट एन्कोडिंग के अनुसार शून्य बाइट्स होती हैं।
3. UTF-8 सत्यापन: बहु-बाइट अनुक्रमों को सत्यापित करता है। वैध UTF-8 में विशिष्ट पैटर्न होते हैं: 110xxxxx 10xxxxxx दो बाइट्स के लिए, 1110xxxx 10xxxxxx 10xxxxxx तीन बाइट्स के लिए, आदि।
4. ASCII पहचान: यदि सभी बाइट्स 0x00-0x7F सीमा में हैं, तो फ़ाइल शुद्ध ASCII (जो वैध UTF-8 भी है) है।
5. लैटिन-1 फॉलबैक: यदि 0x80-0xFF सीमा में बाइट्स मौजूद हैं लेकिन वैध UTF-8 अनुक्रम नहीं बनाते हैं, तो ISO-8859-1/Windows-1252 की संभावना अधिक होती है।
केवल फ़ाइल के पहले 8KB का विश्लेषण प्रदर्शन के लिए किया जाता है।
Tips & Best Practices
-
1बीओएम पता लगाने से उच्चतम विश्वास मिलता है - बीओएम वाली फ़ाइलें निश्चित रूप से पहचानी जाती हैं।
-
2यूटीएफ़-8 को बहु-बाइट अनुक्रमों को सत्यापित करके पहचाना जाता है।
-
3आईएसओ-8859-1 और विंडोज़-1252 को यूटीएफ़-8 सत्यापन असफल होने पर फॉलबैक के रूप में पहचाना जाता है।
-
4सामग्री पूर्वावलोकन पता लगाने की सटीकता को सत्यापित करने में मदद करता है - गड़बड़ी वाले अक्षरों को देखें।
Related Tools
फ़ाइल प्रारूप पहचानकर्ता
हेडर में मैजिक बाइट्स (फ़ाइल हस्ताक्षर) का विश्लेषण करके फ़ाइल प्रारूप का पता लगाएं।
🔄 File Conversion
लाइन एंडिंग डिटेक्टर
पाठ फ़ाइलों में लाइन समाप्ति प्रकार (CRLF, LF, CR) का पता लगाएं और गिनती करें।
🔄 File Conversion
बीओएम डिटेक्टर/रिमूवर
टेक्स्ट फ़ाइलों से बाइट ऑर्डर मार्क (BOM) का पता लगाएं और हटाएं।
🔄 File Conversion
फ़ाइल मेटाडेटा व्यूअर
आकार, प्रकार, एंट्रॉपी और हेक्स हेडर सहित विस्तृत फ़ाइल मेटाडेटा देखें।
🔄 File ConversionFrequently Asked Questions
Q पता लगाने की सटीकता कितनी है?
Q बीओएम क्या है?
Q क्या यह शिफ्ट-जेआईएस या जीबी2312 का पता लगा सकता है?
Q फ़ाइल का कितना भाग विश्लेषण किया जाता है?
Q मिश्रित एन्कोडिंग फ़ाइलों के बारे में क्या?
About This Tool
एन्कोडिंग डिटेक्टर is a free online tool by FreeToolkit.ai. All processing happens directly in your browser — your data never leaves your device. No registration or installation required.