• Webdunia Deals
  1. खबर-संसार
  2. »
  3. आईटी
  4. »
  5. लर्निंग जोन
Written By ND

कंप्यूटरों की 'साक्षरता' है यूनिकोड

आईटी
- राजीव शर्मा
ND
दुनियाभर की अलग-अलग भाषाएँ, अलग-अलग फॉन्‍ट और इनके लिए अलग-अलग सॉफ्टवेयर यानी ज्ञान व सूचना के महासागर के सामने होने के बाद भी कोई एक सर्वमान्य मानक न होने के कारण कंप्यूटर 'निरक्षर'। कंप्यूटर की इस विश्वव्यापी 'विकलांगता' को दूर करने के लिए जरूरत थी एक ऐसे मानक की जिसे दुनिया की सभी भाषाओं के लिए इस्तेमाल किया जा सके।

कंप्यूटर की इस समस्या को हल किया 'यूनिकोड' ने । यह एक ऐसी प्रणाली साबित हुई जिसने कंप्यूटर जगत को वास्तव में ही 'साक्षर' बना दिया।

कंप्यूटर की इस विश्वव्यापी 'विकलांगता' को दूर करने के लिए जरूरत थी एक ऐसे मानक की जिसे दुनिया की सभी भाषाओं के लिए इस्तेमाल किया जा सके। कंप्यूटर की इस समस्या को हल किया 'यूनिकोड' ने। यह एक ऐसी प्रणाली साबित हुई जिसने कंप्यूटर जगत को वास्तव में ही 'साक्षर' बना दिया।

ND
अंग्रेजी, हिन्दी, जापानी, चीनी, अरबी, जर्मन, इतालवी, रूसी आदि हर भाषा के मर्ज की सिर्फ एक दवा, यूनिकोड। यूनिकोड में दुनियाभर की भाषाओं के प्रत्येक 'करैक्टर' (अक्षर, अंक, चि-, संकेत आदि) के लिए एक 'कोड' (विशेष संख्या) तय कर दी जाती हैं। फिर चाहे कंप्यूटर का 'ऑपरेटिंग सिस्टम', सॉफ्टवेयर या भाषा कोई भी क्यों न हो।

पूरे विश्व में आईटी क्रांति का नेतृत्व करने वाले देश भारत में कोई निश्चित मानक, नियम या पैमाना न होने के कारण हिन्दी अथवा दूसरी अन्य भाषाओं के लिए कोई एक सर्वमान्य फॉन्‍ट तैयार करना कभी संभव ही नहीं हो सका। 'जितने मुँह, उतनी बात' की तरह देश में न जाने कितनी ही आईटी कंपनियों ने अपने फायदे और सुविधा के हिसाब से तरह-तरह के फॉन्‍ट बना डाले।

क्यों है इतना खास?
कंप्यूटर मूल रूप से 'बाइनरी' (अंकीय) फोरमैट पर काम करता है। इसमें प्रत्येक 'करैक्टर' के लिए एक निश्चित अंक निर्धारित कर दिया जाता है। यूनिकोड से पहले कोई एक सर्वमान्य प्रणाली न होने के कारण इन करैक्टर के लिए सैकड़ों प्रकार की विभिन्न प्रणालियाँ थीं। इनमें से कई में तो एक ही करैक्टर के लिए अलग-अलग कोड या अलग-अलग करैक्टर के लिए एक ही कोड दे दिया जाता था।

ND
जिससे ये आपस में विरोधी हो जाती थी। इससे सभी को बहुत दिक्कत होती थी। लेकिन यूनिकोड जैसी सर्वमान्य प्रणाली के बाद ये सभी दिक्कतें खत्म हो गई। यूनिकोड में प्रत्येक भाषा के करैक्टर के लिए एक निश्चित कोड निर्धारित कर दिया जाता है। जिससे किसी भी तरह के दोहराव या गलती की कोई गुंजाइश ही नहीं रहती और प्रत्येक भाषा के करैक्टर को स्थान भी मिल जाता है।

यूनिकोड में संसार की सभी लिखी जा सकने वाली भाषाओं में प्रयुक्त होने वाले करैक्टर समेटने की क्षमता है। तकनीकी रूप में यूनिकोड 16 बिट की एनकोडिंग पर काम करता है। यह एक लाख से भी ज्यादा के करैक्टर कोड उपलब्ध करवा सकता है जोकि विश्व की सभी भाषाओं की आवश्यकता से भी कहीं ज्यादा है। इनमें से 65536 करैक्टर के तो कोड निर्धारित भी किए जा चुके हैं।

जिनमें न केवल आधुनिक, बल्कि संस्कृति, पाली या प्राकृत जैसी भाषाएँ भी शामिल हैं। इसके अलावा गणितीय या वैज्ञानिक संकेत भी शामिल हैं। यूनिकोड से पहले 7 (8) बिट वाली 'एस्की' (अमेरिकन स्टैंडर्ड कोड फोर इनफॉर्मेशन इंटरचेंज) एनकोडिंग बहुत चलन में रही, पर इसकी क्षमता 128 करैक्टर तक ही सीमित थी। जिसे अब यूनिकोड ने समाप्त कर दिया है।