इण्डिक यूनिकोड
इण्डिक यूनिकोड यूनिकोड के भारतीय लिपियों से सम्बंधित सॅक्शन को कहा जाता है। यूनिकोड के नवीनतम संस्करण ५.२ में विविध भारतीय लिपियों को मानकीकृत किया गया है जिनमें देवनागरी भी शामिल है।
यूनिकोड में शामिल भारतीय भाषायें
यूनिकोड ५.२ में निम्नलिखित भारतीय लिपियों को कूटबद्ध किया गया है:
- देवनागरी
- बंगाली लिपि
- गुजराती लिपि
- गुरुमुखी
- कन्नड़ लिपि
- लिम्बू लिपि
- मलयालम लिपि
- उड़िया लिपि
- सिंहल लिपि
- स्यलोटी नागरी
- तमिल लिपि
- तेलुगु लिपि
यूनिकोड कॉन्सोर्टियम द्वारा अब तक निर्धारित यूनिकोड ५.२ में देवनागरी के कुल १०९ वर्णों/चिह्नों का मानकीकरण किया गया है अभी देवनागरी के बहुत से वर्ण जिनमें शुद्ध व्यंजन (हलन्त व्यंजन - आधे अक्षर) तथा कई वैदिक ध्वनि चिह्न एवं अन्य चिह्न यथा स्वस्तिक आदि, यूनिकोड में शामिल नहीं हैं। शुद्द व्यंजनों के यूनिकोडित न होने के कारण वर्तमान में उन्हें सामान्य व्यंजन के साथ अलग से हलन्त लगाकर प्रकट किया जाता है जिससे कि टैक्स्ट का साइज बढ़ने के अतिरिक्त कम्प्यूटिंग सम्बंधी कई समस्याएँ आती हैं।
वैदिक संस्कृत चिह्नों को यूनिकोड में शामिल करने हेतु प्रस्तावना की गई है।[1]
भारतीय यूनिकोड की प्रमुख विशेषताएँ
कम्प्यूटर में इण्डिक यूनिकोड सक्षम करना
यदि कम्प्यूटर पर हिन्दी एवं अन्य भारतीय भाषाओं में काम करने के लिये इण्डिक यूनिकोड सक्षम कर लेना चाहिये। इसके लिए कम्प्यूटर में जो भी विंडोज़ हैं, उसकी सीडी चाहिए (जैसे- विंडोज़ २०००, विंडोज़ ऍक्सपी, विंडोज़ २००३ आदि।
- सबसे पहले सीडी को कम्प्यूटर में डाल कर स्टार्ट में जाकर कण्ट्रोल पैनल पर जायें।
- फिर रीजनल एंड लैंग्वेज विकल्प पर डबल क्लिक करके खोल लें।
- अब एक नई छोटी इन्फॉरमेशन विण्डो खुल जाएगी, जिसमें तीन टैब रीजनल ऑप्शन, लैंग्वेजेज और एडवांस दिए होंगे। लैंग्वेजेज पर क्लिक करें और इसमें नीचे की ओर दो चैक बॉक्स (इंस्टॉल फाइल फॉर कॉम्प्लेक्स स्क्रिप्ट और इंस्टॉल फाइल फॉर ईस्ट एशियन लैंग्वेजेज) दिए गए हैं। दोनों को क्लिक करके अप्लाई कर लें।
- अब अपने आप विंडोज़ की सीडी से यूनिकोड की फाइल्स कम्प्यूटर में आ जाएंगी।
- ऍक्टिवेट हो जाने के बाद एक बार कम्प्यूटर को दोबारा चालू करना होगा।
- एक बार फिर कण्ट्रोल पैनल, रीजनल एंड लैंग्वेजेज ऑप्शन और फिर लैंग्वेजेस में जाएं।
- अब लैंग्वेजेज में डिटेल्स बटन पर क्लिक करें, एक और नई इन्फॉरमेशन विण्डो खुल जाएगी।
- नई विण्डो में सैटिंग्स में क्लिक करने के बाद एड बटन पर क्लिक करें व एक छोटी-सी विण्डो एड इनपुट लैंग्वेज खुलेगी। इनमें दो ड्रॉप डाउन दिए हैं पहला यानि इनपुट लैंग्वेज में Hindi (या अन्य वाँछित भाषा) चुन लें और दूसरा यानि कीबोर्ड लेआउट में Hindi Traditional/Devanagari - InScript (या अन्य वाँछित कीबोर्ड) चुन कर ओके पर क्लिक करें।
- अब इससे पहले वाली विण्डो में देखें तो इंग्लिश के नीचे हिन्दी कीबोर्ड भी लिखा हुआ आएगा। इसी विण्डो में नीचे लैंग्वेज बार पर क्लिक करने पर एक छोटी विण्डो खुलेगी। अब शो द लैंग्वेज बार ऑन डेस्कटॉप पर चैक करके ओके करना है।
- अब कम्प्यूटर में यूनिकोड ऍक्टिवेट हो गया है। डेस्कटॉप के टास्कबार पर EN यानि इंग्लिश या डेस्कटॉप पर EN English लिखा हुआ एक छोटा सा बार आ जाएगा। उसे मिनीमाइज करने पर वह टास्कबार पर होगा। अब जब भी हिन्दी में टाइप करना हो तो नोटपैड या वर्ड खोल कर ईएन पर क्लिक करके हिन्दी पर क्लिक कर देना है। अब हिन्दी में टाइप कर सकते हैं।
इण्डिक यूनिकोड की समस्यायें
- आकार की समस्या - जैसे देवनागरी में आधा अक्षर = पूरा अक्षर + हलन्त के रूप में स्टोर होता है, अतः आधे अक्षर के लिये दो इकाई स्थान लगता है। इस कारण टैक्स्ट साइज बढ़ जाता है।
- बहुत से सॉफ्टवेयर यूनिकोड के १६ बिट का समर्थन नहीं करते, इनमें यूनिकोड टैक्स्ट यूटीऍफ-८ के रूप में स्टोर एवं प्रोसैस होता है। यूटीऍफ-८ में एक बाइट बदलकर तीन बाइट हो जाते हैं जिससे टैक्स्ट का आकार तीन गुना बढ़ जाता है। इससे कई मामलों में सेवा शुल्क भी बढ़ जाता है उदाहरण के लिये हिन्दी ऍसऍमऍस भेजने में रोमन ऍसऍमऍस की बजाय तीन गुना शुल्क लगता है।
यूनिकोडित ब्राह्मी-व्युत्पन्न लिपियाँ
ब्राह्मी लिपि से व्युत्पन्न बहुत सी लिपियाँ यूनिकोडित हो चुकी हैं। यूनिकोड के 6.0 संस्करण तक निम्नलिखित लिपियाँ इसमें शामिल कर ली गई हैं:
- ब्राह्मी लिपि (11000..1107F)
- बाली लिपि (1B00..1B7F)
- बटक लिपि (1BC0..1BFF)
- Baybayin (Tagalog) (1700..171F)
- बांग्ला लिपि (0980..09FF)
- बुहिद लिपि (1740..175F)
- बर्मी लिपि (म्यांमार)
- म्यांमार (1000..109F)
- विस्तारित म्यांमार-A (AA60..AA7F)
- चाम लिपि (AA00..AA5F)
- देवनागरी
- देवनागरी (0900..097F)
- विस्तारित देवनागरी (A8E0..A8FF)
- वैदिक विस्तार (1CD0..1CFF)
- भारतीय अंकों के साधारण रूप (A830..A83F)
- गुजराती लिपि (0A80..0AFF)
- गुरुमुखी लिपि (0A00..0A7F)
- Hanunó'o (Hanunoo) (1720..173F)
- जावा लिपि (A980..A9DF)
- कैथी लिपि (11080..110CF)
- कन्नड लिपि (0C80..0CFF)
- Kayah Li (A900..A92F)
- खमेर लिपि
- खमेर (1780..17FF)
- खमेर प्रतीक (19E0..19FF)
- लाओ लिपि (0E80..0EFF)
- लेप्चा लिपि (1C00..1C4F)
- लिम्बू लिपि (1900..194F)
- Lontara (Buginese) (1A00..1A1F)
- मलयालम लिपि (0D00..0D7F)
- Meitei Mayek (Meetei Mayek) (ABC0..ABFF)
- New Tai Lue (1980..19DF)
- ओडिया लिपि (0B00..0B7F)
- Phags-pa (A840..A87F)
- Rejang (A930..A95F)
- सौराष्ट्र लिपि (A880..A8DF)
- सिंहल लिपि (0D80..0DFF)
- Sundanese (1B80..1BBF)
- सिल्हटी नागरी (Syloti Nagri) (A800..A82F)
- Tagbanwa (1760..177F)
- Tai Dam (Tai Viet) (AA80..AADF)
- Tai Le (1950..197F)
- Tai Tham (1A20..1AAF)
- तमिल लिपि (0B80..0BFF)
- तेलुगु लिपि (0C00..0C7F)
- थाई लिपि (0E00..0E7F)
- तिब्बती लिपि (0F00..0FFF)
इन्हें भी देखें
सन्दर्भ
- ↑ "Proposals to encode Vedic characters in the UCS". मूल से 10 अक्तूबर 2010 को पुरालेखित. अभिगमन तिथि 15 अक्तूबर 2010.
बाहरी कड़ियाँ
- यूनिकोड मानकीकृत देवनागरी अक्षरों का चार्ट (पीडीऍफ फाइल रूप में)
- Unicode Entity Codes for the Devanāgarī Script
- Indic Computing Standardisation Organisation - Google Group, परिचय
- भाषायी कम्प्यूटरीकरण : एकमात्र विकल्प यूनिकोड
- Welcome Unicode 5.1: the mightier one
- Alan Wood’s Unicode Resources - इण्टरनेट पर यूनिकोड के शुरुआती दिनों में ऍलन वुड द्वारा संकलित यूनिकोड सम्बन्धी संसाधनों की सूची।