सामग्री पर जाएँ

इण्डोवर्डनेट

इंडॉवर्डनेट [1] भारत की 18 अनुसूचित भाषाओं का एक जुड़ा हुआ शाब्दिक ज्ञान का आधार है। इसमें असमिया, बांग्ला, बोडो, गुजराती, हिंदी, कन्नड़, कश्मीरी, कोंकणी, मलयालम, मैतेई (मणिपुरी), मराठी, नेपाली, उड़िया, पंजाबी, संस्कृत, तमिल, तेलुगु और उर्दू के शब्दनेट हैं।


इस पर कार्य २००० ई में आरम्भ हुआ। सबसे पहले हिन्दी का वर्डनेट बना जिसे आईआईटी मुम्बई ने बनाया। यह २००६ ई में पूरा हुआ। बाद में अन्य भाषाओं के शब्दनेट बने और इन्हें एकसाथ जोड़ा गया।

इण्डोवर्डनेट के आंकड़े

वर्डनेट बनाने वाली भाषाओं और संस्थानों में सिनसेट की संख्या (अगस्त 2014 तक) नीचे दी गई है:

भाषा सिनसेट संस्था
असमिया14958 गुवाहाटी विश्वविद्यालय, गुवाहाटी, असम
बंगाली36346 भारतीय सांख्यिकी संस्थान, कोलकाता, पश्चिम बंगाल
बोडो15785 गुवाहाटी विश्वविद्यालय, गुवाहाटी, असम
गुजराती35599 धर्मसिंह देसाई विश्वविद्यालय, नडियाद, गुजरात
हिन्दी38607 आईआईटी बॉम्बे, मुंबई, महाराष्ट्र
कन्नड़20033 मैसूर विश्वविद्यालय, मैसूर, कर्नाटक
कश्मीरी29469 कश्मीर विश्वविद्यालय, श्रीनगर, जम्मू और कश्मीर
कोंकणी32370 गोवा विश्वविद्यालय, तालेगाओ, गोवा
मलयालम30060 अमृता विश्वविद्यालय, कोयंबटूर, तमिलनाडु
मराठी29674 आईआईटी बॉम्बे, मुंबई, महाराष्ट्र
मेइती16351 मणिपुर विश्वविद्यालय, इंफाल, मणिपुर
नेपाली11713 असम विश्वविद्यालय, सिलचर, असम
ओरिया35284 हैदराबाद केंद्रीय विश्वविद्यालय, हैदराबाद, आंध्र प्रदेश
पंजाबी32364 थापर विश्वविद्यालय और पंजाबी विश्वविद्यालय, पटियाला, पंजाब
संस्कृत23140 आईआईटी बॉम्बे, मुंबई, महाराष्ट्र
तामिल25431 तमिल विश्वविद्यालय, तंजावुर, तमिलनाडु
तेलुगू21925 द्रविड़ विश्वविद्यालय, कुप्पम, आंध्र प्रदेश
उर्दू34280 जवाहरलाल नेहरू विश्वविद्यालय, नई दिल्ली

संदर्भ

  1. Pushpak Bhattacharyya, IndoWordNet, Lexical Resources Engineering Conference 2010 (LREC 2010), Malta, May, 2010.

बाहरी कड़ियाँ