Tag: छत्तीसगढ़ी भाषा के उन्नयन हेतु केंद्रीय भारतीय भाषा संस्थान का मैसूर आगमन

  • छत्तीसगढ़ी भाषा के उन्नयन हेतु केंद्रीय भारतीय भाषा संस्थान का मैसूर आगमन

    छत्तीसगढ़ी भाषा के उन्नयन हेतु केंद्रीय भारतीय भाषा संस्थान का मैसूर आगमन

    रायपुर 17 जनवरी 2023/

    भारतीय भाषाओं के लिए लिग्विस्टिक डेटा कंसोर्शियम उच्च शिक्षा विभाग मानव संसाधन और विकास मंत्रालय, भारत सरकार की एक योजना है, जिसे 2007 में स्थापित किया गया है, जोकि केंद्रीय भारतीय भाषा संस्थान, मैसूर द्वारा कार्यान्वित है।
    भारतीय भाषा के लिए लिंग्विस्टिक डेटा कंसोशिरयम ने अपने डेटा वितरण पोर्टल के माध्यम से 4 अप्रैल, 2019 से आर्टिफिशियल
    इंटेलिजेंस और प्राकृतिक भाषा संसाधन के लिए मुख्य रूप से भारतीय भाषाओं में भाषाई संसाधनों का वितरण शुरू कर दिया है, इस पोर्टल का अनावरण माननीय उपराष्ट्रपति श्री वेंकैया नायडू द्वारा किया गया है।

    भारतीय भाषाओं के लिए लिंग्विस्टिक डेटा कंसोशिरिम डाटा पोर्टलपर* विभिन्न भारतीय भाषाओं के 42 डाटासेट जारी किया है, जैसे, मानक मौलिक टेक्स्ट कॉर्पस बंगाली, बोडो, डोगरी, गुजराती, हिंदी, कन्नड़, कश्मीरी, कोंकणी, मैथिली, मलयालम, मणिपुरी, मराठी, नेपाली, उडिया, पंजाबी, तमिल, तेलुगु, उर्दू, असमिया।

    मौलिक स्पीच कॉर्पस_ बंगाली, बोडो, हिंदी, कन्नड, कोकणी, मैथिली, मलयालम, मणिपुरी, मराठी,
    नेपाली, पंजाबी, तेलुगु, उर्दू, गुजराती, तमिल, डोगरी, कश्मीरी, उड़िया, असमिया, गुजराती, (एकल),
    बहुभाषी भारतीय-अंग्रेज़ी (बंगाली) भारतीय-अंग्रेज़ी (कन्नड)।

    मशीन लर्निंग की प्रक्रिया में टेक्स्ट डाटासेट का उपयोग कई प्रकार की भाषा मोडलिंग कार्यों के लिए किया जा सकता है। इसके अतिरिक्त, एलडीसी आईएल के सभी डाटासेट अपनी भाषा के प्रतिनिधि हैं, उनका उपयोग कई प्रकार के भाषाई विश्लेषण के लिए भी किया जा सकता है और यह भाषा और भाषाई अध्ययन तथा भाषा-तकनीक के कई उपविषयों में उपयोगी हो सकता है। स्पीच डाटासेट का उपयोग ऑटोमेटिक स्पीच रेकग्निशन और टेक्स्ट से स्पीच सिस्टम के लिए और साथ ही अन्य प्रकार के स्वन विज्ञान, स्वनिम विज्ञान और ध्वनिक विश्लेषण के लिए किया जा सकता है।

    वर्तमान में एलडीसी _आईएल द्वारा पार्ट ऑफ स्पीच , टैगिंग, मॉर्फ़ोलॉजिकल एनालाइजर , चकिंग और पासिंग, स्पीच डाटा सेगमेंटेशन और एनोटेशन फॉर ऑटोमैटिक स्पीच रेकग्निशन आदि कार्य किए जा रहे हैं।
    छत्तीसगढ़ी डाटा ,स्पीच एवं टेक्स्ट बुक, के संग्रह के लिए एल डी सी आई एल, भारतीय भाषा संस्थान मैसूर से
    डॉ. सत्येन्द्र अवस्थी ,सौरभ वारिक, डॉ. सृष्टि सिंह, शांतनु झा , रूपेश पाडे, अंकिता तिवारी आदि विश्वविद्यालय आए हुए हैं।

    डॉ अवस्थी ने बताया कि संस्थान द्वारा छत्तीसगढ़ी के संवर्धन एवं भाषाई तकनीक के विकास के लिए डाटा का संग्रह किया जा रहा है। यह भाषाई तकनीक के लिए अत्यन्त आवश्यक है।
    मैसूर ,केंद्रीय भारतीय भाषा संस्थान से आई हुई पूरी टीम को रविशंकर वि. वि. के. भाषा एवं साहित्य एवं भाषा – अध्ययनशाला
    का सानिध्य प्राप्त हुआ। जिसमें विभाग की अध्यक्ष प्रो. शैल शर्मा, एवं अन्य प्राध्यापकगणों का सहयोग प्राप्त हुआ। इस कार्य हेतु मुख्य सहयोगी के रूप में श्रीमती गीता शर्मा, डॉ. विभाषा मिश्र, श्री गजेन्द्र साहू श्री गुलशन वर्मा , श्री रूपेंद्र साहू . ललिता साहू , श्री टाकेश्वर साहू रहे।