सांख्यिकीय मशीनी अनुवाद
सांख्यिकीय मशीनी अनुवाद (Statistical machine translation (SMT)) मशीनी अनुवाद का ऐसा अल्गोरिद्म है जो दोनो भाषाओं के द्विभाषी शब्दराशि (टेक्स्ट कॉर्पस) के अध्ययन से निर्मित सांख्यिकीय मॉडल पर निर्भर करता है। यह विधि नियम पर आधारित मशीनी अनुवाद (rule-based machine translation) तथा उदाहरण पर आधारित मशीनी अनुवाद (example-based machine translation) से बिलकुल अलग है। विश्व प्रसिद्ध गूगल अनुवादक इसी सिद्धान्त के प्रयोग से अनुवाद करता है।
इतिहास
सांख्यिकीय मशीनी अनुवाद का सर्वप्रथम विचार वारेन वीवर (Warren Weaver) ने सन १९४९ में दिया था। सांख्यिकीय मशीनी अनुवाद बहुत दिनो बाद पुनः सन १९९१ में शोधकर्ताओं ने पेश किया। इसके बाद सांख्यिकीय मशीनी अनुवाद पुनः मुख्यधारा में आ गया। आज (सन २००८) में यह सर्वाधिक अध्ययन किया जाने वाला अनुवाद का तरीका बन गया है।
लाभ
- संसाधनों का बेहतर उपयोग
- प्राकृतिक भाषाओं का बहुत सी सामग्री मशीन द्वारा पढे जाने योग्य प्रारूप में विद्यमान है।
- प्रायः, सांख्यिकीय मशीनी अनुवाद (SMT) किसी विशेष भाषा-युग्म के लिये नहीं बनाये जाते। अतः किसी भी भाषा-युग्म के लिये काम करेगा।
- नियम-पर आधारित मशीनी अनुवाद के लिये मानव-श्रम लगाकर भाषायी नियम बनाने पड़ते हैं। यह एक महंगा कार्य हो सकता है; साथ ही हर भाषा के लिये अलग से मेहनत करनी पड़ती है।
- सांख्यिकीय मशीनी अनुवाद अपेक्षाकृत अधिक स्वाभाविक अनुवाद पैदा करता है।
इन्हें भी देखें
- मशीनी अनुवाद (Machine translation)
- उदाहरण पर आधारित मशीनी अनुवाद (Example-based machine translation)
- गूगल अनुवाद (Google Translate)
बाहरी कड़ियाँ
- Foundations of Statistical Natural Language Processing
- Statistical Machine Translation — includes introduction to research, conference, corpus and software listings.
- Moses: a state-of-the-art open source SMT system
- Free Translation 36 भाषाओं में सांख्यिकीय मशीन अनुवाद
- Annotated list of statistical natural language processing resources — Includes links to freely available statistical machine translation software.