सांख्यिकीय मशीनी अनुवाद

सांख्यिकीय मशीनी अनुवाद (Statistical machine translation (SMT)) मशीनी अनुवाद का ऐसा अल्गोरिद्म है जो दोनो भाषाओं के द्विभाषी शब्दराशि (टेक्स्ट कॉर्पस) के अध्ययन से निर्मित सांख्यिकीय मॉडल पर निर्भर करता है। यह विधि नियम पर आधारित मशीनी अनुवाद (rule-based machine translation) तथा उदाहरण पर आधारित मशीनी अनुवाद (example-based machine translation) से बिलकुल अलग है। विश्व प्रसिद्ध गूगल अनुवादक इसी सिद्धान्त के प्रयोग से अनुवाद करता है।

इतिहास

सांख्यिकीय मशीनी अनुवाद का सर्वप्रथम विचार वारेन वीवर (Warren Weaver) ने सन १९४९ में दिया था। सांख्यिकीय मशीनी अनुवाद बहुत दिनो बाद पुनः सन १९९१ में शोधकर्ताओं ने पेश किया। इसके बाद सांख्यिकीय मशीनी अनुवाद पुनः मुख्यधारा में आ गया। आज (सन २००८) में यह सर्वाधिक अध्ययन किया जाने वाला अनुवाद का तरीका बन गया है।

लाभ

संसाधनों का बेहतर उपयोग
- प्राकृतिक भाषाओं का बहुत सी सामग्री मशीन द्वारा पढे जाने योग्य प्रारूप में विद्यमान है।
- प्रायः, सांख्यिकीय मशीनी अनुवाद (SMT) किसी विशेष भाषा-युग्म के लिये नहीं बनाये जाते। अतः किसी भी भाषा-युग्म के लिये काम करेगा।
- नियम-पर आधारित मशीनी अनुवाद के लिये मानव-श्रम लगाकर भाषायी नियम बनाने पड़ते हैं। यह एक महंगा कार्य हो सकता है; साथ ही हर भाषा के लिये अलग से मेहनत करनी पड़ती है।
सांख्यिकीय मशीनी अनुवाद अपेक्षाकृत अधिक स्वाभाविक अनुवाद पैदा करता है।

इन्हें भी देखें

मशीनी अनुवाद (Machine translation)
उदाहरण पर आधारित मशीनी अनुवाद (Example-based machine translation)
गूगल अनुवाद (Google Translate)

बाहरी कड़ियाँ

Foundations of Statistical Natural Language Processing
Statistical Machine Translation — includes introduction to research, conference, corpus and software listings.
Moses: a state-of-the-art open source SMT system
Free Translation 36 भाषाओं में सांख्यिकीय मशीन अनुवाद
Annotated list of statistical natural language processing resources — Includes links to freely available statistical machine translation software.