कॅप्चा
कैप्चा (C॰A॰P॰T॰C॰H॰A॰ Completely Automated Public Turing test to tell Computers and Humans Apart ; 'कैप्चरिंग'), कंप्यूटर और मानव को अलग करने वाली एक तकनीक है जिसका उपयोग आनलाइन कार्यों में किया जाता है। कैप्चा एक प्रकार की चुनौती-प्रतिक्रिया परीक्षण है जिसका उपयोग गणन करने में यह निर्धारित करने के लिए किया जाता है कि उपयोगकर्ता मानव है या नहीं।[1]
यह शब्द 2002 में लुइस वॉन आह, मैनुअल ब्लम, निकोलस जे। हूपर और जॉन लैंगफोर्ड द्वारा गढ़ा गया था। [1] CAPTCHA (संस्करण 1.0 के रूप में प्रदर्शित) का सबसे आम प्रकार पहली बार 1997 में समानांतर में काम करने वाले दो समूहों द्वारा आविष्कार किया गया था। कैप्चा के इस रूप में किसी को सही ढंग से मूल्यांकन करने और उनकी स्क्रीन पर प्रदर्शित विकृत छवि में दिखाई देने वाले अक्षरों या संख्याओं के अनुक्रम को दर्ज करने की आवश्यकता होती है। क्योंकि परीक्षण एक कंप्यूटर द्वारा प्रशासित किया जाता है, मानव द्वारा प्रशासित मानक ट्यूरिंग परीक्षण के विपरीत, एक कैप्चा को कभी-कभी एक रिवर्स ट्यूरिंग परीक्षण के रूप में वर्णित किया जाता है।[2]
इस उपयोगकर्ता पहचान प्रक्रिया को कई आलोचनाएं मिली हैं, विशेष रूप से विकलांग लोगों से, लेकिन अन्य लोगों से भी जो महसूस करते हैं कि उनके रोजमर्रा के काम को विकृत शब्दों द्वारा धीमा कर दिया जाता है जिन्हें पढ़ना मुश्किल है। औसत व्यक्ति को एक विशिष्ट कैप्चा को हल करने में लगभग 10 सेकंड लगते हैं।[3]
इतिहास
इंटरनेट के शुरुआती दिनों के बाद से, उपयोगकर्ता पाठ को कंप्यूटर के लिए अवैध बनाना चाहते हैं। पहले ऐसे लोग हैकर थे, जो संवेदनशील विषयों के बारे में इंटरनेट फ़ोरम पर पोस्ट करते थे, उन्हें लगता था कि कीवर्ड पर स्वचालित रूप से नज़र रखी जा रही है। इस तरह के फिल्टर को दरकिनार करने के लिए, उन्होंने एक शब्द को लुक-एलाइक वर्णों के साथ बदल दिया. हेलो को हम |-|3|_|_()
या )-(3££0
, भी लिख सकते हैं, साथ ही कई अन्य वेरिएंट, जैसे कि एक फिल्टर संभवतः उन सभी का पता नहीं लगा सकता है। इसे बाद में लेट्सपेक के रूप में जाना गया।
कैप्चैस के शुरुआती व्यावसायिक उपयोगों में से एक गौज़बेक-लेविचिन परीक्षण था। 2000 में, idrive.com ने अपने साइनअप पृष्ठ को कैप्चा के साथ संरक्षित करना शुरू किया और इस प्रतीत होने वाली उपन्यास तकनीक पर पेटेंट दर्ज करने के लिए तैयार किया। 2001 में, पेपल ने धोखाधड़ी की रोकथाम की रणनीति के हिस्से के रूप में इस तरह के परीक्षणों का इस्तेमाल किया, जिसमें उन्होंने मनुष्यों को "विकृत पाठ को फिर से लिखने के लिए कहा, जिससे कार्यक्रमों को पहचानने में कठिनाई होती है।" पेपल कॉफ़ाउंडर और सीटीओ मैक्स लेवचिन ने इस शुरुआती उपयोग को व्यवसायिक बनाने में मदद की।
कैप्चा प्रौद्योगिकी की एक लोकप्रिय तैनाती, रिकैप्चा , 2009 में गूगल द्वारा अधिग्रहित की गई थी। अपने उपयोगकर्ताओं के लिए बॉट धोखाधड़ी को रोकने के अलावा, गूगल ने 2011 में द न्यूयॉर्क टाइम्स के अभिलेखागार और गूगल बुक्स की पुस्तकों को डिजिटल बनाने के लिए रीकैप्चा और कैप्चा तकनीक का उपयोग किया।
विशेषताएं
कॅप्टचास परिभाषा के अनुसार, पूरी तरह से स्वचालित हैं, जिनके लिए मानव रखरखाव या हस्तक्षेप की आवश्यकता होती है, लागत और विश्वसनीयता में लाभ पैदा करते हैं।
कैप्चा बनाने के लिए उपयोग किए जाने वाले एल्गोरिदम को सार्वजनिक किया जाना चाहिए, हालांकि यह एक पेटेंट द्वारा कवर किया जा सकता है। यह प्रदर्शित करने के लिए किया जाता है कि इसे तोड़ने से केवल (गुप्त) एल्गोरिथ्म की खोज के बजाय कृत्रिम बुद्धिमत्ता (एआई) के क्षेत्र में एक कठिन समस्या के समाधान की आवश्यकता होती है, जिसे रिवर्स इंजीनियरिंग या अन्य साधनों के माध्यम से प्राप्त किया जा सकता है।
आधुनिक पाठ-आधारित कॅप्टचास को इस तरह से डिज़ाइन किया गया है कि उन्हें एक साथ तीन अलग-अलग क्षमताओं-अपरिवर्तनीय मान्यता, विभाजन, और पार्सिंग के उपयोग की आवश्यकता है - किसी भी स्थिरता के साथ कार्य को सही ढंग से पूरा करने के लिए।
- अपरिवर्तनीय मान्यता से तात्पर्य है अक्षरों की आकृतियों में बड़ी मात्रा में भिन्नता को पहचानना। प्रत्येक वर्ण के लिए लगभग अनंत संस्करण हैं जिन्हें मानव मस्तिष्क सफलतापूर्वक पहचान सकता है। यह एक कंप्यूटर के लिए सच नहीं है, और इसे सिखाने के लिए उन सभी अलग-अलग संरचनाओं को पहचानना एक अत्यंत चुनौतीपूर्ण कार्य है।
- सेगमेंटेशन, या एक अक्षर को दूसरे से अलग करने की क्षमता, कॅप्टचास में भी मुश्किल होती है, क्योंकि पात्रों को एक साथ बीच में कोई सफेद जगह नहीं मिलती है।
- प्रसंग भी आलोचनात्मक है। कैप्चा Archived 2020-09-26 at the वेबैक मशीन को प्रत्येक चरित्र की सही पहचान करने के लिए समग्र रूप से समझा जाना चाहिए। उदाहरण के लिए, कैप्चा के एक सेगमेंट में, एक अक्षर "एम" की तरह लग सकता है। केवल जब पूरे शब्द को संदर्भ में लिया जाता है तो यह स्पष्ट हो जाता है कि यह एक यू और एन है।
- इनमें से प्रत्येक समस्या एक कंप्यूटर के लिए एक महत्वपूर्ण चुनौती है, यहां तक कि अलगाव में भी। एक ही समय में तीनों की मौजूदगी से कॅप्टचास को हल करना मुश्किल हो जाता है।
इनमें से प्रत्येक समस्या एक कंप्यूटर के लिए एक महत्वपूर्ण चुनौती है, यहां तक कि अलगाव में भी। एक ही समय में तीनों की मौजूदगी से कॅप्टचास को हल करना मुश्किल हो जाता है।
कंप्यूटर के विपरीत, मनुष्य इस प्रकार के कार्य में उत्कृष्टता प्राप्त करते हैं। जबकि कंप्यूटर के लिए एक छवि को समझने के लिए विभाजन और मान्यता दो अलग-अलग प्रक्रियाएं हैं, वे एक व्यक्ति के लिए उसी प्रक्रिया का हिस्सा हैं। उदाहरण के लिए, जब कोई व्यक्ति यह समझता है कि कैप्चा का पहला अक्षर एक है, तो वह व्यक्ति भी समझता है कि उस की आकृति कहां है, और यह भी कि वह अगले अक्षर के आकृति से मेल खाती है। इसके अतिरिक्त, मानव मस्तिष्क संदर्भ के आधार पर गतिशील सोच में सक्षम है। यह कई स्पष्टीकरणों को जीवित रखने में सक्षम है और फिर संदर्भीय सुराग के आधार पर पूरे इनपुट के लिए सबसे अच्छा स्पष्टीकरण है। इसका अर्थ यह भी है कि अक्षरों में बदलाव से यह मूर्खतापूर्ण नहीं होगा।
सेगमेंटेशन, या एक अक्षर को दूसरे से अलग करने की क्षमता, कॅप्टचास में भी मुश्किल होती है, क्योंकि पात्रों को एक साथ बीच में कोई सफेद जगह नहीं मिलती है।
प्रसंग भी आलोचनात्मक है। कैप्चा को प्रत्येक चरित्र की सही पहचान करने के लिए समग्र रूप से समझा जाना चाहिए। उदाहरण के लिए, कैप्चा के एक सेगमेंट में, एक अक्षर "एम" की तरह लग सकता है। केवल जब पूरे शब्द को संदर्भ में लिया जाता है तो यह स्पष्ट हो जाता है कि यह एक यू और एन है।
इनमें से प्रत्येक समस्या एक कंप्यूटर के लिए एक महत्वपूर्ण चुनौती है, यहां तक कि अलगाव में भी। एक ही समय में तीनों की मौजूदगी से कॅप्टचास को हल करना मुश्किल हो जाता है।
कंप्यूटर के विपरीत, मनुष्य इस प्रकार के कार्य में उत्कृष्टता प्राप्त करते हैं। जबकि कंप्यूटर के लिए एक छवि को समझने के लिए विभाजन और मान्यता दो अलग-अलग प्रक्रियाएं हैं, वे एक व्यक्ति के लिए उसी प्रक्रिया का हिस्सा हैं। उदाहरण के लिए, जब कोई व्यक्ति यह समझता है कि कैप्चा का पहला अक्षर एक है, तो वह व्यक्ति भी समझता है कि उस की आकृति कहां है, और यह भी कि वह अगले अक्षर के आकृति से मेल खाती है। इसके अतिरिक्त, मानव मस्तिष्क संदर्भ के आधार पर गतिशील सोच में सक्षम है। यह कई स्पष्टीकरणों को जीवित रखने में सक्षम है और फिर संदर्भीय सुराग के आधार पर पूरे इनपुट के लिए सबसे अच्छा स्पष्टीकरण है। इसका अर्थ यह भी है कि अक्षरों में बदलाव से यह मूर्खतापूर्ण नहीं होगा।
आई से संबंध
जबकि ज्यादातर सुरक्षा कारणों से उपयोग किया जाता है, कॅप्टचास कृत्रिम बुद्धिमत्ता प्रौद्योगिकियों के लिए एक बेंचमार्क कार्य के रूप में भी काम करते हैं। अहं, ब्लम और लैंगफ़ोर्ड के एक लेख के अनुसार, "किसी भी कार्यक्रम जो कैप्चा द्वारा उत्पन्न परीक्षणों को पास करता है, उसका उपयोग एक कठिन अनसुलझी आई समस्या को हल करने के लिए किया जा सकता है।"
उनका तर्क है कि सुरक्षा के लिए एक साधन के रूप में कठिन एआई समस्याओं का उपयोग करने के फायदे दुगुने हैं। या तो समस्या अनसुलझी हो जाती है और कंप्यूटर से मनुष्यों को अलग करने के लिए एक विश्वसनीय तरीका बना रहता है, या समस्या हल हो जाती है और इसके साथ एक कठिन आई समस्या हल हो जाती है। छवि और पाठ आधारित कॅप्टचास के मामले में, यदि कोई आई किसी विशेष कैप्चा डिजाइन में खामियों का दोहन किए बिना कार्य को सही ढंग से पूरा करने में सक्षम था, तो इससे एआई को विकसित करने की समस्या हल हो जाती जो दृश्यों में जटिल वस्तु मान्यता के लिए सक्षम होती है।
सन्दर्भ
1. https://web.archive.org/web/20171027203659/https://www.cylab.cmu.edu/partners/success-stories/recaptcha.html. .www.cylab.cmu.edu. 2017-10-27 को संग्रहित किया गया.EUROCRYPT 2003: International Conference on the Theory and Applications of Cryptographic Techniques.
2.वॉन आह्न, लुइस; ब्लम, मैनुअल; हॉपर, निकोलस जे।; लैंगफोर्ड, जॉन (मई 2003)। https://link.springer.com/content/pdf/10.1007/3-540-39200-9_18.pdf. (pdf). EUROCRYPT 2003: क्रिप्टोग्राफिक तकनीकों के सिद्धांत और अनुप्रयोगों पर अंतर्राष्ट्रीय सम्मेलन.
3.मयूमी तकया; युसुके त्सुरुता 2; अकिहिरो यममुरा १। http://isyou.info/jowua/papers/jowua-v4n3-3.pdf. अकिता विश्वविद्यालय।
4.बर्सजेटिन, एली; बेथर्ड, स्टीवन; फैब्री, सेलीन; मिशेल, जॉन सी।; जुराफस्की, डैन (2010)।
https://web.stanford.edu/~jurafsky/burszstein_2010_captcha.p. (pdf).