सामग्री पर जाएँ

पेजरैंक

सरल नेटवर्क (गूगल द्वारा पेजरैंक्स की सूचना लघुगणकीय रिस्केल्ड हैं) के लिए गणितीय पेजरैंक्स (100 में से).पृष्ठ E से पेज C के पेजरैंक ज्यादा है, भले ही उसके लिंक कम हैं; परन्तु जो लिंक है वे बहुत अधिक मान के हैं। एक वेब सर्फर जो प्रत्येक पृष्ठ (उन पर 15% संभावना के साथ पूरे वेब पर एक यादृच्छिक पृष्ठ पर छलांग) पर यादृच्छिक लिंक का चयन करता है, वह समय का 8.1% पृष्ठ E पर रहने जा रहा है। एक पृष्ठ पर यादृच्छिक रूप से छलांग लगाने की 15%संभावना अवमन्दन कारक के 85% से संबंधित है। बिना अवमन्दन के, सारे वेब सर्फर्स पृष्ठ A, B या C पर ख़त्म करेंगे और बाकी के सारे पृष्ठों के पेजरैंक जीरो होंगे.पृष्ठ A को वेब के सभी पृष्ठों से जुड़ा माना जाता है, क्योंकि इसका कोई निर्गामी लिंक नहीं है।

पेजरैंक, जिसका नाम लैरी पेज के नाम पर रखा गया है,[1] गूगल सर्च इंजन द्वारा प्रयोग किया जाने वाला एक लिंक विश्लेषण अल्गोरिथम है, जो दस्तावेजों के एक हाइपरलिंक-बद्ध समुच्चय, जैसे वर्ल्ड वाइड वेब, के प्रत्येक तत्व को एक अंकीय भार आवंटित करता है, ताकि समुच्चय के भीतर उसके सापेक्ष महत्व का "मापन" किया जा सके। यह अल्गोरिथम पारस्परिक उद्धरणों और संदर्भों के साथ तत्वों के किसी भी संग्रह पर लागू किया जा सकता है। दिये गये किसी तत्व E को आवंटित किये जाने वाले संख्यात्मक भार को E का पेजरैंक कहते हैं और इसे द्वारा दर्शाया जाता है।

"पेजरैंक" नाम गूगल का ट्रेडमार्क है और पेजरैंक प्रक्रिया का पेटेंट करवाया जा चुका है।अमेरिकी पेटेंट 62,85,999 हालांकि पेटेंट स्टैनफ़ोर्ड विश्वविद्यालय को दिया गया है, न कि गूगल को। गूगल के पास स्टैनफ़ोर्ड विश्वविद्यालय से प्राप्त विशिष्ट लाइसेंस अधिकार है। पेटेंट के प्रयोग के बदले विश्वविद्यालय को गूगल के 1.8 मिलियन शेयर मिले; ये शेयर 2005 में $336 मिलियन में बेच दिये गये।[2][3]

वर्णन

गूगल पेजरैंक का वर्णन इस प्रकार करता है:[4]

PageRank relies on the uniquely democratic nature of the web by using its vast link structure as an indicator of an individual page's value. In essence, Google interprets a link from page A to page B as a vote, by page A, for page B. But, Google looks at more than the sheer volume of votes, or links a page receives; it also analyzes the page that casts the vote. Votes cast by pages that are themselves "important" weigh more heavily and help to make other pages "important".

दूसरे शब्दों में, एक पेजरैंक वर्ल्ड वाइड वेब पर अन्य सभी पृष्ठों के बीच इस बारे में एक "मतदान" के द्वारा प्राप्त होता है कि कोई पृष्ठ कितना महत्वपूर्ण है। किसी पृष्ठ की ओर आने वाली एक हाइपरलिंक को समर्थन का एक मत माना जाता है। पृष्ठ का पेजरैंक दोहरावपूर्ण रूप से परिभाषित किया जाता है और यह उससे जुड़नेवाले सभी पृष्ठों ("आनेवाले लिंक") के पेजरैंक मेट्रिक और संख्या पर निर्भर होता है। जिस पृष्ठ के साथ उच्च पेजरैंक वाले अनेक पृष्ठों ने लिंक बनाए हों, उसे स्वतः ही एक उच्च रैंक मिलता है। यदि एक वेब पेज के लिये कोई लिंक न हों, तो उसके लिये कोई समर्थन नहीं होता।

गूगल इंटरनेट के प्रत्येक वेबपेज को 0-10 के बीच एक अंकीय भारण प्रदान करता है; यह पेजरैंक गूगल की नज़रों में किसी साइट के महत्व को सूचित करता है। पेजरैंक को प्राप्त करने के लिये रिक्टर पैमाने जैसे एक लघुगणकीय पैमाने पर एक सैद्धांतिक प्रायिकता का प्रयोग किया जाता है। किसी विशिष्ठ पृष्ठ का पेजरैंक मोटे तौर पर अंतर्गामी लिंक्स की मात्रा और साथ ही ये लिंक प्रदान करनेवाले पृष्ठों के पेजरैंक पर निर्भर होता है। यह ज्ञात है कि अन्य कारक, उदा. पृष्ठ पर खोज-शब्दों की उपयुक्तता और पृष्ठ पर वास्तविक भ्रमण की गूगल टूलबार द्वारा बताई गई संख्या भी पेजरैंक को प्रभावित करती है।[] हेराफ़ेरी, धोखेबाज़ी और स्पैमडेक्सिंग से बचाव के लिये, गूगल इस बारे में कोई विशिष्ट विवरण प्रदान नहीं करता कि अन्य कारक पेजरैंक को किस प्रकार प्रभावित करते हैं।[]

पेज और ब्रिन के मूल शोध-पत्र के बाद से पेजरैंक से संबंधित अनेक शैक्षणिक शोध-पत्र प्रकाशित हो चुके हैं।[5] व्यवहार में, पेजरैंक की अवधारणा हेराफ़ेरी के प्रति असुरक्षित साबित हुई है और गलत तरीके से बढ़ाई गई पेजरैंक की पहचान और गलत तरीके से बढ़ाई गई पेजरैंक के साथ जुड़नेवाले दस्तावेजों को उपेक्षित करने के तरीकों के प्रति गहन अनुसंधान समर्पित है।

वेब पृष्ठों के लिये लिंक-आधारित अन्य एल्गोरिथमों में जॉन क्लीनबर्ग द्वारा खोजा गया HITS ऐल्गरिदम (Teoma और अब Ask.com द्वारा प्रयुक्त), IBM CLEVER परियोजना और TrustRank ऐल्गरिदम शामिल हैं।

इतिहास

पेजरैंक का विकास स्टैनफ़ोर्ड विश्वविद्यालय में लैरी पेज द्वारा (इसीलिए इसे पेज -रैंक नाम दिया गया[6]) और बाद में सर्गेई ब्रिन द्वारा एक नए प्रकार के सर्च इंजन से संबंधित अनुसंधान परियोजना के एक भाग के रूप में किया गया। इस परियोजना के बारे में पहला शोध-पत्र, जिसमें पेजरैंक और Google search इंजन का प्रारंभिक प्रोटोटाइप था, 1998 में प्रकाशित हुआ[5]: कुछ ही समय बाद पेज और ब्रिन ने Google Inc., गूगल सर्च इंजन की निर्माता कम्पनी, की स्थापना की। गूगल सर्च परिणामों की रैंकिंग को निर्धारित करनेवाले अनेक कारकों में से एक होने के साथ ही पेजरैंक गूगल के सभी वेब सर्च उपकरणों के लिये आधार भी प्रदान करता है।[4]

पेजरैंक पर अवतरण विश्लेषण (citation analysis), पहले पेन्सिलवेनिया विश्वविद्यालय में 1950 के दशक में यूजीन गारफ़ील्ड द्वारा विकसित और हाइपर सर्च (Hyper Search), पैडुआ विश्वविद्यालय में मैसिमो मार्चिओरी द्वारा विकसित, से प्रभावित रहा है (गूगल के संस्थापकों ने अपने मूल शोध-पत्र में गारफ़ील्ड और मार्चिओरी के कार्यों को उद्धृत किया है[5]). जिस वर्ष पेजरैंक को प्रस्तुत किया गया (1998), उसी वर्ष जॉन क्लीनबर्ग ने HITS पर अपना महत्वपूर्ण कार्य प्रकाशित किया।

2010 में, हार्वर्ड के एक अर्थशास्त्री और 1973 के नोबेल पुरस्कार विजेता वैसिली लिओंटीफ़ के 1941 के एक शोध-पत्र को पेजरैंक की दोहरावपूर्ण कार्यविधि के प्रारंभिक बौद्धिक पूर्ववर्ती के रूप में पहचाना गया।[7][8][9]

अल्गोरिथम

पेजरैंक एक प्रायिकता वितरण है, जिसका प्रयोग यादृच्छिक रूप से लिंक्स पर क्लिक करनेवाले व्यक्ति के किसी विशिष्ट पृष्ठ पर पहुंचने की संभावना को प्रदर्शित करने के लिये किया जाता है। पेजरैंक की गणना किसी भी आकार के दस्तावेजों के संग्रह के लिये की जा सकती है। अनेक शोध पत्रों में यह माना जाता है कि गणना प्रक्रिया के प्रारंभ में ही यह वितरण संग्रह के सभी दस्तावेजों के बीच समान रूप से विभाजित कर दिया जाता है। पेजरैंक गणनाओं के लिये संग्रह के अनेक चक्रों को दोहराने की आवश्यकता होती है, जिन्हें "इटरेशन" कहते हैं, ताकि सैद्धांतिक रूप से शुद्ध मान को अधिक निकटता से प्रतिबिंबित करने हेतु पेजरैंक के अनुमानित मानों को समायोजित किया जा सके।

एक प्रायिकता 0 और 1 के बीच किसी संख्यात्मक मान के रूप में व्यक्त की जाती है। एक 0.5 प्रायिकता को सामान्यतः किसी कार्य के होने की "50% संभावना" के रूप में व्यक्त किया जाता है। अतः 0.5 पेजरैंक का अर्थ है कि इस बात की 50% संभावना है कि किसी यादृच्छिक लिंक पर क्लिक करनेवाला कोई व्यक्ति 0.5 पेजरैंक वाले किसी दस्तावेज की ओर भेजा जाएगा.

सरलीकृत अल्गोरिथम

पेजरैंक्स कैसे काम करते हैं।

चार वेब पृष्ठों: A, B, C और D, के एक छोटे से ब्रह्मांड पर विचार करें। पेजरैंक का प्रारंभिक अनुमान इन चारों दस्तावेजों के बीच समान रूप से बांटा जाएगा. अतः प्रत्येक दस्तावेज एक 0.25 के अनुमानित पेजरैंक के साथ प्रारंभ करेगा।

पेजरैंक के मूल रूप में प्रारंभिक मान केवल 1 होते थे। इसका अर्थ यह है कि सभी पृष्ठों का योगफल वेब पर पृष्ठों की कुल संख्या के बराबर था। पेजरैंक के बाद वाले संस्करण (नीचे दिये गये सूत्रों को देखें) 0 और 1 के बीच का प्रायिकता विभाजन मानते है। यहां एक सरल प्रायिकता वितरण का प्रयोग किया जाएगा- अतः प्रारंभिक मान 0.25 लिया गया है।

यदि पृष्ठ B, C और D केवल A के लिये लिंक प्रदान करते हैं, तो उनमें से प्रत्येक पृष्ठ A को 0.25 पेजरैंक प्रदान करेगा। इस प्रकार इस सरल प्रणाली में सभी पेजरैंक PR() A पर एकत्रित हों जाएंगे क्योंकि सभी लिंक्स A को सूचित कर रहे होंगे।

यह 0.75 है।

पुनः, माना कि पृष्ठ B के पास पृष्ठ C के लिये भी एक लिंक है और पृष्ठ D के पास तीनों पृष्ठों के लिये लिंक है। लिंक-मतों का मान किसी पृष्ठ पर स्थित सभी बहिर्गामी लिंक्स के बीच विभाजित किया जाता है। इस प्रकार पृष्ठ B द्वारा पृष्ठ A को दिये जाने वाले मत का मूल्य 0.125 और पृष्ठ C को दिये जाने वाले मत का मूल्य 0.125 है। D के पेजरैंक के केवल एक-तिहाई भाग की गणना ही A के पेजरैंक के लिये की जाती है (लगभग 0.083).

दूसरे शब्दों में, बहिर्गामी पृष्ठों द्वारा प्रदान किया जाने वाला पेजरैंक दस्तावेज के स्वयं के पेजरैंक स्कोर और बहिर्गामी लिंक्स की प्रसामान्यीकृत (normalized) संख्या L() के भागफल के बराबर होता है (ऐसा माना जाता है कि विशिष्ट URLs की ओर जाने वाले लिंक्स को प्रत्येक दस्तावेज में केवल एक बार गिना गया है).

सामान्य स्थिति में, किसी पृष्ठ u के पेजरैंक मान को इस प्रकार व्यक्त किया जा सकता है:

अर्थात पृष्ठ u का पेजरैंक मान समुच्च्य Bu (इस समुच्च्य में पृष्ठ u से लिंक होने वाले सभी पृष्ठ होते हैं) के प्रत्येक पृष्ठ v के पेजरैंक मान और पृष्ठ v से निकलनेवाले लिंक्स की संख्या L (v) के भागफल पर निर्भर होता है।

उदासीनता कारक

पेजरैंक सिद्धांत मानता है कि लिंक्स पर यादृच्छिक रूप से क्लिक करनेवाला कोई काल्पनिक प्रयोक्ता भी अंततः क्लिक करना बंद कर देगा। किसी भी चरण में, व्यक्ति द्वारा कार्य जारी रखे जाने की संभावना, एक उदासीनता कारक d होती है। विभिन्न अध्ययनों ने विभिन्न उदासीनता कारकों का परीक्षण किया है, लेकिन सामान्यतः यह माना जाता है कि उदासीनता कारक 0.85 के आस-पास निर्धारित किया जाएगा.[5]

उदासीनता कारक को 1 से घटाया जाता है (और ऐल्गरिदम के कुछ संस्करणों में, परिणाम को संग्रह में दस्तावेजों की संख्या (N) से भाग दिया जाता है) और इसके बाद इस मान को उदासीनता कारक और अंतर्गामी पेजरैंक स्कोर से गुणनफल में जोड़ा जाता है। अर्थात,

अतः किसी भी पृष्ठ का पेजरैंक मुख्यतः अन्य पृष्ठों के पेजरैंक से प्राप्त किया जाता है। प्राप्त किये गये मान को उदासीनता कारक नीचे की ओर समायोजित करता है। हालांकि मूल शोध-पत्र में एक भिन्न सूत्र दिया गया, जिससे कुछ भ्रम की स्थिति उत्पन्न हुई:

इन दोनों के बीच अंतर यह है कि पहले सूत्र में पेजरैंक मानों का योगफल एक होता है, जबकि दूसरे सूत्र में प्रत्येक पेजरैंक का N से गुणा किया जाता है और योगफल N बन जाता है। पेज और ब्रिन के शोध-पत्र का एक कथन कि "सभी पेजरैंकों का योगफल एक होता है"[5] और गूगल के अन्य कर्मचारियों के दावे[10] उपरोक्त सूत्र के पहले संस्करण का समर्थन करते हैं।

प्रत्येक बार वेब को क्रॉल करने पर गूगल पेजरैंक के स्कोर की पुनर्गणना करता है और अपने सूचकांक का पुनर्निर्माण करता है। गूगल द्वारा अपने संग्रहण में दस्तावेजों की संख्या बढ़ाये जाने के साथ ही, सभी दस्तावेजों के लिये पेजरैंक का प्रारंभिक अनुमान भी घटता जाता है।

यह सूत्र रैंडम सर्फ़र के एक मॉडल का प्रयोग करता है, जो कुछ क्लिक के बाद ऊब जाता है और किसी यादृच्छिक पृष्ठ की ओर चला जाता है। किसी पृष्ठ का पेजरैंक मान इस बात की संभावना को प्रतिबिंबित करता है कि रैंडम सर्फ़र किसी लिंक पर क्लिक करके उस पृष्ठ पर पहुंचेगा. इसे एक मार्कोव श्रृंखला के रूप में समझा जा सकता है, जिसमें अवस्थाएं पृष्ठ होती हैं और सभी परिवर्तनों की प्रायिकता समान होती है और वे पृष्ठों के बीच लिंक होते हैं।

यदि किसी पृष्ठ पर अन्य पृष्ठों के लिये कोई लिंक न हों, तो वह एक सिंक बन जाता है और इस कारण वह यादृच्छिक सर्फिंग प्रक्रिया को समाप्त कर देता है। हालांकि, समाधान बहुत सरल है। यदि यादृच्छिक सर्फर एक सिंक पृष्ठ पर आता है, तो वह यादृच्छिक रूप से कोई अन्य URL चुनता है और पुनः सर्फिंग जारी रखता है।

जिन पृष्ठों में कोई बहिर्गामी लिंक न हों, पेजरैंक की गणना करते समय उन्हें संग्रह के अन्य सभी पृष्ठों से जुड़ा हुआ माना जाता है। अतः उनके पेजरैंक स्कोर अन्य सभी पृष्ठों के बीच बराबर बंट जाते हैं। दूसरे शब्दों में, जो पृष्ठ सिंक नहीं हैं, उनके साथ न्याय करने के लिये, ये यादृच्छिक परिवर्तन वेब में सभी नोड्स में, सामान्यतः d =0.85 की एक शेष प्रायिकता के साथ जोड़े जाते हैं, जिसका आकलन इस आवृत्ति से किया जाता है कि एक औसत सर्फर अपने ब्राउज़र की बुकमार्क विशेषता का प्रयोग करता है।

अतः समीकरण इस प्रकार होता है:

जहां वे पृष्ठ हैं, जिन पर विचार किया जा रहा है, उन पृष्ठों का समुच्चय है, जो से जुड़ते हैं, पृष्ठ पर बहिर्गामी लिंक्स की संख्या है और N पृष्ठों की कुल संख्या है।

पेजरैंक मान संशोधित निकटता मैट्रिक्स के प्रभावी आइजन्वेक्टर की प्रविष्टियां होती हैं। यह पेजरैंक को एक विशिष्ट रूप से आकर्षक मेट्रिक्स बनाता है: आइजन्वेक्टर है

जहां R समीकरण का हल है

जहां निकटता फंक्शन 0 होता है, यदि पृष्ठ पृष्ठ से न जुड़ता हो और इसका प्रसामान्यीकरण इस प्रकार किया जाता है कि प्रत्येक i के लिये

अर्थात, प्रत्येक स्तंभ के तत्वों का योगफल 1 तक होता है (अधिक जानकारी के लिये नीचे गणना खण्ड देखें). यह आइजन्वेक्टर केंद्रीयता मापन का एक संस्करण है, जिसका प्रयोग सामान्यतः नेटवर्क विश्लेषण में किया जाता है।

उपरोक्त संशोधित आइजनवेक्टर मेट्रिक्स में बड़े आइजनगैप के कारण [11] पेजरैंक आइजन्वेक्टर के मानों का अनुमान तीव्रता से लगाया जा सकता है (केवल कुछ ही दोहरावों की आवश्यकता होती है).

मार्कोव सिद्धांत के फलस्वरूप, यह दर्शाया जा सकता है कि किसी पृष्ठ का पेजरैंक अनेक क्लिक के बाद उस पृष्ठ पर होने की प्रायिकता होता है। यह के बराबर होता है, जहां किसी पृष्ठ से पुनः उसी पृष्ठ पर वापस आने के लिये आवश्यक क्लिक (या यादृच्छिक छलांग) की संख्या का अनुमान है।

इसकी मुख्य कमी यह है कि यह पुराने पृष्ठों के प्रति पक्षपात करता है क्योंकि नया पृष्ठ, चाहे वह बहुत अच्छा भी हो, जब तक किसी पुरानी साइट का एक भाग न हो, तब तक उसके पास अनेक लिंक्स नहीं होंगे (क्योंकि साइट पृष्ठों का एक गहन रूप से जुड़ा हुआ समूह होती है, जैसे विकिपीडिया). गूगल डायरेक्ट्री (जो कि स्वयं ओपन डायरेक्ट्री प्रोजेक्ट से व्युत्पन्न है) प्रयोक्ताओं को श्रेणियों के अंतर्गत पेजरैंक के अनुसार क्रमबद्ध किये गए पृष्ठों को देखने की अनुमति देती है। गूगल डायरेक्ट्री गूगल द्वारा प्रदान की जाने वाली एकमात्र सेवा है, जहां पेजरैंक निर्देशिका प्रदर्शन क्रम का निर्धारण करती है।[] गूगल की अन्य खोज सेवाओं (जैसे इसकी प्राथमिक वेब खोज) में पेजरैंक का प्रयोग खोज के परिणामों में प्रदर्शित पृष्ठों के प्रासंगिक स्कोर के मापन के लिये किया जाता है।

पेजरैंक की गणना को गति प्रदान करने के लिये विभिन्न रणनीतियां प्रस्तावित की गईं हैं।[12]

खोज के परिणामों की रैंकिंग में सुधार करने और विज्ञापन लिंक्स का मुद्रीकरण करने के मज़बूत प्रयासों के अंतर्गत पेजरैंक में परिवर्तन करने के लिये विभिन्न रणनीतियां लागू की गईं हैं। इन रणनीतियों ने पेजरैंक की अवधारणा की विश्वसनीयता को अत्यधिक प्रभावित किया है, जो यह निर्धारित करने का प्रयास करती है कि वास्तव में किन दस्तावेजों को वेब समुदाय द्वारा उच्च मान दिया जाता है।

गूगल को लिंक फार्म और कृत्रिम रूप से पेजरैंक को बढ़ाने के लिये बनाई गई अन्य योजनाओं को दण्डित करने के लिये जाना जाता है। दिसम्बर 2007 में, गूगल ने भुगतान के द्वारा टेक्स्ट लिंक बेचने वाली साइटों को सक्रिय रूप से दण्डित करना शुरु किया। गूगल द्वारा लिंक फार्मों और पेजरैंक में परिवर्तन करने के अन्य उपकरणों की पहचान किस प्रकार की जाती है, यह गूगल के व्यापारिक रहस्यों में से एक है।

गणना

संक्षेप में, पेजरैंक की गणना दोहरावपूर्ण रूप से या बीजगणितीय रूप से की जा सकती है। वैकल्पिक तौर पर घात दोहराव विधि[13][14], या घात विधि, का प्रयोग किया जा सकता है।

दोहरावपूर्ण

पहली स्थिति में, पर, एक प्रारंभिक प्रायिकता वितरण माना जाता है, सामान्यतः

जैसा कि ऊपर वर्णित है, प्रत्येक समय चरण पर गणना निम्नलिखित परिणाम प्रदान करती है

या मैट्रिक्स संकेतन में

, (*)

जहां और केवल एक को रखनेवाला लंबाई का स्तंभ वेक्टर है।

मेट्रिक्स को इस प्रकार परिभाषित किया जाता है

अर्थात,

जहां ग्राफ के निकटता मेट्रिक्स को सूचित करता है और विकर्ण में बाहरी डिग्री के साथ एक विकर्ण मेट्रिक्स है।

गणना तब समाप्त होती है, जब किसी छोटे के लिये

अर्थात जब अभिसरण माना जाता है।

बीजगणितीय

दूसरी स्थिति में, (अर्थात, स्थिर अवस्था में), उपरोक्त समीकरण (*) इस प्रकार होता है

      (**)

समाधान निम्नलिखित के द्वारा दिया जाता है

पहचान मेट्रिक्स के साथ.

समाधान उपलब्ध है और यह के लिये अद्वितीय होता है। इसे इस बात पर ध्यान देने पर देखा जा सकता है कि अपने निर्माण के द्वारा एक स्टोकेस्टिक मेट्रिक्स है और इसलिये पेरोन-फ्रोबेनियस प्रमेय के कारण इसका आइजनमान एक है।

घात विधि

यदि मेट्रिक्स एक परिवर्तन संभावना है, अर्थात स्तंभ-स्टोकेस्टिक, जिसमें किसी स्तंभ में केवल शून्य नहीं हैं और एक प्रायिकता वितरण है (अर्थात, ), समीकरण (**) निम्नलिखित के समतुल्य है

      (***)

इस प्रकार पेजरैंक , का मुख्य आइजन्वेक्टर है। इसकी गणना करने की एक तेज़ और सरल पद्धति घात विधि का प्रयोग करना है: एक अनियंत्रित वेक्टर से शुरु करते हुए, ऑपरेटर को अनुक्रम में लागू किया जाता है, अर्थात,

जब तक

न हो.

ध्यान दें कि समीकरण (***) में, दाहिनी ओर कोष्ठकों में लिखे मेट्रिक्स की व्याख्या इस प्रकार की जा सकती है

जहां एक प्रारंभिक प्रायिकता वितरण है। वर्तमान स्थिति में

अंततः, यदि में केवल शून्य मान वाले स्तंभ हों, तो उनके स्थान पर प्रारंभिक संभावना वेक्टर रखा जाना चाहिये। दूसरे शब्दों में

जहां मेट्रिक्स को इस प्रकार परिभाषित किया जाता है।

निम्नलिखित के साथ

केवल का प्रयोग करनेवाली उपरोक्त दोनों गणनाएं समान पेजरैंक प्रदान करती हैं, यदि उनके परिणाम प्रसामान्यीकृत न हों.

दक्षता

गणना के लिये प्रयुक्त ढ़ांचे, इन विधियों के सटीक क्रियान्वयन और परिणामों की आवश्यक अचूकता के आधार पर इन तीन विधियों के गणना समय में बहुत अधिक अंतर हो सकता है। सामान्यतः यदि गणना अनेक बार की जानी है (अर्थात बढ़ते हुए नेटवर्कों के लिये) अथवा नेटवर्क का आकार बड़ा है, तो मेट्रिक्स के उत्क्रमण के कारण बीजगणितीय गणना धीमी और अधिक मेमोरी लेने वाली होती है और घात विधि सर्वाधिक दक्ष होती है।

विभिन्‍नताएं

गूगल टूलबार

गूगल टूलबार की पेजरैंक विशेषता देखे गए पृष्ठ के पेजरैंक को 0 से 1 के बीच एक पूर्णांक संख्या के रूप में दर्शाती है। सर्वाधिक लोकप्रिय वेबसाइटों का पेजरैंक 10 होता है। सबसे कम का पेजरैंक 0 होता है। टूलबार पेजरैंक मान के निर्धारण की सटीक विधि को गूगल उजागर नहीं करता, पहले इसे http://www.google.com/search?client=navclient-auto&ch=6-1484155081&features=Rank&q=info:http://www.wikipedia.org/[मृत कड़ियाँ] पर जाकर देखा जा सकता था (ध्यान दें: 23.01.2010 तक की जानकारी के अनुसार यह लिंक सेवा-शर्तों के उल्लंघन के रूप में एक गूगल त्रुटि उत्पन्न करती है) जहां www.wikipedia.org वेबसाइट का नाम है।

एक पंक्ति का निम्नलिखित जावास्क्रिप्ट URL प्रतिस्थापन करता है और इसका प्रयोग किसी भी ब्राउज़र (गूगल क्रोम सहित, जिसमें अभी गूगल टूलबार एड-इन शामिल नहीं है) के बुकमार्क बार में बुकमार्कलेट के रूप में उपयोगी हो सकने के लिये किया जाता है।

javascript:location.href='http:\/\/www.google.com\/search?client=navclient-auto&ch=6-1484155081&features=Rank&q=info:'+encodeURIComponent(location.href);

(ध्यान दें: 10 सितंबर 2009 तक की जानकारी के अनुसार उपरोक्त दो तकनीकें 403 निषिद्ध त्रुटि उत्पन्न करती हैं)

गूगल टूलबार को वर्ष में लगभग 5 बार नवीनीकृत किया जाता है, अतः यह अक्सर पुराने मान प्रदर्शित करता है। अंतिम बार इसे 13/14 फ़रवरी 2010 को अद्यतन किया गया था।[15]

SERP रैंक

SERP (सर्च इंजन रिज़ल्ट पेज) किसी मुख्य-शब्द की प्रतिक्रिया में सर्च इंजन द्वारा प्रदान किया गया वास्तविक परिणाम होता है। SERP में संबंधित पाठ्य-खण्डों वाले सभी वेब पृष्ठों के लिये लिंक्स की एक सूची होती है। किसी वेब पृष्ठ का SERP रैंक SERP पर संबंधित लिंक की स्थापना को सूचित करता है, जहां उच्च स्थापना का अर्थ है उच्च SERP रैंक. एक वेब पृष्ठ का SERP रैंक न केवल इसके पेजरैंक का एक फंक्शन होता है, बल्कि यह कारकों के अपेक्षाकृत बड़े और लगातार समायोजित होने वाले समुच्चय पर निर्भर होता है,[16][17] जिसे इंटरनेट विपणनकर्ताओं द्वारा सामान्यतः "गूगल लव" कहा जाता है।[18] SEO (सर्च इंजन ऑप्टिमाइज़ेशन) का लक्ष्य एक वेबसाइट या वेब पृष्ठों के समूह के लिये उच्चतम संभव SERP रैंक प्राप्त करना होता है।

गूगल डायरेक्ट्री पेजरैंक

गूगल डायरेक्ट्री पेजरैंक 8-इकाइयों वाला एक मापन है। इन मानों को गूगल डायरेक्ट्री में देखा जा सकता है। गूगल टूलबार, जो कि एक हरी पट्टिका पर माउस घुमाए जाने पर पेजरैंक मान दर्शाता है, के विपरीत गूगल डायरेक्ट्री पेजरैंक को एक अंकीय मान के रूप में नहीं, बल्कि केवल एक हरी पट्टिका के रूप में दर्शाता है।

असत्य या नकली पेजरैंक

हालांकि अधिकांश साइटों के लिये टूलबार में प्रदर्शित पेजरैंक को वास्तविक पेजरैंक मान (गूगल द्वारा प्रकाशन से कुछ समय पूर्व) से प्राप्त माना जाता है, परंतु इस बात पर ध्यान देना आवश्यक है कि इस मान को सरलता से बदल दिया जाता था। पिछला एक दोष यह था कि एक HTTP 302 प्रतिक्रिया या एक "रिफ़्रेश" मेटा टैग के द्वारा, उच्च पेजरैंक वाले किसी पेज की ओर भेजा जाने वाला निम्न पेजरैंक वाला कोई भी पृष्ठ गंतव्य पृष्ठ का पेजरैंक प्राप्त कर लेता था। सैद्धांतिक रूप से, कोई PR 0 पेज, जिसमें अंतर्गामी लिंक न हों, को गूगल के होम पेज की ओर भेजा जा सकता था- जिसका PR 10 है- और फिर वह नए पृष्ठ का PR उन्नत होकर PR10 हो जाता. स्पूफ़िंग की यह तकनीक, जिसे 302 गूगल जैकिंग भी कहा जाता है, प्रणाली में एक विफलता या त्रुटि के रूप में जानी जाती थी। वेबमास्टर की इच्छानुसार किसी भी पृष्ठ के पेजरैंक को बदला जा सकता है और केवल गूगल के पास ही पृष्ठ के वास्तविक पेजरैंक का अभिगम होता है। स्पूफ़िंग की पहचान सामान्यतः संदिग्ध पेजरैंक वाले URL के लिये एक गूगल खोज चलाकर की जाती है क्योंकि परिणाम एक पूर्णतः भिन्न साइट (जिसके ओर निर्देशित किया गया है) का URL प्रदर्शित करेंगे।

पेजरैंक में धोखाधड़ी करना

सर्च इंजन ऑप्टिमाइज़ेशन के उद्देश्य से कुछ कम्पनियां वेबमास्टरों को उच्च पेजरैंक वाले लिंक्स बेचने का प्रस्ताव देती हैं।[19] चूंकि उच्च-PR वाले पृष्ठों से प्राप्त लिंक्स को अधिक मूल्यवान माना जाता है, अतः वे अधिक महंगे होते हैं। अधिक यातायात प्राप्त करने और वेबमास्टर की लिंक की लोकप्रियता को बढ़ाने के लिये उच्च गुणवत्ता वाले सामग्री पृष्ठों और प्रासंगिक साइटों पर लिंक विज्ञापनों को खरीदना एक प्रभावी और अर्थक्षम विपणन रणनीति हो सकती है। हालांकि गूगल ने सार्वजनिक रूप से वेबमास्टरों को चेतावनी दी है कि यदि वे पेजरैंक और सम्मान देने के उद्देश्य से लिंक्स को बेचते हैं या ऐसा करते हुए पाए गए, तो उनकी लिंक्स का अवमूल्यन किया जाएगा (अन्य पृष्ठों के पेजरैंक की गणना करते समय उन्हें उपेक्षित कर दिया जाएगा). लिंक्स खरीदने और बेचने की पद्धति वेबमास्टर समुदाय के बीच अत्यधिक बहस का विषय है। गूगल ने वेबमास्टरों को प्रायोजित लिंक्स पर nofollow HTML एट्रीब्यूट मान का प्रयोग करने की सलाह दी है। मैट कट्स के अनुसार, गूगल उन वेबमास्टरों के प्रति चिंतित है, जो तंत्र के साथ खिलवाड़ करने का प्रयास करते हैं और इसके कारण गूगल के सर्च परिणामों की गुणवत्ता और विश्वसनीयता को घटा देते हैं।[19]

सुविचारित सर्फर मॉडल

मूल पेजरैंक ऐल्गरिदम तथाकथित यादृच्छिक सर्फर मॉडल को प्रतिबिम्बित करता है, जिसका अर्थ यह है कि किसी विशिष्ट पृष्ठ का पेजरैंक यादृच्छिक रूप से लिंक्स पर क्लिक करने पर उस पृष्ठ पर पहुंचने की सैद्धांतिक प्रायिकता से प्राप्त किया जाता है। हालांकि, वास्तविक प्रयोक्ता वेब का प्रयोग यादृच्छिक रूप से नहीं करते, बल्कि अपनी रुचि और उद्देश्य के अनुसार लिंक्स पर जाते हैं। एक पृष्ठ रैंकिंग मॉडल, जो किसी विशिष्ट पृष्ठ के महत्व को इस बात के एक फंक्शन के रूप में प्रतिबिम्बित करता है कि वास्तव में इसे कितने वास्तविक प्रयोक्ताओं द्वारा देखा गया, एक सुविचारित सर्फर मॉडल कहलाता है।[20] गूगल टूलबार देखे गए प्रत्येक पृष्ठ की सूचना गूगल को भेजता है और ऐसा करके सुविचारित सर्फर मॉडल पर आधारित पेजरैंक गणना के लिये आधार प्रदान करता है। गूगल द्वारा स्पैमडेक्सिंग का मुक़ाबला करने के लिये nofollow एट्रीब्यूट के प्रयोग का दुष्प्रभाव यह है कि वेबमास्टर सामान्यतः इसका प्रयोग बहिर्गामी लिंक पर अपना स्वयं का पेजरैंक बढ़ाने के लिये करते हैं। इसके परिणामस्वरूप वेब क्रॉलरों के लिए अनुपालन हेतु वास्तविक लिंक की हानि होती है, जो यादृच्छिक सर्फर मॉडल पर आधारित मूल पेजरैंक ऐल्गरिदम को अविश्वसनीय बना देता है। प्रयोक्ताओं की ब्राउज़िंग आदतों के बारे में गूगल द्वारा प्रदान की गई जानकारी का विश्लेषण करना nofollow एट्रीब्यूट के कारण होने वाली सूचना की हानि की कुछ हद तक पूर्ति करता है। एक पृष्ठ का SERP रैंक, जो कि खोज के परिणामों में पृष्ठ की वास्तविक स्थिति का निर्धारण करता है, अन्य कारकों के अतिरिक्त यादृच्छिक सर्फर मॉडल (पेजरैंक) और सुविचारित सर्फर मॉडल (ब्राउज़िंग आदतों) के संयोजन पर आधारित होता है।[21]

अन्य उपयोग

पेजरैंक का एक संस्करण हाल ही में पारंपरिक [[वैज्ञानिक सूचना संस्थान (Institute for Scientific Information [ISI])]] प्रभाव कारक के प्रतिस्थापन के रूप में प्रस्तावित किया गया है[22] और इसे eigenfactor.org पर लागू किया गया है। केवल किसी पत्रिका के अवतरणों को गिनने की बजाय, एक पेजरैंक पद्धति से प्रत्येक अवतरण के "महत्व" का निर्धारण किया जाता है।

शैक्षणिक शोध कार्यक्रमों द्वारा उनके स्नातकों को प्राध्यापक पदों पर स्थापित करने के उनके रिकॉर्ड के आधार पर उन्हें रैंक देना पेजरैंक का इसी प्रकार का एक नया उपयोग है। पेजरैंक के संदर्भ में, शैक्षणिक विभाग एक दूसरे से (और स्वयं से) प्राध्यापकों को नौकरी देकर एक-दूसरे से जुड़े होते हैं। [23]

पेजरैंक का प्रयोग स्थानों या सड़कों को रैंक देने के लिये किया जाता रहा है, ताकि इस बात का पूर्वानुमान लगाया जा सके कि किसी एक स्थान या सड़क पर कितने लोग (पैदल या वाहन) आते हैं।[24][25]. शाब्दिक अर्थ विज्ञान में इसका प्रयोग शब्द अर्थ असंदिग्धता (Word Sense Disambiguation)[26] और वर्डनेट सिनसेट्स (WordNet synsets) को इस आधार पर स्वचालित रूप से श्रेणीबद्ध करने के लिये किया जाता है कि उनमें कितनी मज़बूती से कोई अर्थ विज्ञान विशेषता, जैसे धनात्मकता या ऋणात्मकता, उपस्थित है। [27]

पेजरैंक के समान ही एक अन्य गतिज भारण विधि का प्रयोग विकिपीडिया की लिंक संरचना पर आधारित पाठन सूचियों को रुचि के अनुसार निर्मित करने के लिये किया जाता रहा है। [28]

एक वेब क्रॉलर पेजरैंक का प्रयोग इस बात के निर्धारण के अनेक महत्वपूर्ण मेट्रिक्स में से एक के रूप में कर सकता है कि वेब के एक क्रॉल के दौरान आगे किस URL पर जाना है। उन प्रारंभिक कार्य पत्रों में से एक, [29] जिनका प्रयोग गूगल के निर्माण के दौरान किया गया था, Efficient crawling through URL ordering है [30] , जो इस बात के निर्धारण के लिये विभिन्न महत्वपूर्ण मेट्रिक्स के प्रयोग पर चर्चा करता है कि गूगल कितनी गहराई तक और किसी साइट के कितने भाग तक क्रॉल करेगा। पेजरैंक को इन अनेक महत्वपूर्ण मेट्रिक्स में से एक के रूप में प्रस्तुत किया गया है, हालांकि कुछ अन्य भी सूचीबद्ध किये गए हैं, जैसे किसी URL के लिये अंतर्गामी और बहिर्गामी लिंक्स की संख्या और किसी साइट पर URL से मूल निर्देशिका तक की दूरी.

पेजरैंक का प्रयोग संपूर्ण वेब पर ब्लॉगस्फीयर जैसे किसी समुदाय के प्रकट प्रभाव का मापन करने की एक कार्य-पद्धति के रूप में भी किया जा सकता है। अतः यह दृष्टिकोण मापन-मुक्त नेटवर्क प्रतिमान के प्रतिबिम्ब में ध्यान के वितरण का मापन करने के लिये पेजरैंक का प्रयोग करता है।

किसी भी पारिस्थितिकी तंत्र में, पेजरैंक के एक संशोधित संस्करण का प्रयोग उन प्रजातियों के निर्धारण के लिये किया जा सकता है, जो वातावरण के स्वास्थ्य को बनाए रखने के लिये आवश्यक हों.[31]

गूगल का rel

"nofollow" option== 2005 के प्रारंभ में, HTML लिंक और एंकर तत्व के rel एट्रीब्यूट के लिये, गूगल ने एक नया मान "nofollow" लागू किया[32], ताकि वेबसाइट विकासकर्ता और ब्लॉगर ऐसे लिंक बना सकें, जिन पर गूगल पेजरैंक के उद्देश्यों के लिये विचार नहीं करेगा- ये वे लिंक्स हैं, जो पेजरैंक प्रणाली में अब "मतदान" नहीं करते. nofollow संबंध को स्पैमडेक्सिंग से मुक़ाबला करने में सहायता के एक प्रयास के रूप में जोड़ा गया था।

एक उदाहरण के रूप में, अपने पेजरैंक को बढ़ाने के लिए लोग पहले ऐसे अनेक मैसेज-बोर्ड प्रविष्टियां बनाया करते थे, जिनमें उनकी वेबसाइटों के लिंक होते थे। nofollow मान के साथ, मैसेज-बोर्ड प्रविष्टियों में सभी हाइपरलिंक्स में स्वचालित रूप से "rel='nofollow'" प्रविष्ट करने के लिये प्रशासक अपने कोड को संशोधित कर सकते हैं और इस प्रकार पेजरैंक को उन विशिष्ट प्रविष्टियों द्वारा प्रभावित होने से बचाया जा सकता है। हालांकि, परिहार की इस विधि की विभिन्न कमियां भी हैं, जैसे वास्तविक टिप्पणियों के लिंक मान को घटाना. (देखें: blogs#nofollow में स्पैम)

किसी वेबसाइट के पृष्ठों के अंतर्गत पेजरैंक के प्रवाह को मानवीय रूप से नियंत्रित करने के एक प्रयास में, अनेक वेबमास्टर पेजरैंक स्कल्पटिंग नामक पद्धति का प्रयोग करते हैं[33]- जो कि nofollow एट्रीब्यूट को रणनीतिक रूप से वेबसाइट के विशिष्ट आंतरिक लिंक्स पर रखने का कार्य है, ताकि पेजरैंक को उन पृष्ठों की ओर मोड़ा जा सके, जिन्हें वेबमास्टर सबसे महत्वपूर्ण मानता है। इस चाल का प्रयोग nofollow एट्रीब्यूट के जन्म के समय से किया जा रहा है, लेकिन अनेक व्यक्ति मानते हैं कि यह तकनीक अपनी प्रभावकारिता खो चुकी है।[34]

गूगल वेबमास्टर टूल्स से हटाया जाना

14 अक्टूबर 2009 को गूगल के कर्मचारी सुज़ैन मोस्क्वा ने पुष्टि की कि कम्पनी ने पेजरैंक को अपने वेबमास्टर टूल्स खण्ड से हटा दिया है। उनकी प्रविष्टि ने आंशिक रूप से कहा कि "हम लंबे समय से लोगों को बता रहे हैं कि उन्हें पेजरैंक पर इतना अधिक ध्यान केंद्रित नहीं करना चाहिये; ऐसा प्रतीत होता है कि अनेक साइट मालिक सोचते हैं कि यह उनके लिये सबसे महत्वपूर्ण मापन है, जो कि सत्य नहीं है।"[35] मोस्क्वा की पुष्टि के दो दिनों बाद तक भी पेजरैंक को गूगल टूलबार के वेब उपकरणों पर प्रदर्शित किया जाता रहा और मार्च 2010 तक की जानकारी के अनुसार यह अभी भी प्रदर्शित हो रहा है।

इन्हें भी देखें

नोट्स

  1. "Google Press Center: Fun Facts". www.google.com. मूल से 24 अप्रैल 2009 को पुरालेखित. अभिगमन तिथि 2009-10-05.
  2. Lisa M. Krieger (1 दिसम्बर 2005). "Stanford Earns $336 Million Off Google Stock". San Jose Mercury News, cited by redOrbit. मूल से 8 अप्रैल 2009 को पुरालेखित. अभिगमन तिथि 2009-02-25.
  3. Richard Brandt. "Starting Up. How Google got its groove". Stanford magazine. मूल से 10 मार्च 2009 को पुरालेखित. अभिगमन तिथि 2009-02-25.
  4. "गूगल प्रौद्योगिकी". मूल से 23 जून 2008 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  5. Sergey Brin, Larry Page (1998). "The Anatomy of a Large-Scale Hypertextual Web Search Engine". Proceedings of the 7th international conference on World Wide Web (WWW). Brisbane, Australia. pp. 107–117. Archived from the original on 11 सितंबर 2008. https://web.archive.org/web/20080911234529/http://dbpubs.stanford.edu:8090/pub/1998-8. अभिगमन तिथि: 25 जून 2010. 
  6. David Vise and Mark Malseed (2005). The Google Story. पृ॰ 37. आई॰ऍस॰बी॰ऍन॰ ISBN 0-553-80457-X |isbn= के मान की जाँच करें: invalid character (मदद). मूल से 28 अप्रैल 2006 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  7. arXiv, Emerging Technology from the. "Scientist Finds PageRank-Type Algorithm from the 1940s". MIT Technology Review (अंग्रेज़ी में). अभिगमन तिथि 2018-10-20.
  8. "PageRank-Type Algorithm From the 1940s Discovered - Slashdot". science.slashdot.org (अंग्रेज़ी में). मूल से 21 फ़रवरी 2010 को पुरालेखित. अभिगमन तिथि 2018-10-20.
  9. Franceschet, Massimo (2010-02-15). "PageRank: Standing on the shoulders of giants". arXiv:1002.2858 [cs]. मूल से 29 सितंबर 2015 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  10. मैट कट्स ब्लॉग: स्ट्रेट फ्रॉम गूगल: व्हाट यु नीड टू नो Archived 2010-02-07 at the वेबैक मशीन, उसके स्लाइड के 15 पृष्ठ देखें.
  11. Taher Haveliwala and Sepandar Kamvar. (2003). "The Second Eigenvalue of the Google Matrix" (PDF). Stanford University Technical Report. मूल (PDF) से 17 दिसंबर 2008 को पुरालेखित. अभिगमन तिथि 25 जून 2010. नामालूम प्राचल |month= की उपेक्षा की गयी (मदद)
  12. Gianna M. Del Corso, Antonio Gullí, Francesco Romani (2005). "Fast PageRank Computation via a Sparse Linear System". Internet Mathematics. 2 (3). मूल से 21 सितंबर 2009 को पुरालेखित. अभिगमन तिथि 25 जून 2010.सीएस1 रखरखाव: एक से अधिक नाम: authors list (link)
  13. "संग्रहीत प्रति". मूल से 29 सितंबर 2015 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  14. Arasu, A. and Novak, J. and Tomkins, A. and Tomlin, J. (2002). "PageRank computation and the structure of the web: Experiments and algorithms". Proceedings of the Eleventh International World Wide Web Conference, Poster Track. Brisbane, Australia. pp. 107–117. Archived from the original on 28 जुलाई 2011. https://web.archive.org/web/20110728164716/http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.18.5264&rep=rep1&type=pdf. अभिगमन तिथि: 25 जून 2010. 
  15. गूगल पेजरैंक की तिथियां http://www.1websitedesigner.com/google-pagerank#dates Archived 2010-04-21 at the वेबैक मशीन
  16. Aubuchon, Vaughn, "Google Ranking Factors - SEO Checklist", संग्रहीत प्रति, मूल से 19 जुलाई 2010 को पुरालेखित, अभिगमन तिथि 25 जून 2010
  17. Fishkin, Rand; Jeff Pollard (April 2, 2007). "Search Engine Ranking Factors - Version 2". seomoz.org. मूल से 7 मई 2009 को पुरालेखित. अभिगमन तिथि May 11, 2009.
  18. "संग्रहीत प्रति". मूल से 6 फ़रवरी 2010 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  19. "How to report paid links". mattcutts.com/blog. April 14, 2007. मूल से 28 मई 2007 को पुरालेखित. अभिगमन तिथि 2007-05-28.
  20. Jøsang, A. (2007), "Trust and Reputation Systems", प्रकाशित Aldini, A. (संपा॰), Foundations of Security Analysis and Design IV, FOSAD 2006/2007 Tutorial Lectures. (PDF), स्प्रिंगर LNCS 4677, पपृ॰ 209–245, आइ॰एस॰एस॰एन॰ 0302-9743, डीओआइ:10.1007/978-3-540-74810-6[मृत कड़ियाँ]
  21. SEOnotepad, "Myth of the Google Toolbar Ranking", संग्रहीत प्रति, मूल से 2 जुलाई 2010 को पुरालेखित, अभिगमन तिथि 25 जून 2010
  22. Johan Bollen, Marko A. Rodriguez, and Herbert Van de Sompel. (2006). "Journal Status". Scientometrics. 69 (3). मूल से 10 जुलाई 2020 को पुरालेखित. अभिगमन तिथि 25 जून 2010. नामालूम प्राचल |month= की उपेक्षा की गयी (मदद)सीएस1 रखरखाव: एक से अधिक नाम: authors list (link)
  23. Benjamin M. Schmidt and Matthew M. Chingos (2007). "Ranking Doctoral Programs by Placement: A New Method" (PDF). PS: Political Science and Politics. 40 (July): 523–529. मूल (PDF) से 16 अगस्त 2010 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  24. B. Jiang (2006). "Ranking spaces for predicting human movement in an urban environment" (PDF). International Journal of Geographical Information Science. 23: 823–837. मूल से 26 अगस्त 2016 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  25. Jiang B., Zhao S., and Yin J. (2008). "Self-organized natural roads for predicting traffic flow: a sensitivity study" (PDF). Journal of Statistical Mechanics: Theory and Experiment. P07008. मूल से 26 अगस्त 2016 को पुरालेखित. अभिगमन तिथि 25 जून 2010.सीएस1 रखरखाव: एक से अधिक नाम: authors list (link)
  26. रॉबर्टो नाविगली, मिरेल्ला लापता. "अनसुपर्वाइस्ड शब्द अर्थ असंदिग्धता के लिए ऐन एक्सपेरिमेंटल स्टडी ऑफ़ ग्राफ कनेक्टिविटी" Archived 2010-12-14 at the वेबैक मशीन. IEEE ट्रैनजैक्शन ऑन पैटर्न एनालिसिस ऐंड मशीन इंटेलिजेंस (TPAMI), 32(4), IEEE प्रेस, 2010, पीपी. 678-692.
  27. Andrea Esuli and Fabrizio Sebastiani. "PageRanking WordNet synsets: An Application to Opinion-Related Properties" (PDF). In Proceedings of the 35th Meeting of the Association for Computational Linguistics, Prague, CZ, 2007, pp. 424-431. मूल (PDF) से 28 जून 2007 को पुरालेखित. अभिगमन तिथि June 30, 2007. नामालूम प्राचल |dateformat= की उपेक्षा की गयी (मदद)
  28. Wissner-Gross, A. D. (2006). "Preparation of topical readings lists from the link structure of Wikipedia". Proceedings of the IEEE International Conference on Advanced Learning Technology. Rolduc, Netherlands: 825. डीओआइ:10.1109/ICALT.2006.1652568. |title= में बाहरी कड़ी (मदद)
  29. "Working Papers Concerning the Creation of Google". Google. मूल से 28 नवंबर 2006 को पुरालेखित. अभिगमन तिथि November 29, 2006. नामालूम प्राचल |dateformat= की उपेक्षा की गयी (मदद)
  30. Cho, J., Garcia-Molina, H., and Page, L. (1998). "Efficient crawling through URL ordering". Proceedings of the seventh conference on World Wide Web. Brisbane, Australia. |title= में बाहरी कड़ी (मदद)सीएस1 रखरखाव: एक से अधिक नाम: authors list (link)
  31. "गूगल ट्रिक ट्रैक्स एक्सटिंकशन". मूल से 12 मई 2011 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  32. "Preventing Comment Spam". Google. मूल से 12 जून 2005 को पुरालेखित. अभिगमन तिथि January 1, 2005. नामालूम प्राचल |dateformat= की उपेक्षा की गयी (मदद)
  33. "संग्रहीत प्रति". मूल से 14 मई 2011 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  34. "संग्रहीत प्रति". मूल से 11 मई 2011 को पुरालेखित. अभिगमन तिथि 25 जून 2010.
  35. Susan Moskwa, "PageRank Distribution Removed From WMT", http://www.google.com/support/forum/p/Webmasters/thread?tid=6a1d6250e26e9e48&hl=en, अभिगमन तिथि October 16, 2009 नामालूम प्राचल |dateformat= की उपेक्षा की गयी (मदद); गायब अथवा खाली |title= (मदद)

सन्दर्भ

बाहरी कड़ियाँ