प्रोग्रामर के दृष्टिकोण से आधुनिक SEO अनुकूलन

Aleksandr Shitik

मैं अपने पोस्ट और किताबें लिखता हूँ, और फ़िल्मों और किताबों की समीक्षाएँ करता हूँ। ब्रह्मांड विज्ञान और खगोल विज्ञान, आईटी, उत्पादकता और योजना के क्षेत्र में विशेषज्ञ।

16 जुलाई 2022

सामग्री

परिचय

मैं लगभग 5 वर्षों से वित्त, अर्थशास्त्र और व्यवसाय के क्षेत्र में एक उत्पाद कंपनी में काम कर रहा हूँ। इस विषय क्षेत्र के अलावा, हमारे पास एक दूसरी, कम महत्वपूर्ण नहीं — SEO-ऑप्टिमाइजेशन 📈 है। मेरी पिछली नौकरी एक वेब स्टूडियो थी, जहाँ मैंने ढेर सारे छोटे और मध्यम वेबसाइटें बनाई, जिनमें से कुछ को खोज इंजनों के लिए ऑप्टिमाइज किया गया था। इन दोनों स्थानों पर ऑप्टिमाइजेशन की गुणवत्ता में काफी अंतर है। वर्तमान नौकरी में इस पर बहुत ध्यान दिया जाता है, और यह बेकार नहीं है, हमारे पास हमेशा 5-7 SEO विशेषज्ञों की टीम होती है। इसके अलावा, कंपनी के प्रबंधक भी उत्कृष्ट SEO विशेषज्ञ हैं 👨‍💼। इस समय के दौरान मैंने उनके बीच कई बुद्धिमान शब्द सुने हैं, जिनमें से कुछ मैंने अच्छी तरह से समझे हैं।

SEO-ऑप्टिमाइजेशन

सैद्धांतिक और तकनीकी SEO-ऑप्टिमाइजेशन

SEO-ऑप्टिमाइजेशन में मैं दो दिशाओं को अलग करूंगा: पहली — यह सभी के लिए परिचित SEO है, जिसे मैं सैद्धांतिक या बस सामान्य कहूंगा, और दूसरी — तकनीकी।

पहली 📊 — यह वही है जो सभी SEO विशेषज्ञ करते हैं: प्रतिस्पर्धियों का विश्लेषण, वर्डस्टेट जैसे खोज सेवाओं का उपयोग, सेमांटिक कोर का निर्माण और वेबसाइट या वेबसाइट के विशेष अनुभाग के लॉन्च से पहले की अन्य गतिविधियाँ।

दूसरी ⚙️ दिशा, जिसे मैं उजागर करना चाहता हूँ, वह है तकनीकी SEO। मेरी राय में, यह सैद्धांतिक SEO के बाद काफी देर से आई, क्योंकि इंटरनेट के प्रारंभिक वर्षों में इस पहलू की किसी को ज्यादा परवाह नहीं थी, और खोज इंजनों के एल्गोरिदम ने इस पर काफी कम ध्यान दिया। वर्तमान कंपनी में काम करते हुए मेरे पास तकनीकी SEO-ऑप्टिमाइजेशन की एक स्पष्ट सूची 📋 बन गई है, और शायद कभी मैं इसके बारे में भी लिखूंगा, उदाहरण के लिए, कहीं काम पर पोस्ट में, लेकिन शायद यह मेरे ब्लॉग में नहीं होगा, क्योंकि ये समझने के लिए जटिल तकनीकी बातें हैं जिन्हें मैं अपने ब्लॉग में प्रकाशित नहीं करता।

वर्डस्टेट — यांडेक्स कंपनी की एक सेवा है जो यह समझने और विश्लेषण करने की अनुमति देती है कि यांडेक्स खोज इंजन के उपयोगकर्ता किस प्रकार के प्रश्नों को सबसे अधिक खोजते हैं।
वेबसाइट का सेमांटिक कोर (सेमांटिक्स) — यह कुंजीशब्दों और वाक्यांशों की एक सूची है जो लक्षित आगंतुकों को वेबसाइट पर लाती है, जिसका उपयोग वेबसाइट को खोज इंजनों में प्रमोट करने के लिए किया जाता है।

लेख लिखने के लिए ट्रिगर्स

इस लेख में मुख्य रूप से सैद्धांतिक SEO-ऑप्टिमाइजेशन और इसकी वर्तमान दिन की अपूर्णता पर चर्चा होगी। हालाँकि, चूंकि यह तकनीकी से निकटता से जुड़ा हुआ है, मैं तकनीकी कार्यों का एक हिस्सा भी बेकार कहूँगा यदि हमारे पास आदर्श खोज प्रणालियाँ होतीं।

इस लेख को लिखने का विचार एक काल्पनिक राय से आया है जिसे मैं लगातार सुनता हूँ (यहाँ तक कि काम पर), कि खोज प्रणालियाँ अब न्यूरल नेटवर्क की मदद से इतनी विकसित हो गई हैं कि उन्हें धोखा देना असंभव है 🤖, कि वे बहुत बुद्धिमान हैं। हर साल रैंकिंग के लिए अधिक कारकों का उपयोग किया जाता है, लेकिन क्या वे वास्तव में SEO-ऑप्टिमाइजेशन की समग्र तस्वीर को बेहतर बनाते हैं? मेरी राय में, नहीं! आइए इसे समझने की कोशिश करते हैं।

रैंकिंग (खोज परिणामों में) — विभिन्न वेबसाइटों और लिंक के लिए प्रश्न की खोज परिणामों में प्राथमिकताओं का निर्धारण करना। दूसरे शब्दों में, रैंकिंग करते समय खोज प्रणाली तय करती है कि एक ही प्रश्न पर एक वेबसाइट पहले पृष्ठ की पहली पंक्ति पर क्यों होनी चाहिए जबकि दूसरी कहीं दूसरे पृष्ठ के मध्य में होनी चाहिए।

इस तरह या उस तरह से, मैं काम पर नियमित रूप से SEO का सामना करता हूँ, कभी-कभी तो कुछ पढ़ता भी हूँ। इस वर्ष मैंने रामज़ान मिंदुबाएव, दिमित्री बुलातोव और अल्बर्ट सफ़िन द्वारा लिखी गई पुस्तक 📗 "वेबसाइट प्रमोशन का उज्ज्वल पक्ष" पढ़ी। मैंने इस पुस्तक के साथ कई वीडियो सामग्री भी देखी। लेखक इसे वेबसाइट प्रमोशन का उज्ज्वल पक्ष कहते हैं। लेकिन मेरे लिए यह अधिकतर SEO का काला पक्ष और बेकार तथा मूर्खतापूर्ण कामों का ढेर है। निश्चित रूप से, यह इतना काला पक्ष नहीं है जब लोग उदाहरण के लिए खोज इंजनों को धोखा देने के लिए पूरी तरह से छिपे हुए ब्लॉक में सभी कुंजीशब्दों को सूचीबद्ध करते थे। लेकिन फिर भी मुझे आधुनिक SEO में कोई उज्ज्वल पक्ष नहीं दिखता; मुझे केवल खोज प्रणालियों की अपूर्णता दिखाई देती है। मैं किसी भी तरह से आधुनिक SEO विशेषज्ञों की उनकी विधियों के लिए आलोचना नहीं कर रहा हूँ। वे केवल मौजूदा नियमों के अनुसार खेलते हैं और ऑप्टिमाइजेशन के सभी संभव और अनुमेय तरीकों का उपयोग करते हैं।

तो खोज इंजनों में क्या गलत है?

मैं अपनी सभी असंतोषजनक बातों को कुछ बिंदुओं में विभाजित करने की कोशिश करूंगा और प्रत्येक पर विस्तार से चर्चा करूंगा।

1. एल्गोरिदम और रैंकिंग कारक। 🔝

कई कारक और मानदंड होते हैं जिनके आधार पर खोज प्रणाली सामग्री "गुणवत्ता" का मूल्यांकन करती है। प्रत्येक प्रणाली में ऐसे मानदंडों की संख्या भिन्न हो सकती है। उदाहरण के लिए यांडेक्स में 200 से अधिक कारक होते हैं। कई कारकों को समान मानदंडों (जैसे व्यवहार संबंधी कारक: उपयोगकर्ता पृष्ठ पर कैसे व्यवहार करता है या डोमेन नाम कारक: डोमेन नाम कितना पुराना है, क्या इसे स्पैम डेटाबेस में शामिल किया गया है) जैसी समूहों में वर्गीकृत किया जा सकता है।

हर साल रैंकिंग कारकों में सुधार होता है, लेकिन यह इतना धीमा होता है कि इन छोटे सुधारों से हम वास्तव में गुणवत्ता वाली खोज प्रणाली तक 50 वर्षों बाद पहुँचेंगे। प्रत्येक अगला रैंकिंग एल्गोरिदम मौजूदा कारकों को समायोजित करने जैसा होता है: कारक A को 1% बढ़ाना, कारक B को 4% घटाना। यह परिवर्तन हाथों द्वारा होता है या न्यूरॉन्स द्वारा — हम नहीं जानते, लेकिन महत्वपूर्ण बात यह है कि यह स्पष्ट रूप से अच्छे खोज अनुभव के लिए पर्याप्त नहीं है।

रैंकिंग कारकों में कई अजीब बातें होती हैं: साइट पर रहने का समय हमेशा सामग्री की गुणवत्ता को नहीं दर्शाता; डोमेन का वर्ष: हमेशा पुराना डोमेन हाल ही में पंजीकृत डोमेन की तुलना में अधिक गुणवत्ता वाला नहीं होता आदि।

आधुनिक खोज इंजन

2. अनंत प्रयोग। ⚖

हम हमेशा प्रयोग और परीक्षण करते रहते हैं: यह देखने के लिए कि क्या यह हमें कुछ खोज क्वेरीज़ में प्रतिस्पर्धियों से आगे निकाल सकता है या बस वेबसाइट पर अधिक ट्रैफ़िक ला सकता है। हमें यह पूरी तरह से नहीं पता होता कि सर्च इंजन के स्निपेट्स (खोज परिणामों में दिखाई देने वाली जानकारी) में क्या आएगा — हम केवल कुछ सशर्त सिफारिशों का पालन करते हैं।

स्निपेट्स — खोज परिणामों में लिंक और विवरण के पास दिखाई देने वाली अतिरिक्त जानकारी होती है, जैसे पते, फोन नंबर, एकॉर्डियन, मिनी-टेबल आदि।

3. अनावश्यक कंटेंट का निर्माण। 🗃

आज का मानव समाज एक दिन में उतना कंटेंट बना रहा है, जितना अमेरिका की कांग्रेस की लाइब्रेरी में संग्रहीत डेटा से 8500 गुना ज़्यादा है। हर सेकंड जो कंटेंट ऑनलाइन आता है, वह 1000 गुना ज़्यादा है, और हर दिन 80 मिलियन गुना ज़्यादा है जितना कंटेंट मानव इतिहास की 130 मिलियन प्रिंटेड किताबों में है।
— ब्रेट किंग

मेरे अनुसार SEO की मुख्य समस्याओं में से एक है: अनावश्यक कंटेंट का निर्माण और सामांतिक कोर (semantic core) का निर्माण। सबसे पहले हम सर्च क्वेरीज़ का विश्लेषण करते हैं। फिर हम पेज के टाइटल और कीवर्ड्स को उपयोगकर्ता के इरादों (intent) के अनुसार क्रमबद्ध करते हैं — सबसे महत्वपूर्ण शुरुआत में।

इंटेंट्स — वे इच्छाएं और इरादे होते हैं जो उपयोगकर्ता के मन में होते हैं जब वह कोई सर्च क्वेरी दर्ज करता है।

जब लोग कहते हैं कि सर्च इंजन एक जटिल प्रणाली है जिसमें न्यूरल नेटवर्क और मशीन लर्निंग एल्गोरिदम काम करते हैं — तो मुझे यह किसी बच्चे जैसा लगता है, जो बस पूछी गई बातों पर प्रतिक्रिया देता है। जो बेहतर ऑप्टिमाइज़ करता है — चाहे वैध रूप से या धोखे से (अगर उसे कोई रास्ता मिल जाए) — वही रैंक करेगा। आप कभी नहीं जान सकते कि उस "बच्चे" को क्या पसंद है और क्या नहीं। इसलिए A/B परीक्षण करते रहना पड़ता है। यह एक भरोसेमंद दादी की तरह है जो अपने अनुभव से निर्णय लेती है, लेकिन वह निर्णय हमेशा सही नहीं होता — जब तक कोई assessor (समीक्षक) न आ जाए, जिस पर सर्च इंजन भरोसा करता है।

एक वास्तविक उदाहरण: हमारी वेबसाइट पर 15–20 हज़ार पेज हैं, जो 95–99% तक एक जैसे हैं। केवल हेडलाइन और कुछ बेहद मामूली जानकारी बदली जाती है।
ऐसे पेज इस प्रकार हो सकते हैं:
स्मोलेंस्क में पेंशनभोगियों के लिए 100,000 रूबल का ऋण
ओम्स्क में पेंशनभोगियों के लिए 100,000 रूबल का ऋण
त्यूमेन में पेंशनभोगियों के लिए 100,000 रूबल का ऋण

ऐसे शहर हज़ारों हो सकते हैं। आवश्यक राशि 10,000 से लेकर 1 मिलियन तक हो सकती है, और पेंशनभोगी की जगह कोई भी उधारकर्ता हो सकता है: छात्र, सैनिक, गृहिणी, विकलांग, प्रवासी और कई अन्य सामाजिक समूह। कोई भी संज्ञा, जो किसी व्यक्ति का प्रतिनिधित्व करती है, खोज क्वेरी में आ सकती है। तो हम ऐसी स्थिति में क्या करते हैं? बस एक मिनट के लिए सोचिए — अपने लक्ष्य तक पहुंचने और इस जानकारी को सर्च इंजन को “खिलाने” के लिए हम क्या करते हैं? सही जवाब — हम सभी संभावित संयोजनों को जनरेट करते हैं! और यह सब केवल इसीलिए, ताकि हमारे टाइटल्स अधिकतम रूप से क्वेरी की फ्रीक्वेंसी के करीब हों। और अधिक क्वेरीज़ को कवर करने के लिए, हम सैकड़ों या हज़ारों पेज बनाते हैं इन संयोजनों के विभिन्न रूपों के साथ।

तो क्यों नहीं बनाई जा सकती सिर्फ एक पेज?
जैसे: "पेंशनभोगियों के लिए 100,000 रु. के लोन इन शहरों में: [स्मोलेन्स्क, ओम्स्क, ट्युमेन]" लेकिन आज की दुनिया में ऐसा पेज (अगर वह कोई बहुत प्रतिष्ठित वेबसाइट नहीं है) ऊँचा रैंक नहीं करेगा। यह भी आदर्श नहीं है भविष्य की सर्च इंजन के लिए। इस क्वेरी की एक और समस्या यह है कि इसमें 100,000 रु. की राशि और "पेंशनभोगी" की श्रेणी साफ़ तौर पर लिखी गई है। इसका मतलब यह नहीं कि इन शहरों में कोई और राशि या कोई अन्य सामाजिक समूह लोन नहीं ले सकता। आदर्श सर्च इंजन को यह समझना चाहिए कि एक ही पेज पर यह सब जानकारी दी जा सकती है: 10,000 से लेकर 1,000,000 तक की राशि, शहरों की सूची, सामाजिक समूहों की सूची।

लोन: {10,000, 15,000, 20,000, … , 1,000,000} {पेंशनभोगी, छात्र, गृहिणी, …, विकलांग} के लिए {स्मोलेन्स्क, ओम्स्क, …, ट्युमेन} में

API इंटरफेस (यानी वेबसाइट ऑप्टिमाइज़र्स द्वारा सर्च इंजन को दी गई इंटरफ़ेस जानकारी) शायद और अधिक व्यापक और अलग होंगे, लेकिन मुझे विश्वास है कि ऐसे इंटरफेस को आज के SEO एक्सपर्ट्स और छोटे-बड़े वेबसाइट एडमिन्स आसानी से समझ लेंगे।

API — एक इंटरफ़ेस है जो प्रोग्राम्स को आपस में जोड़ने और नई एप्लिकेशन बनाने की सुविधा देता है।

आदर्श भविष्य की सर्च इंजन में ऐसा क्वेरी एक हाई-फ्रीक्वेंसी क्वेरी से नीचे नहीं होना चाहिए। सर्च इंजन को सिर्फ जानकारी की गुणवत्ता, विश्वसनीयता, स्पीड और प्रस्तुति को देखना चाहिए। बस! कोई 20,000 पेज नहीं! अगर वेबसाइट मालिक को कोई पैरामीटर भेजने की ज़रूरत पड़े सर्च इंजन को — जैसे शहरों की सूची, सामाजिक समूह, और राशि — तो वह आसान है। छोटे-मझले ईकॉमर्स या सेवा वेबसाइट्स को हज़ारों पेज बनाने की ज़रूरत नहीं पड़ेगी। हर साइट से बस एक पेज — और सब कुछ सर्च इंजन की बेस में कवर हो जाएगा। सोचिए, हम एक साथ सैकड़ों हार्ड ड्राइव्स और सर्वर स्पेस बचा सकते हैं, अगर हम डुप्लिकेट जानकारी बनाना छोड़ दें और गुणवत्ता पर ध्यान केंद्रित करें।

हाई-फ्रीक्वेंसी क्वेरीज़ — वो क्वेरीज़ हैं जिनकी इंटरनेट पर खोज बहुत ज़्यादा होती है। इन पर वेबसाइट का टॉप में आना उसकी ट्रैफिक और विज़िबिलिटी को बहुत बढ़ा देता है।

4. निर्देशों और नियमों की अनदेखी 🔗

सर्च इंजन एक ब्लैक बॉक्स है — जादू से भरा हुआ (कौन सा जादू, अच्छा या बुरा — पता नहीं)। SEO स्पेशलिस्ट्स को इसका काम समझ नहीं आता। किसी भी पेज के ऑप्टिमाइज़ेशन के बाद क्या परिणाम होगा — कोई नहीं जानता। लेकिन इस रहस्य के बीच कुछ नियम ज़रूर हैं जिनका पालन सबको करना होता है — जैसे पेज का title और description, जो सर्च रिजल्ट में दिखते हैं। जो आप मेटा-टैग्स में डालते हैं — वही दिखना चाहिए! क्या वास्तव में ऐसा होता है? नहीं। कई बार सर्च इंजन खुद फैसला करता है और description को बदल देता है, अपने हिसाब से।

5. एसेसरों की भूमिका 🦸‍♂️

शायद कुछ लोगों को यह जानकर आश्चर्य हो, लेकिन सर्च इंजन पूरी तरह से स्वचालित नहीं हैं। एसेसर — सर्च इंजन के प्रतिनिधि होते हैं, जो मैन्युअली वेबसाइटों की गुणवत्ता और जानकारी की सत्यता की जांच करते हैं। वे वेबसाइट की रैंकिंग को बढ़ा या घटा सकते हैं। हम अपनी साइट पर एसेसरों का विशेष ध्यान रखते हैं: जरूरी जानकारी को सबसे ऊपर, सबसे साफ़ दिखने वाली जगह पर रखते हैं — ताकि भले ही एसेसर कुछ सेकंड के लिए आए, ध्यान चला जाए। अगर सर्च इंजन पूरी तरह परिपूर्ण होते, तो इंसानों की ज़रूरत ही नहीं पड़ती।

एसेसर — सर्च इंजन के प्रतिनिधि होते हैं, जो मैन्युअली वेबसाइटों की गुणवत्ता और जानकारी की सत्यता की जांच करते हैं।

6. प्रोग्रामिंग की तकनीकी जटिलता ⛓

यह हिस्सा शायद सबसे कठिन है, क्योंकि इसमें तकनीकी शब्द हैं। लेकिन यह जरूरी है। ऊपर दी गई समस्याओं और कुछ अन्य कारणों की वजह से, एक ऐसी वेबसाइट बनाना जो SEO-फ्रेंडली हो, बेहद मुश्किल है। मानव-पठनीय URL (जैसे /kredity-pensioneram) को सही ठहराया जा सकता है, लेकिन सही URL संरचना, सबडोमेन का उपयोग सिर्फ SEO के लिए — एक प्रकार का भ्रम है। SEO की मांगों के अनुरूप वेबसाइट बनाना — एक चुनौतीपूर्ण कार्य है। और अगर वेबसाइट के चलते-चलते पूरे URL स्ट्रक्चर को बदलना हो — तो मुश्किल कई गुना बढ़ जाती है। कई बार इस बदलाव में "कृत्रिम समाधान" (temporary या permanent hacks) की ज़रूरत पड़ती है। मेरे डेवलपर दोस्त जब पूछते हैं कि SEO प्रोजेक्ट्स में हम React या Angular जैसे फ्रेमवर्क क्यों नहीं यूज़ करते — मैं एक ही बात कहता हूं: किसी भी frontend framework की routing SEO की जरूरतों को पूरी तरह नहीं संभाल सकती। कई बार backend frameworks की routing भी SEO की जरूरतों के आगे कमजोर पड़ जाती है।

मैं खोज प्रणालियों को कैसे देखता हूं

आने वाली पीढ़ी के सर्च इंजनों से मैं क्या उम्मीद करता हूं:

कोई एसेसर नहीं।
अधिक उन्नत और आधुनिक रैंकिंग फैक्टर्स।
एकल, समेकित क्वेरी समर्थन — हज़ारों डुप्लीकेट पेजों की ज़रूरत नहीं।
अधिक मानवीय दृष्टिकोण — सिर्फ डेटा नहीं, भावना और समझ भी।
A/B टेस्टिंग का सीमित उपयोग — सिर्फ यूजर बिहेवियर के लिए, सर्च में नहीं।
पारदर्शिता — जिससे A/B टेस्टिंग की भी जरूरत खत्म हो।
एक जैसे नियम — सबके लिए समान।

भविष्य के खोज इंजन

हर बार ऐसी साइटें और ऑप्टिमाइज़र होते हैं जो डार्क ऑप्टिमाइज़ेशन विधियों (इसे डार्क एसईओ कहा जाता है, जिसके लिए आपको प्रतिबंधित किया जा सकता है, और जो, भगवान का शुक्र है, हर साल कम होता जा रहा है) के कारण टॉप (उच्च और लाभदायक खोज परिणाम स्थान) में आ जाते हैं। हालाँकि, मैं यह मानना चाहूँगा कि "भविष्य का अंधकारमय पक्ष" शब्द 2000 के दशक के अंत में ही कहीं रहेगा। और प्रकाश अनुकूलन, जिसे एसईओ आधुनिक विधि कहते हैं, में महत्वपूर्ण परिवर्तन होंगे।

सुधार की उम्मीद कब करें

हम वास्तव में उच्च गुणवत्ता वाले खोज इंजन की उम्मीद कब कर सकते हैं? मुझे नहीं लगता कि अगले 5-10 वर्षों में कुछ भी ज्यादा बदलेगा। क्वांटम कंप्यूटर और क्वांटम कंप्यूटिंग से आशा तो है, लेकिन वे सभी समस्याओं का समग्र समाधान नहीं कर पाएंगे। वे केवल कुछ समस्याओं का समाधान कर सकते हैं, जैसे कंप्यूटिंग शक्ति की कमी। इनका उपयोग सूचना को अधिक तीव्रता से संसाधित करने के लिए किया जा सकता है। लेकिन यह संभवतः ऐसा सर्च इंजन बनाने के लिए पर्याप्त नहीं होगा जो हमें पूरी तरह से संतुष्ट कर सके। इसके अलावा, मुझे निकट भविष्य में मौजूदा एल्गोरिदम और रैंकिंग कारकों में संशोधन की कोई पूर्व शर्त नहीं दिखती है, जिससे गुणवत्ता पर महत्वपूर्ण प्रभाव पड़े और सर्च इंजन पूरी तरह से नए स्तर पर पहुंच जाएं। शायद वैचारिक रूप से कुछ नया करने की आवश्यकता है, और क्वांटम कंप्यूटिंग और कंप्यूटर इस दिशा में प्रेरणा दे सकते हैं।

एकीकृत और स्पष्ट नियमों के अनुसार SEO

यदि खेल के नियम सभी के लिए वास्तव में पारदर्शी और एक समान हों, तो एसईओ किस प्रकार का होगा: मान लें कि हमें स्पष्ट रूप से पता है कि शीर्षक क्या होने चाहिए (या बल्कि, यह अब महत्वपूर्ण नहीं होना चाहिए) और कौन सा डेटा निश्चित रूप से माइक्रो-मार्कअप में जाएगा। जब सभी वेबसाइटें आकर्षण के मामले में “एक जैसी” हो जाती हैं, तो सर्च इंजनों को किस पर ध्यान केंद्रित करना चाहिए? मुझे लगता है कि हम काम करना जारी रख सकते हैं और तकनीकी संकेतकों पर ध्यान केंद्रित कर सकते हैं: लोडिंग गति 🏃‍♂️, पृष्ठ प्रदर्शन (ये संकेतक मौजूद हैं और अब ध्यान में रखे जाते हैं) 🖥, लेकिन वे वास्तविकता के अनुरूप नहीं हैं। कई खराब साइटें अभी भी खोज परिणामों में सबसे ऊपर रहती हैं, जबकि तेज़ और सुविधाजनक साइटें अक्सर कहीं नीचे चली जाती हैं। ऐसा इसलिए है क्योंकि सैद्धांतिक एसईओ को सबसे पहले और सबसे महत्वपूर्ण रूप से ध्यान में रखा जाता है। खोज इंजनों की नई पीढ़ी में, सैद्धांतिक अनुकूलन पूरी तरह से गायब हो जाना चाहिए। या कम से कम कुछ और बन जाओ। चूंकि खोज इंजनों में "वास्तविक" (गुणवत्ता में बहुत बेहतर) कृत्रिम बुद्धिमत्ता होगी, खासकर अगर हम मूल्यांकनकर्ताओं की उपस्थिति को छोड़ दें, तो खोज इंजनों को स्वतंत्र रूप से एक नए स्तर पर प्रदान की गई जानकारी की गुणवत्ता और विश्वसनीयता का निर्धारण करना चाहिए। इसे मुख्य रैंकिंग संकेतक बनना चाहिए (तकनीकी अनुकूलन से भी अधिक) और सैद्धांतिक एसईओ को पूरी तरह से प्रतिस्थापित करना चाहिए। फिलहाल, मुझे सर्च न्यूरल नेटवर्क के लिए सूचना का उचित विश्लेषण करने हेतु कोई पूर्वापेक्षाएं नजर नहीं आतीं। क्या यह इंटरनेट पर सूचना की अत्यधिक मात्रा के कारण है, जो लगातार बढ़ रही है, या तंत्रिका नेटवर्क की खराब गुणवत्ता के कारण है - यह कहना आमतौर पर कठिन है। मैं सोचता हूं कि दूसरा विकल्प अधिक उपयुक्त है। लेकिन मैं एक बात निश्चित रूप से जानता हूं: 20 हजार समान पृष्ठ बनाकर, हम स्पष्ट रूप से गलत रास्ते पर जा रहे हैं और केवल खोज इंजनों के काम को जटिल बना रहे हैं और अनावश्यक जानकारी के साथ सर्वरों के ढेर को "प्रदूषित" कर रहे हैं। हालाँकि, अच्छे विकल्पों के बिना, हम अभी भी इस तरह के प्रचार में लगे हुए हैं। भविष्य के खोज इंजनों में, हम वाक्यांशों को प्रश्नों से यथासंभव निकटता से मिलाने के लिए शीर्षक बनाने के उद्देश्य पर ध्यान नहीं देंगे। हम तुरंत सर्च इंजन को बताएंगे कि हम कौन हैं और हम क्या सेवाएं प्रदान करते हैं। और हम यह काम कितनी अच्छी तरह करते हैं, यह सर्च इंजन को निर्धारित करना होगा। सिमेंटिक कोर का संग्रह अलग हो जाएगा। स्थिर क्यूब्स वाले क्वांटम कंप्यूटरों के आगमन से सामान्यतः कंप्यूटिंग शक्ति में वृद्धि होगी। इससे पृष्ठों को अधिक बार और उच्च गुणवत्ता के साथ अनुक्रमित किया जा सकेगा। लेकिन क्या सर्च इंजन इंडेक्सिंग की गुणवत्ता में सुधार होगा, यह एक खुला प्रश्न बना हुआ है।

निष्कर्ष

मैं ऊपर लिखी बातों को संक्षेप में प्रस्तुत करने का प्रयास करूंगा तथा आधुनिक सर्च इंजनों में मुझे जो समस्याएं नजर आती हैं, उन्हें संक्षेप में सूचीबद्ध करूंगा।

🔝 रैंकिंग और साइटों की गुणवत्ता को ध्यान में रखने के लिए अपूर्ण कारक और एल्गोरिदम।
⚖ आपको यह समझने के लिए हमेशा ए/बी परीक्षण और विभिन्न प्रयोग करने होंगे कि यह खोज परिणामों को कैसे प्रभावित करेगा।
🗃 खोज इंजन को संतुष्ट करने के लिए बहुत सारे अतिरिक्त पृष्ठ और समान सामग्री तैयार करना। यह समस्या को गुणात्मक रूप से हल करने के बजाय उसके उत्तर को समायोजित करने की याद दिलाता है।
🦸‍♂️ प्रणाली में मानव (मूल्यांकनकर्ता) हस्तक्षेप का मतलब कुछ बुरा नहीं है, लेकिन ये अलग-अलग मामले होने चाहिए, नियमित नहीं। सर्च बॉट को इसे स्वयं ही अच्छी तरह से संभालने में सक्षम होना चाहिए।

और खोज इंजन के बारे में कुछ और जानकारी

मुख्य विषय (आज सैद्धांतिक एसईओ की गुणवत्ता के बारे में चर्चा) से थोड़ा हटकर, आइए अंत में सामान्य रूप से खोज इंजन के बारे में थोड़ा और बात करें।

बहुत कम लोग जानते हैं, लेकिन यैंडेक्स और गूगल सर्च इंजन के अलावा कई अन्य भी हैं, जिनमें कुछ बहुत अच्छे भी हैं। यदि रैम्बलर, बिंग, याहू, मेल जैसे सर्च इंजन विभिन्न कारणों से भरोसा पैदा नहीं करते हैं (कुछ का सर्च बेस छोटा है, कुछ लंबे समय से अपने चरम पर नहीं हैं और कभी वापस नहीं आएंगे), तो ऐसे कई सर्च इंजन हैं जो मेरी गहरी दिलचस्पी जगाते हैं। डकडकगो 🦆 की बात करें तो यह एक अच्छा सर्च इंजन है जिसमें बड़ा डेटाबेस और अच्छी गोपनीयता है (कम से कम लेखन के समय)। डकडकगो के अतिरिक्त, मेरे बुकमार्क में इसी नाम के ब्राउज़र का ब्रेव सर्च इंजन भी है, जिसे मैं निकट भविष्य में आज़माना चाहता हूँ। और एक और दिलचस्प सर्च इंजन है You, जो मुझे Brave और DuckDuckGo से भी ज्यादा दिलचस्प लगता है। विशेष रूप से, प्रोग्रामिंग प्रश्नों के लिए, मुझे इस खोज इंजन के परिणाम यांडेक्स या गूगल से भी अधिक पसंद हैं।

कभी-कभी मेरे दिमाग में सर्च इंजन से संबंधित कम से कम दो और सवाल आते हैं। मैं आगे अपने विचार प्रस्तुत करने का प्रयास करूंगा।

क्या इंटरनेट पर यांडेक्स और गूगल का प्रभुत्व बदलेगा? (चूंकि यह पोस्ट रूसी भाषी पाठकों के लिए है, और उनके लिए ये खोज इंजन मुख्य हैं, इसलिए मैंने इन्हें उदाहरण के रूप में लिया है)। संक्षिप्त उत्तर संभवतः 'नहीं' है। यदि यांडेक्स, प्रतिबंधों की शर्तों के तहत (जो आमतौर पर इस क्षेत्र पर लगाए जाते हैं), आसानी से गुणवत्ता में पीछे रह सकता है या कम से कम, सुविधाओं में गूगल से पीछे रह सकता है, तो फिर पूरी दुनिया में गूगल को विकास जारी रखने से कोई नहीं रोक सकता। इसलिए मुझे लगता है कि गूगल का दबदबा कायम रहेगा। यह अगले 20 वर्षों तक लागू होगा। लेकिन हमें यह नहीं भूलना चाहिए कि आईटी जगत में पहले भी ऐसे कई मामले सामने आ चुके हैं, जब किसी कंपनी की नीति के कारण संकट पैदा हुआ और बाजार में उसका स्पष्ट प्रभुत्व खत्म हो गया: ज़ेरॉक्स, इंटेल और निश्चित रूप से याहू सर्च इंजन, जिसने 2000 के दशक के आरंभ में अपने क्षेत्र में प्रभुत्व कायम किया था। सबसे अधिक संभावना यह है कि गूगल दूसरों की गलतियों से सीखना जानता है और अपने साथ ऐसा नहीं होने देगा। इसके अलावा, गूगल के लिए खोज इंजन वास्तव में एक महत्वपूर्ण वाणिज्यिक घटक है। लेकिन हम यह अनुमान न लगाएं कि 50 वर्षों में क्या होगा। शायद गूगल सर्च इंजन को कोई याद नहीं रखेगा, जैसे कि अब याहू को कोई याद नहीं रखता।
क्या ऐसे विशिष्ट खोज इंजन 🔍 हो सकते हैं जो सामान्य खोज इंजनों की तुलना में गुणवत्ता में बेहतर हों? यह प्रश्न शायद और भी कठिन है। कुछ हद तक, ऐसी प्रणालियाँ पहले से ही मौजूद हैं और अपनी प्रणाली के ढांचे के भीतर काम (खोज) करती हैं, लेकिन वे इससे आगे जाकर अधिक सार्वभौमिक प्रणालियों के साथ प्रतिस्पर्धा करने की संभावना नहीं रखती हैं। दूसरी ओर, यदि ऐसा खोज इंजन वास्तव में खोज के संदर्भ में कुछ बहुत प्रगतिशील प्रतिनिधित्व करता है, तो मैं इसका उपयोग करना शुरू कर दूंगा, और इससे कोई फर्क नहीं पड़ता कि यह प्रोग्राम कोड या निर्माण सामग्री की खोज कर रहा है, मुख्य बात यह है कि इस आला में खोज यथासंभव प्राकृतिक और मानवीय है। ऐसी खोज में उन एल्गोरिदम का अभाव होगा जिनके हम आदी हैं तथा यह पूरी तरह से मशीन लर्निंग और अधिक उन्नत प्रौद्योगिकियों पर आधारित होगी। दूसरी ओर, यदि ऐसी खोज सामने आती है जो किसी एक विशिष्ट क्षेत्र में पूरी तरह से काम कर सकती है, तो उसे अन्य क्षेत्रों में लागू करने और प्रशिक्षित करने से कौन रोक सकता है? तब हम पुनः सार्वभौमिक खोज की ओर बढ़ेंगे। लेकिन इस बार यह अधिक उत्तम है।