Sitemap.xml की समझ और Labrika विश्लेषण
एक Sitemap.xml फ़ाइल अनिवार्य रूप से आपकी वेबसाइट का एक मानचित्र है जो विशेष रूप से खोज इंजनों द्वारा आपकी साइट की आसान नेविगेशन और इंडेक्सिंग के लिए डिज़ाइन किया गया है। यह आपकी public_html फ़ोल्डर (या साइट रूट) के भीतर स्थित है और खोज इंजन क्रॉलरों के लिए महत्वपूर्ण निर्देश शामिल करता है जो निर्दिष्ट करते हैं कि कौन सी पेजेज़ देखी जाएं, किस क्रम में, और उन्हें कितनी बार देखा जाए।
यह महत्वपूर्ण पेजेज़ की इंडेक्सिंग प्रक्रिया को काफी तेज़ करता है और खोज क्रॉलरों को उनके क्रॉल समय को उन पेजेज़ पर आवंटित करने की अनुमति देता है जो आपके और आपके उपयोगकर्ताओं के लिए उच्च महत्व के हैं।
एक sitemap.xml बनाना हमेशा आवश्यक नहीं है लेकिन हमेशा अनुशंसित है, विशेष रूप से हजारों पेजेज़ वाली बड़ी साइटों के लिए। बड़ी साइटों के साथ, यह सुनिश्चित करने की आवश्यकता आती है कि खोज इंजन क्रॉलर अपना समय उन उच्च मूल्य पेजेज़ पर व्यतीत करें जिनमें गहरी सामग्री और व्यावसायिक इरादा है, न कि साइड पेजेज़ जो पतली मूल्य प्रदान करते हैं।
एक नियम के रूप में, जब सॉफ़्टवेयर और CMS स्वचालित रूप से एक sitemap.xml फ़ाइल उत्पन्न करते हैं, तो वे इंडेक्सिंग के लिए सभी उपलब्ध पेजेज़ शामिल करते हैं। एक विशिष्ट वेबसाइट मालिक इस बारे में अवगत नहीं होने की संभावना है, और जबकि उन्होंने कुछ पेजेज़ के लिए noindex सेट किया हो सकता है, उनकी स्वचालित रूप से उत्पन्न साइटमैप इन पेजेज़ को शामिल कर रहे हैं और मूल्यवान क्रॉल बजट बर्बाद कर रहे हैं!
यह अत्यधिक अनुशंसित है कि प्लगइन्स, कस्टम सॉफ़्टवेयर, या साइटमैप जनरेटर का उपयोग करके अपने साइटमैप में दिखाने के लिए विशिष्ट URL कॉन्फ़िगर करें, कुछ URL को टाला जाए, URL को क्रॉल करने का क्या क्रम और उन्हें कितनी बार क्रॉल करना है।
Labrika द्वारा पाई गई Sitemap त्रुटियां
ध्यान दें! Sitemap त्रुटि रिपोर्ट केवल तभी पहुंच योग्य होगी यदि पूरी वेबसाइट को स्कैन करने के लिए पर्याप्त अनुमतियां सही ढंग से कॉन्फ़िगर की गई हैं। अन्यथा, Labrika केवल साइटमैप.xml में विशेष रूप से सूचीबद्ध पेजेज़ देख पाएगी बजाय वेबसाइट पर सभी पेजेज़ देखने के, और फिर उन्हें साइटमैप में सूचीबद्ध पेजेज़ के साथ क्रॉस-तुलना करने के।
Labrika sitemap विश्लेषण निम्नलिखित प्रकार की त्रुटियों को खोजने में मदद करता है:
-
पेजेज़ जो साइटमैप में मौजूद हैं लेकिन इंडेक्सिंग के लिए पहुंच योग्य नहीं हैं।
-
पेजेज़ जो साइटमैप में मौजूद हैं लेकिन एक noindex टैग है।
-
पेजेज़ जो साइटमैप में मौजूद नहीं हैं लेकिन इंडेक्सेबल हैं।
कृपया ध्यान दें: विभिन्न खोज इंजन साइटमैप नियमों को अलग-अलग तरीकों से संसाधित करते हैं। Google, सबसे अधिक बार, केवल उन पेजेज़ को इंडेक्स करेगा जो स्वचालित क्रॉलिंग के माध्यम से पहुंच योग्य हैं बिना साइटमैप के। अर्थात, पेजेज़ जो उस दिन आपकी साइट के लिए आवंटित क्रॉल समय और क्रॉल गहराई के भीतर आंतरिक लिंक्स के माध्यम से पहुंच योग्य हैं। वे आपके sitemap.xml फ़ाइल को देखकर यह निर्धारित नहीं करेंगे कि कौन से लिंक्स क्रॉल करें, बल्कि साइटमैप का उपयोग साइटमैप में सूचीबद्ध पेजेज़ को कितनी बार क्रॉल करने के लिए मार्गदर्शक के रूप में करेंगे।