डुप्लिकेट कंटेंट क्या है और इसे कैसे ठीक करें
डुप्लिकेट कंटेंट क्या है?
डुप्लिकेट कंटेंट तब होता है जब आपकी साइट पर कई पेज अलग-अलग यूआरएल पर समान कंटेंट उपलब्ध कराते हैं।
यह एक बड़ा एसईओ गलती है।
डुप्लिकेट कंटेंट रैंकिंग को कैसे प्रभावित करता है?
डुप्लिकेट पेज आपकी साइट की रैंकिंग को कई कारणों से नुकसान पहुंचाते हैं:
- सर्च इंजन वेब रिसोर्सेज में रखे गए कंटेंट की मूलता के प्रति संवेदनशील होते हैं। यदि कई पेज डुप्लिकेट कंटेंट के साथ हैं, तो संभावना है कि ऐसे पेजों को गूगल द्वारा दंडित किया जाएगा और यह आपकी साइट की समग्र रैंकिंग को एसईआरपी में नकारात्मक रूप से प्रभावित करेगा।
- डुप्लिकेट पेजों की बड़ी संख्या साइट इंडेक्सिंग की प्रक्रिया को काफी जटिल बना देती है क्योंकि सर्च इंजनों को अपने क्रॉलिंग बजट को डुप्लिकेट पेजों को क्रॉल करने में खर्च करना पड़ता है, बजाय आपके उच्च रैंकिंग पेजों के।
- यह लैंडिंग पेजों को सफलतापूर्वक रैंक करना अधिक कठिन बना देता है क्योंकि सर्च इंजन समान पेज के कई उदाहरणों के कारण किसी प्रासंगिक पेज को रैंक करने के लिए उद्देश्यपूर्ण रूप से चुन नहीं सकता।
- पेजों का "पेजरैंक" और "वजन" पतला हो जाता है, क्योंकि आंतरिक लिंक डुप्लिकेट पेजों के बीच वितरित किए जाते हैं।
- अनैतिक प्रतियोगी भी आपकी साइट पर डुप्लिकेट पेज खोज सकते हैं और उनमें बाहरी लिंक जोड़ सकते हैं। इससे वे सर्च इंजन इंडेक्स में जुड़ जाते हैं और परिणामस्वरूप, सर्च इंजन आपकी वेबसाइट को सर्च परिणामों में नीचे ले जाते हैं क्योंकि आपको संभावित रूप से डुप्लिकेट कंटेंट दंड मिल सकता है।
- गूगल डुप्लिकेट पेजों के नकारात्मक प्रभाव और उन्हें सर्वोत्तम रूप से कैसे संभालें पर विस्तार से लिखता है उनके लेख में जिसका शीर्षक है "Consolidating Duplicate URLs."
डुप्लिकेट पेजों के सबसे सामान्य कारण हैं:
-
www और बिना www वाले पेजों के लिए कोई 301 रीडायरेक्शन नहीं सेट किया गया है। इस मामले में, साइट का प्रत्येक पेज डुप्लिकेट है क्योंकि यह दो पतों पर उपलब्ध है।
उदाहरण के लिए:
http://example.com/page
http://example.com/page
-
साइट पेज स्लैश के साथ और बिना स्लैश के पते पर उपलब्ध हैं। यदि कोई 301 रीडायरेक्शन सेट नहीं है, तो साइट सॉफ्टवेयर निम्नलिखित पेजों को अलग-अलग मानता है हालांकि कंटेंट समान है:
उदाहरण के लिए:
- यह यूआरएल साइट पर एक फोल्डर जैसा दिखता है - यह '/' से समाप्त होता है
http://example.com/page/
- और यह यूआरएल एक पेज जैसा है - पेज नाम ".php", ".html", आदि से समाप्त नहीं हो सकते
http://example.com/page
- यह यूआरएल साइट पर एक फोल्डर जैसा दिखता है - यह '/' से समाप्त होता है
-
इसके अलावा, पेजों के अंत में .php जोड़ा जा सकता है। इससे डुप्लिकेट पेज बनते हैं:
उदाहरण के लिए:
http://example.com/page1
http://example.com/page1.php
-
फिल्टरिंग विकल्पों के विभिन्न प्रकारों के साथ यूआरएल में जोड़े गए उत्पाद समूहों के पेज।
उदाहरण के लिए:
http://example.com/catalog
http://example.com/catalog?sort=date
http://example.com/catalog?sort=name
-
एक ही उत्पाद विभिन्न आकारों और/या उत्पादों की कॉन्फ़िगरेशनों में मौजूद हो सकता है। कंटेंट इन पेजों पर समान होगा हालांकि कई यूआरएल होंगे।
उदाहरण के लिए:
http://example.com/catalog/shirt155
http://example.com/catalog/shirt155?color=Orange
-
ई-कॉमर्स कैटेगरी पेजों का पेजिनेशन। पहली पेज के नंबर के साथ यूआरएल को बिल्कुल उसी तरह संसाधित किया जाता है जैसे कि सिस्टम ने नंबर के साथ पैरामीटर को पार नहीं किया। इस प्रकार, यह निकलता है कि एक ही पेज के अलग-अलग यूआरएल हैं।
उदाहरण के लिए:
http://example.com/catalog
http://example.com/catalog?page=1
-
आपने सीएमएस को कॉन्फ़िगर किया हो सकता है कि वह अतिरिक्त पैरामीटर जोड़े गए पेजों को अनदेखा करे और अभी भी सेवा दे। यह अनुशंसित नहीं है। यदि साइट एक पेज में अस्तित्वहीन पैरामीटर जोड़ने पर 404 त्रुटि नहीं दिखाती तो ऐसे पेज इंडेक्स किए जा सकते हैं और डुप्लिकेट हैं।
उदाहरण के लिए:
- सामान्य यूआरएल
http://example.com/blog
- यूआरएल में जोड़ा गया यादृच्छिक पैरामीटर
http://example.com/blog?blablabla=7777
- सामान्य यूआरएल
अपनी वेबसाइट पर डुप्लिकेट पेज कैसे खोजें?
आप अपनी साइट पर डुप्लिकेट पेज "एसईओ ऑडिट" -> "आपकी साइट पर डुप्लिकेट पेज" सेक्शन में अपने Labrika डैशबोर्ड में पा सकते हैं।
Labrika का "आपकी साइट पर डुप्लिकेट पेज" रिपोर्ट:
- पेज का यूआरएल जिसका डुप्लिकेट है।
- इस पेज के डुप्लिकेट की सूची।
- पेज समानता प्रतिशत।
अपनी वेबसाइट से डुप्लिकेट पेज कैसे समाप्त करें?
डुप्लिकेट से छुटकारा पाने के तरीके:
-
आप कुछ डुप्लिकेट पेज त्रुटियों को बस साइट संपादक में अनुमत पैरामीटर को हटाकर समाप्त कर सकते हैं। नीचे दिए गए उदाहरण में, आप स्पष्ट रूप से एक लिंक देख सकते हैं जिसे साफ करने की आवश्यकता है और दूसरा विकल्प इस्तेमाल किया जाना चाहिए:
http://example.com/catalog/shirt155?size=XL
पसंदीदा विकल्प:
http://example.com/catalog/shirt155
-
यदि हमारे रिपोर्ट में केवल कुछ डुप्लिकेट पेज पाए जाते हैं, तो आप बस कुछ डुप्लिकेट यूआरएल को इंडेक्सिंग से रोक सकते हैं। उदाहरण के लिए, आप नीचे दिए गए पहले पेज तक पहुंचने के लिए क्रॉलर को ब्लॉक कर सकते हैं, ताकि केवल दूसरा यूआरएल गूगल द्वारा इंडेक्स किया जाए:
http://example.com/category/product
http://example.com/product
आप अपने robots.txt फाइल में इंडेक्सिंग से पहले पेज को ब्लॉक करने के लिए निम्नलिखित कोड लाइन जोड़ेंगे:
# '/category' फोल्डर में स्थित डुप्लिकेट पेज की इंडेक्सिंग को ब्लॉक करें: Disallow: /category
-
यदि डुप्लिकेट पेज आपकी पूरी साइट के लिए एक व्यवस्थित समस्या प्रतीत होते हैं, तो
rel=canonical
विशेषता सबसे अच्छा समाधान है।rel=canonical
एक टैग है जो पेजों पर लागू किया जाता है जो अनिवार्य रूप से कहता है; "मैं इस पेज की मास्टर कॉपी हूं" सर्च इंजन क्रॉलर को जब वे आपकी साइट को क्रॉल करते हैं।एक कैनोनिकल पेज एक ऐसा पेज है जिसे आप सर्च इंजनों में इंडेक्सेशन के लिए अनुशंसा करते हैं और यह उस पेज के विशिष्ट टेक्स्ट के लिए 'द' प्राधिकारिक पेज होने का वजन रखता है, आपकी साइट पर।
आपको डुप्लिकेट पेजों की सूची में सबसे प्राधिकारिक पेज को कैनोनिकल पेज के रूप में सेट करना चाहिए, और यह सर्च इंजनों को सभी डुप्लिकेट को अनदेखा करने का निर्देश देगा।
विशेषता इस प्रकार लिखी जाती है:
# लाइन को पेज के <head> ब्लॉक में रखा जाना चाहिए <link rel="canonical" href="https://site.com/catalog/shirt" />
समान पेज
आपके डुप्लिकेट पेज रिपोर्ट के भीतर आप एक "समान पेज" सेक्शन भी देखेंगे।
समान पेज ऐसे पेज हैं जो आपकी साइट पर अन्य पेजों की तुलना में केवल कुछ शब्दों से भिन्न होते हैं।
उदाहरण के लिए, यदि आपने एक पेज का कंटेंट लिया, केवल उत्पाद का रंग बदला, या शहर का नाम, और फिर इसे एक अलग यूआरएल के तहत सहेजा, तो यह संभावित रूप से इस समान पेज रिपोर्ट में दिखाई देगा।
ऐसे पेज भी डुप्लिकेट कंटेंट दंड को ट्रिगर करने की संभावना रखते हैं और उन्हें ऊपर "अपनी वेबसाइट से डुप्लिकेट पेज कैसे समाप्त करें?" सेक्शन में सूचीबद्ध समान प्रथाओं और विधियों का पालन करके संबोधित किया जाना चाहिए।
समस्या को कैसे ठीक करें
आपकी साइट के भीतर डुप्लिकेट कंटेंट तब होता है जब कई पेज समान कंटेंट रखते हैं।
ये पेज सर्च इंजनों की डुप्लिकेट कंटेंट के प्रति संवेदनशीलता के कारण आपकी साइट के ऑप्टिमाइजेशन प्रयासों को बर्बाद करते हैं, यह अनावश्यक रूप से क्रॉलिंग बजट में जोड़ता है, पेज रैंक को पतला करता है, और आपको खुद से प्रतिस्पर्धा में डालता है क्योंकि सर्च इंजन नहीं जानते कि कौन सा पेज चुनें।
इसे ठीक करने के लिए, आप कर सकते हैं:
- अनावश्यक पैरामीटर हटाएं जो समान पेज पर ले जाने वाले अतिरिक्त यूआरएल बनाते हैं।
- यदि समस्या वाले पेज कम हैं तो आप बस डुप्लिकेट यूआरएल को इंडेक्सिंग से रोक सकते हैं या कुछ कैटेगरी सेक्शन को इंडेक्सिंग से रोक सकते हैं।
- सभी डुप्लिकेट पेजों के 'मास्टर पेज' को निर्दिष्ट करने के लिए rel=canonical विशेषता का उपयोग करें। ऐसा करते समय, सबसे प्राधिकारिक पेज को कैनोनिकल के रूप में सेट करें।
इन चरणों को कैसे कार्यान्वित करें, यहां और पढ़ें: https://labrika.com/help/docs/pages_duplicates.