डुप्लिकेट कंटेंट क्या है और इसे कैसे ठीक करें
डुप्लिकेट कंटेंट क्या है?
डुप्लिकेट कंटेंट तब होता है जब आपकी साइट पर कई पेज अलग-अलग यूआरएल पर समान कंटेंट उपलब्ध कराते हैं।
यह एक बड़ा एसईओ गलती है।
डुप्लिकेट कंटेंट रैंकिंग को कैसे प्रभावित करता है?
डुप्लिकेट पेज आपकी साइट की रैंकिंग को कई कारणों से नुकसान पहुंचाते हैं:
- सर्च इंजन वेब रिसोर्सेज में रखे गए कंटेंट की मूलता के प्रति संवेदनशील होते हैं। यदि कई पेज डुप्लिकेट कंटेंट के साथ हैं, तो संभावना है कि ऐसे पेजों को गूगल द्वारा दंडित किया जाएगा और यह आपकी साइट की समग्र रैंकिंग को एसईआरपी में नकारात्मक रूप से प्रभावित करेगा।
- डुप्लिकेट पेजों की बड़ी संख्या साइट इंडेक्सिंग की प्रक्रिया को काफी जटिल बना देती है क्योंकि सर्च इंजनों को अपने क्रॉलिंग बजट को डुप्लिकेट पेजों को क्रॉल करने में खर्च करना पड़ता है, बजाय आपके उच्च रैंकिंग पेजों के।
- यह लैंडिंग पेजों को सफलतापूर्वक रैंक करना अधिक कठिन बना देता है क्योंकि सर्च इंजन समान पेज के कई उदाहरणों के कारण किसी प्रासंगिक पेज को रैंक करने के लिए उद्देश्यपूर्ण रूप से चुन नहीं सकता।
- पेजों का "पेजरैंक" और "वजन" पतला हो जाता है, क्योंकि आंतरिक लिंक डुप्लिकेट पेजों के बीच वितरित किए जाते हैं।
- अनैतिक प्रतियोगी भी आपकी साइट पर डुप्लिकेट पेज खोज सकते हैं और उनमें बाहरी लिंक जोड़ सकते हैं। इससे वे सर्च इंजन इंडेक्स में जुड़ जाते हैं और परिणामस्वरूप, सर्च इंजन आपकी वेबसाइट को सर्च परिणामों में नीचे ले जाते हैं क्योंकि आपको संभावित रूप से डुप्लिकेट कंटेंट दंड मिल सकता है।
- गूगल डुप्लिकेट पेजों के नकारात्मक प्रभाव और उन्हें सर्वोत्तम रूप से कैसे संभालें पर विस्तार से लिखता है उनके लेख में जिसका शीर्षक है "Consolidating Duplicate URLs."
डुप्लिकेट पेजों के सबसे सामान्य कारण हैं:
-
www और बिना www वाले पेजों के लिए कोई 301 रीडायरेक्शन नहीं सेट किया गया है। इस मामले में, साइट का प्रत्येक पेज डुप्लिकेट है क्योंकि यह दो पतों पर उपलब्ध है।
उदाहरण के लिए:
http://example.com/pagehttp://example.com/page
-
साइट पेज स्लैश के साथ और बिना स्लैश के पते पर उपलब्ध हैं। यदि कोई 301 रीडायरेक्शन सेट नहीं है, तो साइट सॉफ्टवेयर निम्नलिखित पेजों को अलग-अलग मानता है हालांकि कंटेंट समान है:
उदाहरण के लिए:
- यह यूआरएल साइट पर एक फोल्डर जैसा दिखता है - यह '/' से समाप्त होता है
http://example.com/page/ - और यह यूआरएल एक पेज जैसा है - पेज नाम ".php", ".html", आदि से समाप्त नहीं हो सकते
http://example.com/page
- यह यूआरएल साइट पर एक फोल्डर जैसा दिखता है - यह '/' से समाप्त होता है
-
इसके अलावा, पेजों के अंत में .php जोड़ा जा सकता है। इससे डुप्लिकेट पेज बनते हैं:
उदाहरण के लिए:
http://example.com/page1http://example.com/page1.php
-
फिल्टरिंग विकल्पों के विभिन्न प्रकारों के साथ यूआरएल में जोड़े गए उत्पाद समूहों के पेज।
उदाहरण के लिए:
http://example.com/cataloghttp://example.com/catalog?sort=datehttp://example.com/catalog?sort=name
-
एक ही उत्पाद विभिन्न आकारों और/या उत्पादों की कॉन्फ़िगरेशनों में मौजूद हो सकता है। कंटेंट इन पेजों पर समान होगा हालांकि कई यूआरएल होंगे।
उदाहरण के लिए:
http://example.com/catalog/shirt155http://example.com/catalog/shirt155?color=Orange
-
ई-कॉमर्स कैटेगरी पेजों का पेजिनेशन। पहली पेज के नंबर के साथ यूआरएल को बिल्कुल उसी तरह संसाधित किया जाता है जैसे कि सिस्टम ने नंबर के साथ पैरामीटर को पार नहीं किया। इस प्रकार, यह निकलता है कि एक ही पेज के अलग-अलग यूआरएल हैं।
उदाहरण के लिए:
http://example.com/cataloghttp://example.com/catalog?page=1
-
आपने सीएमएस को कॉन्फ़िगर किया हो सकता है कि वह अतिरिक्त पैरामीटर जोड़े गए पेजों को अनदेखा करे और अभी भी सेवा दे। यह अनुशंसित नहीं है। यदि साइट एक पेज में अस्तित्वहीन पैरामीटर जोड़ने पर 404 त्रुटि नहीं दिखाती तो ऐसे पेज इंडेक्स किए जा सकते हैं और डुप्लिकेट हैं।
उदाहरण के लिए:
- सामान्य यूआरएल
http://example.com/blog - यूआरएल में जोड़ा गया यादृच्छिक पैरामीटर
http://example.com/blog?blablabla=7777
- सामान्य यूआरएल
अपनी वेबसाइट पर डुप्लिकेट पेज कैसे खोजें?
आप अपनी साइट पर डुप्लिकेट पेज "एसईओ ऑडिट" -> "आपकी साइट पर डुप्लिकेट पेज" सेक्शन में अपने Labrika डैशबोर्ड में पा सकते हैं।
Labrika का "आपकी साइट पर डुप्लिकेट पेज" रिपोर्ट:

- पेज का यूआरएल जिसका डुप्लिकेट है।
- इस पेज के डुप्लिकेट की सूची।
- पेज समानता प्रतिशत।
अपनी वेबसाइट से डुप्लिकेट पेज कैसे समाप्त करें?
डुप्लिकेट से छुटकारा पाने के तरीके:
-
आप कुछ डुप्लिकेट पेज त्रुटियों को बस साइट संपादक में अनुमत पैरामीटर को हटाकर समाप्त कर सकते हैं। नीचे दिए गए उदाहरण में, आप स्पष्ट रूप से एक लिंक देख सकते हैं जिसे साफ करने की आवश्यकता है और दूसरा विकल्प इस्तेमाल किया जाना चाहिए:
http://example.com/catalog/shirt155?size=XLपसंदीदा विकल्प:
http://example.com/catalog/shirt155 -
यदि हमारे रिपोर्ट में केवल कुछ डुप्लिकेट पेज पाए जाते हैं, तो आप बस कुछ डुप्लिकेट यूआरएल को इंडेक्सिंग से रोक सकते हैं। उदाहरण के लिए, आप नीचे दिए गए पहले पेज तक पहुंचने के लिए क्रॉलर को ब्लॉक कर सकते हैं, ताकि केवल दूसरा यूआरएल गूगल द्वारा इंडेक्स किया जाए:
http://example.com/category/producthttp://example.com/product
आप अपने robots.txt फाइल में इंडेक्सिंग से पहले पेज को ब्लॉक करने के लिए निम्नलिखित कोड लाइन जोड़ेंगे:
# '/category' फोल्डर में स्थित डुप्लिकेट पेज की इंडेक्सिंग को ब्लॉक करें: Disallow: /category
-
यदि डुप्लिकेट पेज आपकी पूरी साइट के लिए एक व्यवस्थित समस्या प्रतीत होते हैं, तो
rel=canonicalविशेषता सबसे अच्छा समाधान है।rel=canonicalएक टैग है जो पेजों पर लागू किया जाता है जो अनिवार्य रूप से कहता है; "मैं इस पेज की मास्टर कॉपी हूं" सर्च इंजन क्रॉलर को जब वे आपकी साइट को क्रॉल करते हैं।एक कैनोनिकल पेज एक ऐसा पेज है जिसे आप सर्च इंजनों में इंडेक्सेशन के लिए अनुशंसा करते हैं और यह उस पेज के विशिष्ट टेक्स्ट के लिए 'द' प्राधिकारिक पेज होने का वजन रखता है, आपकी साइट पर।
आपको डुप्लिकेट पेजों की सूची में सबसे प्राधिकारिक पेज को कैनोनिकल पेज के रूप में सेट करना चाहिए, और यह सर्च इंजनों को सभी डुप्लिकेट को अनदेखा करने का निर्देश देगा।
विशेषता इस प्रकार लिखी जाती है:
# लाइन को पेज के <head> ब्लॉक में रखा जाना चाहिए <link rel="canonical" href="https://site.com/catalog/shirt" />
समान पेज
आपके डुप्लिकेट पेज रिपोर्ट के भीतर आप एक "समान पेज" सेक्शन भी देखेंगे।
समान पेज ऐसे पेज हैं जो आपकी साइट पर अन्य पेजों की तुलना में केवल कुछ शब्दों से भिन्न होते हैं।
उदाहरण के लिए, यदि आपने एक पेज का कंटेंट लिया, केवल उत्पाद का रंग बदला, या शहर का नाम, और फिर इसे एक अलग यूआरएल के तहत सहेजा, तो यह संभावित रूप से इस समान पेज रिपोर्ट में दिखाई देगा।
ऐसे पेज भी डुप्लिकेट कंटेंट दंड को ट्रिगर करने की संभावना रखते हैं और उन्हें ऊपर "अपनी वेबसाइट से डुप्लिकेट पेज कैसे समाप्त करें?" सेक्शन में सूचीबद्ध समान प्रथाओं और विधियों का पालन करके संबोधित किया जाना चाहिए।
समस्या को कैसे ठीक करें
आपकी साइट के भीतर डुप्लिकेट कंटेंट तब होता है जब कई पेज समान कंटेंट रखते हैं।
ये पेज सर्च इंजनों की डुप्लिकेट कंटेंट के प्रति संवेदनशीलता के कारण आपकी साइट के ऑप्टिमाइजेशन प्रयासों को बर्बाद करते हैं, यह अनावश्यक रूप से क्रॉलिंग बजट में जोड़ता है, पेज रैंक को पतला करता है, और आपको खुद से प्रतिस्पर्धा में डालता है क्योंकि सर्च इंजन नहीं जानते कि कौन सा पेज चुनें।
इसे ठीक करने के लिए, आप कर सकते हैं:
- अनावश्यक पैरामीटर हटाएं जो समान पेज पर ले जाने वाले अतिरिक्त यूआरएल बनाते हैं।
- यदि समस्या वाले पेज कम हैं तो आप बस डुप्लिकेट यूआरएल को इंडेक्सिंग से रोक सकते हैं या कुछ कैटेगरी सेक्शन को इंडेक्सिंग से रोक सकते हैं।
- सभी डुप्लिकेट पेजों के 'मास्टर पेज' को निर्दिष्ट करने के लिए rel=canonical विशेषता का उपयोग करें। ऐसा करते समय, सबसे प्राधिकारिक पेज को कैनोनिकल के रूप में सेट करें।
इन चरणों को कैसे कार्यान्वित करें, यहां और पढ़ें: https://labrika.com/help/docs/pages_duplicates.
