मुखपृष्ठ / डुप्लिकेट कंटेंट क्या है और इसे कैसे ठीक करें

डुप्लिकेट कंटेंट क्या है और इसे कैसे ठीक करें

डुप्लिकेट कंटेंट क्या है?

डुप्लिकेट कंटेंट तब होता है जब आपकी साइट पर कई पेज अलग-अलग यूआरएल पर समान कंटेंट उपलब्ध कराते हैं।

यह एक बड़ा एसईओ गलती है।

डुप्लिकेट कंटेंट रैंकिंग को कैसे प्रभावित करता है?

डुप्लिकेट पेज आपकी साइट की रैंकिंग को कई कारणों से नुकसान पहुंचाते हैं:

सर्च इंजन वेब रिसोर्सेज में रखे गए कंटेंट की मूलता के प्रति संवेदनशील होते हैं। यदि कई पेज डुप्लिकेट कंटेंट के साथ हैं, तो संभावना है कि ऐसे पेजों को गूगल द्वारा दंडित किया जाएगा और यह आपकी साइट की समग्र रैंकिंग को एसईआरपी में नकारात्मक रूप से प्रभावित करेगा।
डुप्लिकेट पेजों की बड़ी संख्या साइट इंडेक्सिंग की प्रक्रिया को काफी जटिल बना देती है क्योंकि सर्च इंजनों को अपने क्रॉलिंग बजट को डुप्लिकेट पेजों को क्रॉल करने में खर्च करना पड़ता है, बजाय आपके उच्च रैंकिंग पेजों के।
यह लैंडिंग पेजों को सफलतापूर्वक रैंक करना अधिक कठिन बना देता है क्योंकि सर्च इंजन समान पेज के कई उदाहरणों के कारण किसी प्रासंगिक पेज को रैंक करने के लिए उद्देश्यपूर्ण रूप से चुन नहीं सकता।
पेजों का "पेजरैंक" और "वजन" पतला हो जाता है, क्योंकि आंतरिक लिंक डुप्लिकेट पेजों के बीच वितरित किए जाते हैं।
अनैतिक प्रतियोगी भी आपकी साइट पर डुप्लिकेट पेज खोज सकते हैं और उनमें बाहरी लिंक जोड़ सकते हैं। इससे वे सर्च इंजन इंडेक्स में जुड़ जाते हैं और परिणामस्वरूप, सर्च इंजन आपकी वेबसाइट को सर्च परिणामों में नीचे ले जाते हैं क्योंकि आपको संभावित रूप से डुप्लिकेट कंटेंट दंड मिल सकता है।
गूगल डुप्लिकेट पेजों के नकारात्मक प्रभाव और उन्हें सर्वोत्तम रूप से कैसे संभालें पर विस्तार से लिखता है उनके लेख में जिसका शीर्षक है "Consolidating Duplicate URLs."

डुप्लिकेट पेजों के सबसे सामान्य कारण हैं:

www और बिना www वाले पेजों के लिए कोई 301 रीडायरेक्शन नहीं सेट किया गया है। इस मामले में, साइट का प्रत्येक पेज डुप्लिकेट है क्योंकि यह दो पतों पर उपलब्ध है।

उदाहरण के लिए:
- http://example.com/page
- http://example.com/page
साइट पेज स्लैश के साथ और बिना स्लैश के पते पर उपलब्ध हैं। यदि कोई 301 रीडायरेक्शन सेट नहीं है, तो साइट सॉफ्टवेयर निम्नलिखित पेजों को अलग-अलग मानता है हालांकि कंटेंट समान है:

उदाहरण के लिए:
- यह यूआरएल साइट पर एक फोल्डर जैसा दिखता है - यह '/' से समाप्त होता है
  http://example.com/page/
- और यह यूआरएल एक पेज जैसा है - पेज नाम ".php", ".html", आदि से समाप्त नहीं हो सकते
  http://example.com/page
इसके अलावा, पेजों के अंत में .php जोड़ा जा सकता है। इससे डुप्लिकेट पेज बनते हैं:

उदाहरण के लिए:
- http://example.com/page1
- http://example.com/page1.php
फिल्टरिंग विकल्पों के विभिन्न प्रकारों के साथ यूआरएल में जोड़े गए उत्पाद समूहों के पेज।

उदाहरण के लिए:
- http://example.com/catalog
- http://example.com/catalog?sort=date
- http://example.com/catalog?sort=name
एक ही उत्पाद विभिन्न आकारों और/या उत्पादों की कॉन्फ़िगरेशनों में मौजूद हो सकता है। कंटेंट इन पेजों पर समान होगा हालांकि कई यूआरएल होंगे।

उदाहरण के लिए:
- http://example.com/catalog/shirt155
- http://example.com/catalog/shirt155?color=Orange
ई-कॉमर्स कैटेगरी पेजों का पेजिनेशन। पहली पेज के नंबर के साथ यूआरएल को बिल्कुल उसी तरह संसाधित किया जाता है जैसे कि सिस्टम ने नंबर के साथ पैरामीटर को पार नहीं किया। इस प्रकार, यह निकलता है कि एक ही पेज के अलग-अलग यूआरएल हैं।

उदाहरण के लिए:
- http://example.com/catalog
- http://example.com/catalog?page=1
आपने सीएमएस को कॉन्फ़िगर किया हो सकता है कि वह अतिरिक्त पैरामीटर जोड़े गए पेजों को अनदेखा करे और अभी भी सेवा दे। यह अनुशंसित नहीं है। यदि साइट एक पेज में अस्तित्वहीन पैरामीटर जोड़ने पर 404 त्रुटि नहीं दिखाती तो ऐसे पेज इंडेक्स किए जा सकते हैं और डुप्लिकेट हैं।

उदाहरण के लिए:
- सामान्य यूआरएल
  http://example.com/blog
- यूआरएल में जोड़ा गया यादृच्छिक पैरामीटर
  http://example.com/blog?blablabla=7777

अपनी वेबसाइट पर डुप्लिकेट पेज कैसे खोजें?

आप अपनी साइट पर डुप्लिकेट पेज "एसईओ ऑडिट" -> "आपकी साइट पर डुप्लिकेट पेज" सेक्शन में अपने Labrika डैशबोर्ड में पा सकते हैं।

Labrika का "आपकी साइट पर डुप्लिकेट पेज" रिपोर्ट:

Labrika डैशबोर्ड में डुप्लिकेट पेज रिपोर्ट का स्क्रीनशॉट, जिसमें यूआरएल, डुप्लिकेट सूची और समानता प्रतिशत दिखाया गया है

पेज का यूआरएल जिसका डुप्लिकेट है।
इस पेज के डुप्लिकेट की सूची।
पेज समानता प्रतिशत।

अपनी वेबसाइट से डुप्लिकेट पेज कैसे समाप्त करें?

डुप्लिकेट से छुटकारा पाने के तरीके:

आप कुछ डुप्लिकेट पेज त्रुटियों को बस साइट संपादक में अनुमत पैरामीटर को हटाकर समाप्त कर सकते हैं। नीचे दिए गए उदाहरण में, आप स्पष्ट रूप से एक लिंक देख सकते हैं जिसे साफ करने की आवश्यकता है और दूसरा विकल्प इस्तेमाल किया जाना चाहिए:

http://example.com/catalog/shirt155?size=XL

पसंदीदा विकल्प:

http://example.com/catalog/shirt155
यदि हमारे रिपोर्ट में केवल कुछ डुप्लिकेट पेज पाए जाते हैं, तो आप बस कुछ डुप्लिकेट यूआरएल को इंडेक्सिंग से रोक सकते हैं। उदाहरण के लिए, आप नीचे दिए गए पहले पेज तक पहुंचने के लिए क्रॉलर को ब्लॉक कर सकते हैं, ताकि केवल दूसरा यूआरएल गूगल द्वारा इंडेक्स किया जाए:
- http://example.com/category/product
- http://example.com/product
आप अपने robots.txt फाइल में इंडेक्सिंग से पहले पेज को ब्लॉक करने के लिए निम्नलिखित कोड लाइन जोड़ेंगे:
```
# '/category' फोल्डर में स्थित डुप्लिकेट पेज की इंडेक्सिंग को ब्लॉक करें:
Disallow: /category
```
यदि डुप्लिकेट पेज आपकी पूरी साइट के लिए एक व्यवस्थित समस्या प्रतीत होते हैं, तो rel=canonical विशेषता सबसे अच्छा समाधान है।

rel=canonical एक टैग है जो पेजों पर लागू किया जाता है जो अनिवार्य रूप से कहता है; "मैं इस पेज की मास्टर कॉपी हूं" सर्च इंजन क्रॉलर को जब वे आपकी साइट को क्रॉल करते हैं।

एक कैनोनिकल पेज एक ऐसा पेज है जिसे आप सर्च इंजनों में इंडेक्सेशन के लिए अनुशंसा करते हैं और यह उस पेज के विशिष्ट टेक्स्ट के लिए 'द' प्राधिकारिक पेज होने का वजन रखता है, आपकी साइट पर।

आपको डुप्लिकेट पेजों की सूची में सबसे प्राधिकारिक पेज को कैनोनिकल पेज के रूप में सेट करना चाहिए, और यह सर्च इंजनों को सभी डुप्लिकेट को अनदेखा करने का निर्देश देगा।

विशेषता इस प्रकार लिखी जाती है:
```
# लाइन को पेज के <head> ब्लॉक में रखा जाना चाहिए
<link rel="canonical" href="https://site.com/catalog/shirt" />
```

समान पेज

आपके डुप्लिकेट पेज रिपोर्ट के भीतर आप एक "समान पेज" सेक्शन भी देखेंगे।

समान पेज ऐसे पेज हैं जो आपकी साइट पर अन्य पेजों की तुलना में केवल कुछ शब्दों से भिन्न होते हैं।

उदाहरण के लिए, यदि आपने एक पेज का कंटेंट लिया, केवल उत्पाद का रंग बदला, या शहर का नाम, और फिर इसे एक अलग यूआरएल के तहत सहेजा, तो यह संभावित रूप से इस समान पेज रिपोर्ट में दिखाई देगा।

ऐसे पेज भी डुप्लिकेट कंटेंट दंड को ट्रिगर करने की संभावना रखते हैं और उन्हें ऊपर "अपनी वेबसाइट से डुप्लिकेट पेज कैसे समाप्त करें?" सेक्शन में सूचीबद्ध समान प्रथाओं और विधियों का पालन करके संबोधित किया जाना चाहिए।

समस्या को कैसे ठीक करें

आपकी साइट के भीतर डुप्लिकेट कंटेंट तब होता है जब कई पेज समान कंटेंट रखते हैं।

ये पेज सर्च इंजनों की डुप्लिकेट कंटेंट के प्रति संवेदनशीलता के कारण आपकी साइट के ऑप्टिमाइजेशन प्रयासों को बर्बाद करते हैं, यह अनावश्यक रूप से क्रॉलिंग बजट में जोड़ता है, पेज रैंक को पतला करता है, और आपको खुद से प्रतिस्पर्धा में डालता है क्योंकि सर्च इंजन नहीं जानते कि कौन सा पेज चुनें।

इसे ठीक करने के लिए, आप कर सकते हैं:

अनावश्यक पैरामीटर हटाएं जो समान पेज पर ले जाने वाले अतिरिक्त यूआरएल बनाते हैं।
यदि समस्या वाले पेज कम हैं तो आप बस डुप्लिकेट यूआरएल को इंडेक्सिंग से रोक सकते हैं या कुछ कैटेगरी सेक्शन को इंडेक्सिंग से रोक सकते हैं।
सभी डुप्लिकेट पेजों के 'मास्टर पेज' को निर्दिष्ट करने के लिए rel=canonical विशेषता का उपयोग करें। ऐसा करते समय, सबसे प्राधिकारिक पेज को कैनोनिकल के रूप में सेट करें।

इन चरणों को कैसे कार्यान्वित करें, यहां और पढ़ें: https://labrika.com/help/docs/pages_duplicates.