Dlaczego duplikacja treści szkodzi stronie? Poznaj przyczyny i rozwiązania.

Duplicate content, czyli duplikacja treści, to problem wynikający głównie z niewiedzy, a także zaniedbania kwestii technicznych przez właścicieli serwisu. Na czym polega duplikacja treści i jaki ma wpływ na pozycjonowanie witryny?

Chcesz zadbać o pozycjonowanie Twojego sklepu?

Co to jest duplikacja treści?

Duplicate content, czyli duplikacja treści, to powielenie treści pod więcej niż jednym URL w obrębie jednej witryny lub w obrębie różnych serwisów. Ze względu na typ tego powielenia, wyróżnić można:

1. Duplikację zewnętrzną

Powielenie treści pochodzących z innych serwisów na własnej domenie (tu na myśl przychodzi od razu popularne w e-commerce kopiowanie opisów produktów od producenta);

2. Duplikację wewnętrzną

 Powielenie treści  w obrębie jednej domeny.

Przez treść w kontekście duplikacji rozumie się nie tylko blok tekstu - stworzenie unikalnych opisów na podstronach kategorii czy produktu nie oznacza, że problem duplikacji nas nie dotyczy. Samo pojęcie duplikacji niekoniecznie oznaczać musi celowe skopiowanie opisu, ale może dotyczyć także błędów w zakresie optymalizacji technicznej, np. generowania różnego URL dla każdego wariantu kolorystycznego oferowanego produktu (a opis zostaje ten sam).

Za problemy z optymalizacją techniczną, wbrew pozorom, nie jest odpowiedzialny webmaster, o ile klient nie zleci mu konkretnych wytycznych od agencji pozycjonowania. W większości sytuacji nie odpowiada on za wyeliminowanie duplikacji treści, ale za to, by strona działała dla użytkowników bez problemów (a dla użytkownika nie jest problemem, że np. strona kontaktu jest dostępna pod trzema różnymi adresami).
Podkreślmy to - problem duplicate content jest problemem z zakresu pozycjonowania.

Czy duplikacja stron szkodzi pozycjonowaniu?

Duplikacja treści jest czynnikiem, który negatywnie wpływa na widoczność strony w wynikach wyszukiwania Google. I nie ma to związku, wbrew panującym na ten temat mitom, z karą od Google.
Powielenie tej samej lub podobnej treści pod różnymi URL-ami może skutkować tym, że Google nie wiedząc, którą z nich pokazać wysoko w wynikach pokaże wszystkie - ale niżej (np. na drugiej lub trzeciej stronie). Czasem się zdarza, że Google wybierze jedną wersję i ją pokaże wysoko w wynikach. W takim wypadku nie zawsze jest to równoznaczne z połączeniem mocy tych podstron w jedną. Często jest tak, że zduplikowane podstrony są po prostu ignorowane, a ich moc przepada, przez co podstrona oceniana jest gorzej niż powinna. Zdarza się także, że wybrana przez Google podstrona nie jest najlepszą dla właściciela witryny i mając wybór, pokazałby on inną.
Konsekwencją duplikacji treści może być spadek ruchu i widoczności.

Jak wygląda proces pozycjonowania? - wypowiedź eksperta

Przyczyny duplikacji treści

Jak wspomnieliśmy, problem duplicate content dotyczy nie tylko sklepów internetowych, które udostępniają na swoich podstronach treści ze strony producenta. Temat jest dużo bardziej złożony i dotyczyć może zarówno samych opisów, jak i kwestii stricte technicznych.

Poniżej przedstawiamy listę najczęstszych przykładów duplikacji oraz naszym zdaniem najlepsze metody rozwiązania danego problemu.

Duplikacja pierwszej strony paginacji kategorii

Problem
Często zdarza się, że linki paginacji są zrobione w sposób nieprzemyślany, np. link do strony 1. prowadzi do URL ze zmienną paginacji (np. widoczni.com/kategoria?p=1). Na stronie jest ta sama zawartość, która znajduję się na stronie bez zmiennej paginacji (np. widoczni.com/kategoria), co powoduje duplikację tej całej strony.

Rozwiązanie
Aby rozwiązać ten problem, należy poprawić link wewnętrzny z nawigacji stronicowania, a także wprowadzić przekierowanie 301 z powielonego adresu na prawidłowy (np. link widoczni.com/kategoria?p=1 przekierowuje na adres widoczni.com/kategoria).

Opisy kategorii

Problem
Bardzo często zdarza się, że opis kategorii powielany jest na stronicowaniu, filtrowaniu lub sortowaniu danej kategorii. I choć w opinii właściciela witryny wydawać się może, że tekst jest pomocny, np. przy wyborze produktów, to należy pamiętać, że jest to przykład duplikacji, która negatywnie wpływa na pozycjonowanie.

Rozwiązanie
Należy poprawić system tak, aby opis kategorii pojawiał się tylko na stronie głównej kategorii.

Źródło: zalando.pl

Opisy produktów

Problem
Powielone opisy różnych produktów, najczęściej podobnych, to częsty przykład duplikacji treści w branży e-commerce - zarówno jeśli chodzi o duplikację wewnętrzną, jak i zewnętrzną.

Rozwiązanie
Najlepiej przeredagować treści tak, by opisy nie były do siebie podobne. Jeśli jest zbyt dużo produktów, których dotyczy problem, najlepiej wprowadzić w treści elementy odróżniające dane produkty (inna nazwa, rozmiar, kolor, itd.). Dzięki temu opisy nie będą w 100% identyczne.

Strona główna

Problem
Często system serwisu pozwala na otworzenie strony głównej pod różnymi adresami:

  • /pl
  • /index.php
  • /index.html

Rozwiązanie
Należy wyeliminować występowanie takich odnośników w obrębie serwisu i wprowadzić przekierowanie 301 z błędnych na poprawne adresy URL.

Szukasz sprawdzonej agencji z dobrymi opiniami?
Mamy ponad 200 pozytywnych opinii w Google.

Strona dostępna pod różnymi adresami

Problem
Ta sama strona dostępna jest pod różnymi adresami. Powody tego mogą być różne, np.:

  • linki w menu górnym są z ".html" a w menu dolnym bez i obie wersje działają,
  • dwa razy została dodana ta sama strona blogowa,
  • ta sama podstrona ofertowa znajduje się w różnych zakładkach menu,
  • ta sama kategoria znajduje się w wielu różnych miejscach w strukturze sklepu,
  • system generuje adresy produktów w zależności od kategorii w jakiej są (a ten sam produkt jest w kilku kategoriach = dostępny pod różnymi adresami).

Rozwiązanie
Należy wyeliminować występowanie linków prowadzących do powielonych adresów oraz wprowadzić przekierowanie 301.

Wdrożenie SSL

Problem
Przy wdrożeniu SSL nie wprowadzono przekierowania z HTTP na HTTPS lub wprowadzono je tylko na stronę główną albo na kilka wybranych adresów.

Rozwiązanie
Rozwiązanie tego problemu jest proste - należy wprowadzić globalne przekierowanie wszystkich stron z HTTP na HTTPS. Jedna instrukcja pozwala przekierować wszystkie strony - nawet jeśli ich mamy setki tysięcy, nie trzeba dla każdego adresu URL robić indywidualnego przekierowania.

Wdrożenie wersji językowej

Problem
Nie wszystkie podstrony są przetłumaczone na inne języki, a jednak pod adresem danego języka strona działa i pokazuje zduplikowany tekst, np. polski.

Rozwiązanie
W takim przypadku należy albo przetłumaczyć wszystkie strony na wskazany język, albo, jeśli nie chcemy niektórych stron tłumaczyć, wyłączyć dostęp pod danym językiem (aby pokazywały kod HTTP 404 NOT FOUND). Unikniemy w ten sposób duplikacji.

Parametry GET kampanii

Problem
Google zaindeksowało strony z parametrami GET kampanii reklamowych lub afiliacyjnych (np. widoczni.com?utm_campaign=blog lub widoczni.com?gclid=SDSGDISYdbd23t86r6987dfusa), tym samym strona widoczni.com dostępna jest pod kilkoma adresami URL.

Rozwiązanie
Należy wprowadzić canonicale na te adresy. W tym przypadku lepiej nie wprowadzać przekierowania 301, ponieważ narzędzia analityczne mogą mieć problem z prawidłowym zliczaniem wejść kampanii.

Brak standaryzacji parametrów GET

Problem
Zdarza się, że jeśli mamy kilka parametrów GET w adresie URL, strona działa niezależnie od tego, w jakiej kolejności ich użyjemy, np. :

  • widoczni.com?sort=up&page=1&typ=new,
  • widoczni.com?sort=up&typ=new&page=1,
  • widoczni.com?page=1&sort=up&typ=new,
  • widoczni.com?page=1&typ=new&sort=up,
  • widoczni.com?typ=new&sort=up&page=1,
  • widoczni.com?typ=new&page=1&sort=up.

Każdy z tych adresów przedstawia identyczną stronę.

Rozwiązanie
Najlepiej wybrać jedną kolejność i wprowadzić przekierowania 301 do niej z pozostałych wariantów. Należy poprawić też linki wewnętrzne tak, aby kierowały tylko na prawidłowe adresy.

Strona deweloperska

Problem
Wersja deweloperska serwisu została zaindeksowana przez Google.

Rozwiązanie
Jeśli indeksacja miała miejsce przed wdrożeniem strony to należy wprowadzić przekierowanie 301 z wersji deweloperskiej na wersje online. Jeśli korzystamy z wersji deweloperskiej aby testować rozwiązania przed wdrożeniem ich na stronę online, to należy stronę testową zablokować w robots.txt.

Identyczny blok tekstu na wielu stronach

Problem
Na wielu stronach umieszczany jest ten sam blok tekstu (np. opis strony w stopce).

Rozwiązanie
Najlepiej zostawić opis tylko na jednej stronie, a na reszcie podstron usunąć lub kompletnie usunąć taki blok tekstu z serwisu.

Omówione przez nas przykłady to najpopularniejsze przyczyny duplikacji treści. Należy pamiętać o tym, że źródło problemu może być inne, dlatego kwestię duplikacji należy analizować indywidualnie dla każdego przypadku.

Jak wykryć duplikację na stronie?

Szybkie znalezienie źródła problemu umożliwia jego usunięcie bez większych strat dla pozycjonowania. Jak skutecznie wykryć duplikację na stronie? Poniżej przedstawiamy listę najpopularniejszych rozwiązań.

Ręczna analiza strony

Ręczna  analiza strony jest rozwiązaniem dość czasochłonnym - sprawdzi się tylko dla bardzo małych serwisów, choć i nawet dla nich może okazać się  niewystarczająca. Trzeba pamiętać, że roboty przechodzą po wszystkich linkach wewnętrznych, czyli nawet tych, znajdujących się w kodzie strony, a które są niewidoczne dla użytkownika.

Polecenie site: w Google

Wpisanie polecenia "site:domena.pl" w Google pozwoli na wyświetlenie wszystkich zaindeksowanych przez Google podstron serwisu. W ten sposób możemy przejrzeć podstrony witryny, które widzi Google. Aby ułatwić sobie przeglądanie ręcznie wszystkich stron zaindeksowanych przez Google, można wykorzystać ograniczenie wyników poleceniem "inurl".  

Należy jednak pamiętać, że to są strony zaindeksowane przez Google. W serwisie mogą istnieć duplikaty, których Google jeszcze nie zaindeksował lub takie, które Google wykrył jako duplikaty i już sobie jakoś połączył - nie mamy jednak pewności, że zrobił to tak, jak byśmy chcieli.

Ręczne sprawdzanie zaindeksowanych stron za pomocą komendy "site:", może być uciążliwe przy dużych witrynach.

Crawlery internetowe

Crawlery to narzędzia-roboty internetowe, które są stworzone do analizy strony. Najpopularniejsze z nich to ScreamingFrog, DeepCrawl, Sitebulb, NetPeak. Wiele z nich pozwala na wygenerowanie raportów, w których zakładce "zduplikowane strony" znajdziemy listę stron, które wg narzędzia mogą być duplikatami. Analizując serwis pod kątem duplikacji nie należy jednak opierać się wyłącznie na tej jednej zakładce. W celu pełnego wyeliminowania duplikatów wewnętrznych należy również sprawdzić listę podstron, które pojawiają się w zakładkach takich jak: "zduplikowane tytuły" , "zduplikowane description", "powielone H1", itp.

Google Search Console

Narzędzie Google Search Console ułatwia wykrycie duplikacji. Najlepiej wejść na zakładkę "Stan" i sprawdzić strony/komunikaty w kategoriach:

  • "Błąd",
  • "Prawidłowe z ostrzeżeniem"
  • "Wykluczono" (tutaj w szczególności "Duplikat, użytkownik nie oznaczył strony kanonicznej", "Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik"i "Alternatywna strona zawierająca prawidłowy tag strony kanonicznej").

Wyszukiwarka Google

Do wyszukiwania duplikatów treści można też wykorzystać wyszukiwarkę Google. Ten sposób jest jednak bardzo czasochłonny, więc lepiej wykorzystywać go do sprawdzenia tylko najważniejszych podstron takich jak strona główna, podstrony ofertowe, wybrane kategorie lub blogi. Wystarczy skopiować krótki fragment tekstu i wklejając go w okno wyszukiwarki między znakami cudzysłowu. Google wtedy pokaże wszystkie strony, zarówno te na naszym serwisie, jak i w internecie, które zawierają dokładnie taki sam tekst. Wybrany fragment tekstu nie może być zbyt krótki (bo nie będzie unikalny), ani zbyt długi (bo Google sobie z tym nie poradzi). Najlepiej wybrać fragment o długości ok. 50-100 zzs bez nazw własnych takich jak nazwa firmy, marki, produktu, itd., bo będzie on zbyt indywidualny.

Wykrycie wszystkich duplikatów na stronie nie jest łatwe i wymaga dużo pracy. Naszym zdaniem najlepszym rozwiązaniem jest stosowanie wszystkich wymienionych powyżej sposobów na raz. Podstawą powinny być narzędzia crawlowania.

Jak rozwiązać duplikację na stronie

Aby rozwiązać problem duplikacji na stronie można stosować różne rozwiązania - wybraliśmy 3 z nich i omówiliśmy szerzej:

przekierowania 301

Przekierowanie 301 to najlepsze rozwiązanie. Dlaczego? Nie tylko pozbywamy się duplikatu, ale i nie tracimy mocy. Przekierowanie przenosi większość mocy zduplikowanych stron, jest więc atrakcyjne w kontekście budowania autorytetu witryny dla Google. Jest także funkcjonalne dla użytkownika. Nawet umieszczony na forum 10 lat temu link będzie wciąż właściwy. 

Co to są przekierowania na stronie?

canonicale

Canonicale można stosować, ale należy pamiętać, że to tylko instrukcja dla Google i może zostać zignorowana przez boty. Dzieje się tak bardzo często, jeśli wskazane w ten sposób podstrony nie są identyczne - wystarczy, że mają inną nawigację okruszkową, tytuł lub h1 i już program komputerowy Google może ich ze sobą nie połączyć. Minusem tego rozwiązania jest także fakt, że użytkownicy widzą stronę pod różnymi adresami - a jeśli Google nie połączyło z canonicalem to tracimy na mocy.

blokowanie przed indeksowaniem

Blokowanie przed indeksowaniem to na dłuższą metę słabe rozwiązanie, bo zamiast łączyć moc kilku podobnych stron, tak jak w przypadku przekierowania 301, każemy Google brać pod uwagę jedną, a pozostałe i ich moc zapomnieć.

Metoda Czy bot widzi? Czy użytkownik widzi? Czy łączy moc? Czu url jest usuwany z wyników? Znaczenie dla wyszukiwarek
Trwałe przekierowania 301 Tak Tak Tak Tak Polecenie
canonicale Tak Tak, jeśli Google go uzna Tak, jeśli Google go uzna Sugestia
tymczasowe przekierowania 302 Tak Tak Tak, ale niekoniecznie całą Może być, ale nie musi Polecenie
GSC: usuwanie URLi Tak Tak Polecenie
404 File Not Found Tak Tak Tak Polecenie
Meta Noindex Tak Tak Polecenie
zablokowanie robots.txt Tak Nie, podstrona taka będzie ukryta Polecenie

Podsumowanie

Problem duplicate content to złożony temat, który wymaga działania u podstaw i szukania źródła problemu. Przedstawione przez nas propozycje rozwiązań dotyczą działań interwencyjnych - zarówno canonicale, jak i przekierowania 301 to rozwiązania, które są pracą na skutkach duplikacji, a nie jej źródle. W kontekście pozycjonowania najlepszym rozwiązaniem jest wyeliminowanie problemu już na etapie prac webmasterskich, tj. stworzenie witryny, która będzie technicznie poprawna i będzie dobrą bazą do prowadzenia działań SEO. Nie zawsze jednak mamy taką możliwość - wtedy należy sprawdzić czy i w jakim stopniu dotyczy nas problem duplicate content oraz usunąć błędy.

 

Poleć ten artykuł znajomym:

Autor
michal
Michał Borzyszkowski

Michał ceni branżę SEO za to, że cały czas się rozwija i dostarcza nowe możliwości. Sam chętnie odkrywa nowe metody na pozycjonowanie stron i trzyma rękę na pulsie, sięgając każdego dnia po zagraniczną prasę i czytając blogi SEO. W pracy nigdy się nie nudzi, a najbardziej motywują go sukcesy klientów.

Jego hobby to gry komputerowe, TV, film, tematyka sci-fi, a latem – jazda na rowerze.

Zobacz więcej o autorze

Autor
Inne artykuły o podobnej tematyce:
wyszukiwania zero click widoczni
Niski ruch organiczny z Google może być powodem do niepokoju. Kryje się za tym kilka czynników, jedn...
Zobacz więcej
nowe atrybuty linkow
Poznaj nowe atrybuty dodawane do linków wychodzących i sprawdź, czy musisz wprowadzić zmiany na stro...
Zobacz więcej
mapa strony widoczni blog
Zastanawiasz się jak stworzyć mapę swojej witryny internetowej, tak by Google mogło ją zindeksować? ...
Zobacz więcej
Oceń ten artykuł
Dlaczego duplikacja treści szkodzi stronie? Poznaj przyczyny i rozwiązania.
Średnia ocen użytkowników 5.00 na podstawie 122 głosów
Bezpłatna 45min.
konsultacja + audyt

Chcesz zwiększyć sprzedaż? Jesteś niezadowolony z prowadzonych kampanii?

Zamów BEZPŁATNĄ telekonferencję z naszym ekspertem, który przeanalizuje Twój serwis i jego pozycję na tle konkurencji, a na koniec przedstawi możliwości ZWIĘKSZENIA SPRZEDAŻY.

Strona wykorzystuje pliki cookies w celach statystycznych, analitycznych i marketingowych, w tym badania Twoich zainteresowań.
Możesz określić w przeglądarce warunki przechowywania i dostępu do cookies. Więcej

Czy wiesz ile tracisz ruchu bez optymalizacji
strony pod kątem pozycjonowania?  

Dowiedz się jakie błędy zawiera Twoja strona oraz jak wygląda jej widoczność w Google na tle konkurencji.
 

Zamów Bezpłatny Audyt SEO