Content marketing - Co to jest duplicate content i jaki ma wpływ na pozycjonowanie? (cz. 5)

Przy okazji poprzednich artykułów poświęconych pojęciu content marketing, zwracaliśmy szczególną uwagę na tworzenie unikalnych i wartościowych tekstów, które w pierwszej kolejności powinny zainteresować odbiorców poszukujących wybrane treści. Niejednokrotnie można jednak spotkać się z sytuacją kopiowania tekstów z innych stron w celu szybkiego zapełnienia strony materiałami. Algorytmy Google nie odbierają takich działań pozytywnie, co może w krótkim czasie odbić się na pozycji strony w wynikach wyszukiwania. W świetle powyższego przypadku pojawia się pojęcie duplicate content, który może negatywnie odbić się na naszej stronie internetowej. Poniżej przedstawiamy co oznacza pojęcie duplicate content oraz jak skutecznie go ograniczyć.

Czym jest duplicate content?

Duplicate content, czyli inaczej powielanie treści występuje wtedy, gdy ta sama zawartość w formie tekstowej, pojawia się w kilku adresach URL. Należy podkreślić, że często może być wynikiem nieświadomych działań, dlatego warto bliżej zapoznać się z tym pojęciem. Wyróżniamy dwie grupy duplicate content:

  • powielona treść znajdująca się na jednej witrynie (domenie),
  • powielona treść występująca w obrębie wielu domen.

Duplicate content w ramach jednej domeny

Najczęstszym i nieświadomym błędem, przez który powielamy materiały w obrębie jednej witryny, jest strona główna, która umieszczona jest na kilku adresach, tylko pozornie różniących się od siebie. Przykład kilku adresów strony głównej powielającej zawartość:

  • http://abc.com,
  • http://abc.com/index.html,
  • http://www.abc.com,
  • http://www.abc.com/index.html,
  • http://abc.com/index.html?utm_source=rss.

Pomimo faktu, że każdy z wymienionych adresów URL jest inny, to jednak przez wyszukiwarki traktowany jest w ten sam sposób, ze względu na odnośnik do tej samej treści – w tym przypadku przykładowa strona główna. Twórcy stron często nieświadomie tworzą w ten sposób adresy, ze względu na chęć wprowadzenia dodatkowych funkcji. Może to być przykładowo:

  • kanał RSS,
  • wprowadzenie wersji strony do druku,
  • dwie wersje strony, przeznaczone dla komputerów stacjonarnych oraz urządzeń mobilnych,
  • udostępnianie strony z możliwością przeglądania w kilku widokach lub przy użyciu dodatkowych filtrów – praktyka najczęściej stosowana w przypadku sklepów internetowych.

W jaki sposób możemy wyeliminować duplicate content?

Istnieją 3 skuteczne sposoby radzenia sobie z powielaniem treści:

  • za pomocą rel canonical możemy wskazać właściwą stronę do indeksacji,
  • webmasterzy mogą skorzystać z rozmaitych narzędzi, które udostępniane są przez wyszukiwark,
  • warto skorzystać z meta robots lub robots.txt, służących do blokowania duplikatów.

Duplicate content w ramach wielu domen

Powielanie treści może występować w formie świadomego działania. Praktyka ta – znana również jako syndykowanie treści - stosowana jest często przez duże serwisy, które udzielają prawa do przedruku swoim partnerom biznesowym. W tej sytuacji warto zadbać o odpowiednio skonstruowaną umowę o współpracy, na której powinien znaleźć się zapis, zobowiązujący stronę przedrukowującą tekst do linkowania do oryginalnego źródła, a także do zablokowania publikacji przed indeksacją. Należy jednak pamiętać, że druga strona może nie chcieć przystać na taką formę umowy.

W przypadku nieświadomego działania, duplikowanie treści przez webmastera, najczęściej spowodowane jest działaniami Black Hat SEO, a więc zaliczanymi do niezbyt legalnych metod pozycjonowania strony, które mogą być przyczyną spamu w wyszukiwarkach.

Jeśli mamy pewność co do kradzieży naszych materiałów, w pierwszej kolejności można spróbować nawiązać kontakt z właścicielem strony – istnieje duże prawdopodobieństwo, że webmaster stosujący tę metodę nawet nie wie, że wykorzystał materiały z naszego serwisu. Często bowiem do skutecznego pozycjonowania tworzony jest tzw. splog – występuje w różnych formach, choć często tworzony jest w formie zautomatyzowanego bloga, pobierającego treści z innych witryn.

Natomiast jeśli kontakt będzie niemożliwy lub prośba o usunięcie naszych artykułów okaże się bezcelowa, to warto zwrócić się z problemem na policję. W przypadku jasnych dowodów nie będzie wątpliwości, co do winy oskarżonego.

O czym należy pamiętać w przypadku występowania duplicate content?

  • wyszukiwarka Google w przypadku wykrycia zduplikowanej treści, dla utrzymania porządku zawsze blokuje powielaną treść. Oznacza to, że wyniki wyszukiwania nie wyświetlają dwukrotnie tej samej strony nawet wówczas, jeśli występuje w obrębie kilku domen,
  • w przypadku, gdy dwie lub więcej domen posiadają powieloną treść, a nie są odpowiednio skonfigurowane, to Google samo wybierze tę, która najlepiej pasuje do strony, a następnie wyświetli ją w wynikach wyszukiwania – należy zatem pamiętać, aby wcześniej ustawić jedną z nich jako stronę główną,
  • wybór najlepszego dla Google adresu www zależy od uwzględnienia w adresie docelowym przedrostka www, następnie należy dokonać przeniesienia pozostałych domen na adres główny przy użyciu przekierowania 301 – w tym celu należy skorzystać z pliku .htaccess na serwerze,
  • w nagłówku strony za pomocą meta tagu można zdefiniować w kodzie jej kanoniczny adres – przykład takiego rozwiązania to <link rel="canonical" href="http://www.domena-glowna.pl" /> - dzięki czemu zabezpieczymy nie tylko stronę główną, lecz również poszczególne podstrony przed ryzykiem wystąpienia duplicate content,
  • regularne dbanie o konfigurację i optymalizację witryny zagwarantuje jej nie tylko unikalność na tle konkurencji, lecz również znacząco ograniczy zjawisko duplicate content.