Google optimizācija (SEO)

SEO un dublēts saturs: problēmas un risinājumi

Dublēts saturs ir termins, ko izmanto, lai aprakstītu identisku vai ļoti līdzīgu saturu, kas parādās vairākās vietās (unikālās saitēs) internetā. Šī problēma var rasties divējādi: gan vienas vietnes ietvaros, kas pazīstams kā iekšējais dublētais saturs (piemēram, divas dažādas adreses rāda to pašu produktu), gan starp dažādām vietnēm, ko sauc par ārējo dublēto saturu (piemēram, satura kopēšana vai pārpublicēšana).

Google šo uzsver kā nozīmīgu faktoru un sniedz definīciju: “Būtiski satura bloki domēnu iekšienē vai starp domēniem, kas pilnībā atbilst citam saturam vai ir ievērojami līdzīgi.” Ja Google redzēs, ka saturs ir dublēts, jau eksistē indeksā, šī informācija nebūs vajadzīga un netiks indeksēta, tādēļ ir ļoti svarīgi veidot unikālu saturu.

Svarīgi saprast, ka vairumā gadījumu šis saturs nerodas ļaunprātīgos nolūkos (piemēram, mēģinot manipulēt ar meklēšanas rezultātiem), bet gan tehnisku iemeslu dēļ. Tomēr, pat ja tas ir nejauši, dublēts saturs var radīt problēmas jūsu vietnes optimizācijā (SEO).

Kāpēc dublēts saturs ietekmē SEO?

Google mērķis ir sniegt lietotājiem unikālu un vērtīgu saturu. Kad vienāds vai ļoti līdzīgs saturs parādās vairākās saites adresēs, meklētājsistēmai rodas apjukums.

  1. Nezina, kuru saiti rādīt meklēšanā: Ja jums ir trīs identiskas lapas versijas, Google nezinās, kura no tām ir “oriģināls” vai “labākā”. Tā rezultātā Google var vai nu filtrēt visas versijas, vai arī rādīt meklēšanā to versiju, kuru jūs nevēlaties (piemēram, versiju ar UTM izsekošanas kodu).
  2. Saites signālu sadrumstalošana: Atpakaļsaites (backlinks) ir viens no svarīgākajiem reitinga faktoriem. Ja dažādas vietnes veido saites uz dažādām jūsu lapas versijām (piemēram, viena uz http:// versiju, otra uz https://www. versiju), “saites spēks” (link equity) tiek sadalīts starp šiem saitēm, nevis konsolidēts vienā spēcīgā lapā.
  3. Zaudēts “zirnekļu” budžets (crawling budget): Googlebot velta ierobežotu laiku katras vietnes izpētei. Ja tas tērē laiku, pārskatot vairākas identiskas satura versijas (piemēram, lapas ar dažādiem filtru parametriem), tas var novilcināt jauna, svarīga satura atklāšanu un indeksēšanu jūsu vietnē.

Vai par dublētu saturu soda?

Šis ir viens no izplatītākajiem SEO mītiem. Vairumā gadījumu par nejaušu, tehnisku dublētu saturu sods netiek piemērots. Tā vietā, lai sodītu, Google vienkārši filtrē rezultātus — tā cenšas konsolidēt dublikātus vienā “klasterī” un parādīt tikai vienu, visatbilstošāko versiju.

Problēma rodas brīdī, ja Google izvēlētā versija var nebūt tā, kuru jūs vēlaties. Redzamāku reālu sodu (piemēram, reitinga pazemināšana vai pat izņemšana no indeksa) var tikt piemērots tikai tad, ja Google konstatē, ka saturs tiek dublēts ļaunprātīgi un ar nolūku manipulēt ar meklēšanas rezultātiem (piemēram, masveidā kopējot (skrāpējot) saturu no citām vietnēm vai veidojot zemas kvalitātes lapu kopijas.

Biežākie dublēta satura cēloņi

Visbiežāk dublēts saturs rodas tehnisku iemeslu dēļ. Šeit ir izplatītākie piemēri, lokalizēti jūsu vietnei. Tādēļ šie būtu pirmie soļi, kurus veikt, lai pārbaudīt lapas stāvokli un rezultātus:

  • Protokoli (HTTP vs. HTTPS): Ja jūsu vietne ir pieejama gan ar http://, gan https:// protokolu.
    • http://manalapa.lv
    • https://manalapa.lv
  • Domēna variācijas (WWW vs. non-WWW): Ja vietne ir pieejama gan ar www subdomēnu, gan bez tā.
    • https://www.manalapa.lv
    • https://manalapa.lv
    • Sliktākajā gadījumā vietne var būt pieejama pat 4 versijās (http://, https://, http://www., https://www.).  Līdzīga situācija manā pieredzē tika novērota Liepājas koncertzāles LielaisDzintars.lv lapas auditā, ka domēni greatamber.lv un lielaisdzintars.lv un to versijas ar www un bez-www dzīvoja katrs savu dzīvi un rezultātā bija satura dublēšanās, problēmas novērtēt lapas apmeklējumu.
  • Noslēdzošā slīpsvītra (Trailing slash): Ja serveris uztver šos kā atšķirīgus URL. Šo var pārbaudīt un ar servera konfigurācijas maiņu izlabot, bet to vajag pamanīt un tālāk sniegt atbilstošas instrukcijas lapas tehniskajiem pārvaldītājiem.
    • https://manalapa.lv/pakalpojumi/
    • https://manalapa.lv/pakalpojumi
  • Saites parametri: Bieži sastopami e-komercijā (filtrēšanai, kārtošanai) vai mārketinga kampaņās (UTM kodi).
    • https://manalapa.lv/produkti/ (Galvenā kategorija)
    • https://manalapa.lv/produkti/?kategorija=apavi (Tas pats saturs, filtrēts)
    • https://manalapa.lv/produkti/?kategorija=apavi&krasa=melna (Tas pats saturs, vēlreiz filtrēts ar papildu parametriem)
    • https://manalapa.lv/produkti/?utm_source=facebook (Tas pats saturs ar kampaņas kodu jeb UTM tracking kodiem)
  • Mobilās versijas (apakšdomēns): Ja mobilajiem lietotājiem tiek rādīta atsevišķa versija m. apakšdomēnā.
    • https://manalapa.lv/blogs/raksts
    • https://m.manalapa.lv/blogs/raksts
  • AMP lapas: Paātrinātās mobilās lapas (Accelerated Mobile Pages).
    • https://manalapa.lv/blogs/raksts
    • https://manalapa.lv/amp/blogs/raksts
  • Izstrādes vietnes: Ja jūsu testa vide (piemēram, dev.manalapa.lv vai staging.manalapa.lv) kļūst pieejama Google rāpotājiem un tiek kļūdaini indeksēta. Cita kļūdas puse dažkārt tiek pieļauta, ka pēc lapas publicēšanas netiek noņemti papildu parametri lapas indeksēšanas aizliegumam un rezultātā lapa ilgstoši netiek indeksēta, atjaunota un šo kļūdu novēloti pamana.

Kā atrast dublētu saturu savā vietnē?

  1. Google Search Console: efektīvākais bezmaksas rīks. Dodieties uz sadaļu “Pārklājums” (Coverage) un meklējiet ziņojumus kā:
    • “Dublikāts, lietotāja atlasītā kanoniskā versija nav norādīta” (Duplicate without user-selected canonical)
    • “Dublikāts, Google atlasīja citu kanonisko versiju” (Duplicate, Google chose different canonical than user)
  2. SEO auditēšanas rīki: Rīki kā Screaming Frog SEO Spider (bezmaksas versija līdz 500 saitēm, nelielām lapām pietiekami), Ahrefs vai Semrush var veikt pilnu vietnes auditu un identificēt gan precīzus (Exact Duplicates), gan ļoti līdzīgus (Near Duplicates) dublikātus.
  3. Google meklēšanas operatori: Varat izmantot operatoru site: kombinācijā ar teksta fragmentu pēdiņās, lai redzētu, cik lapās tas parādās. Piemēram: site:manalapa.lv "mūsu unikālais pakalpojuma apraksts". Šī iespēja gan meklēs tikai tajās lapās, kuras jau ir indeksētas.

Kā novērst dublēta satura problēmas?

Dublēta satura risināšana ir par signālu konsolidēšanu. Jums ir jāpasaka Google, kura ir tā viena, īstā versija, kuru vēlaties indeksēt.

1.Pāradresācija jeb redirekti (301 Redirect)

Šī ir labākā un spēcīgākā metode, kad vēlaties pilnībā pārvirzīt vienu URL uz citu. 301 kods norāda, ka lapa ir pastāvīgi pārvietota. 302 parametrs tiek izmantots, ja tā ir īslaicīga pārvietošana.

  • Lietojums: Ideāls risinājums HTTP/HTTPS un WWW/non-WWW problēmām. Visām trim “nepareizajām” versijām (piem., http://manalapa.lv, http://www.manalapa.lv, https://www.manalapa.lv) būtu jāpāradresē ar 301 kodu uz vienu galveno versiju (piem., https://manalapa.lv). To izmanto arī noslēdzošās slīpsvītras problēmu risināšanai.

2. Kanoniskā atzīme (rel=”canonical”)

Šis ir HTML meta tags, ko ievieto lapas <head> sadaļā. Tas ir kā ieteikums meklētājsistēmām, norādot, kura ir šīs lapas vēlamā jeb galvenā versija, kuru vajadzētu indeksēt.

  • Lietojums: Labākais risinājums gadījumos, kad 301 pāradresāciju nevar izmantot, jo abām lapu versijām ir jābūt pieejamām lietotājiem. Tas ir ideāli piemērots URL parametriem (filtrēšanai, kampaņām).
  • Piemērs: Lapā https://manalapa.lv/produkti/?kategorija=apavi <head> sadaļā jābūt atzīmei, kas norāda uz galveno kategorijas lapu: <link rel="canonical" href="https://manalapa.lv/produkti/" />
  • Šo atzīmi izmanto arī, lai risinātu m. mobilo versiju (kopā ar rel="alternate") un AMP lapu (kopā ar rel="amphtml") dublēšanos.

3. Meta robots “noindex” atzīme

Šī atzīme, kas tiek ievietota lapas <head> sadaļā, norāda Google neindeksēt konkrēto lapu. Tā rezultātā lapa neparādīsies meklēšanas rezultātos.

  • Lietojums: Izmanto lapām, kurām nav SEO vērtības, bet kuras var radīt dublikātus. Piemēram, iekšējie meklēšanas rezultāti jūsu vietnē, lietotāja profila lapas vai kļūdaini indeksēta testa un izstrādes vide.
  • Piemērs: <meta name="robots" content="noindex, follow" />

Svarīga piezīme: Nekad neizmantojiet robots.txt failu, lai bloķētu dublētas lapas no robotiem. Ja Google nevarēs nolasīt lapu, tā neredzēs ne rel="canonical", ne noindex atzīmi un var joprojām indeksēt bloķēto URL, ja uz to vedīs kāda ārēja saite. Arī drošības apstākļu dēļ labāk robots.txt failā nenorādīt sadaļas, kuras ir aizliegtas, bet gan izmantot noindex parametru.

Cik ļoti uztraukties par dublētu saturu?

Dublēts saturs ir vairāk tehniska SEO problēma, nevis sods. Tomēr tā var nopietni ietekmēt jūsu vietnes spēju efektīvi parādīties meklēšanas rezultātos. Vairumā gadījumu Google spēj tikt galā ar nelielu dublēšanos, taču proaktīva rīcība ir labākā stratēģija.

Nodrošinot, ka katram unikālam satura gabalam atbilst tikai viena skaidri definēta saite (izmantojot 301 pāradresācijas un rel="canonical" atzīmes), jūs palīdzēsiet meklētājsistēmām labāk saprast jūsu vietni un konsolidēt visu tās SEO vērtību vienā spēcīgā adresē, nevis izkaisīti pa visu lapu, kas var radīt arī nepietiekama satura ne-indeksēšanu.

Lapas tehniskajam auditam lieti var noderēt bezmaksas aplikācija Windows/Mac videi Greenflare. Ar tās palīdzību varat veikt savas mājas lapas auditu, pārskatīt saišu darbību, līdzīgus vai vienādus lapas virsrakstus, atrast bojātas iekšējās un ārējās saites. Laba bezmaksas alternatīva SEO nozarē tik populārajam ScreamingFrog servisam.

Digitālā mārketinga un lietotāju pieredzes eksperts. Saziņai: edgars@picco.media