A duplikált tartalom és a százalékok

Néhány nappal ezelőtt vizsgakérdést kaptunk az OnlineVállalkozás blogján: Hány százalék eltérés kell tartalomban, hogy az oldal tartalma ne minősüljön duplikáltnak? Hiába kutattam a gondolataim között, nem emlékszem rá, hogy bárhol is konkrét számot olvastam volna - a találgatásokat leszámítva. Nekiálltam hát célirányosan keresgélni; a poszt végén elmesélem, mire jutottam. Előbb viszont egy rövid összefoglaló a duplikált tartalomról, a pano360.ch oldalról. Ugyan a domainen belüli duplikálásról nem ír a szerző, de az alapokat elmagyarázza.

Szóval… Mi is az a duplikált tartalom? Miért veszélyes? Hogy lehet megtudni, hogy másolja-e valaki a weboldalunk tartalmát?

A duplikált tartalom az, amikor a weboldal tartalma (szövege) duplázódik, vagy ugyanaz a szöveg azonos formában több oldalon is megjelenik. Ez például akkor fordulhat elő, ha valaki arcátlan módon összeszedeget innen-onnan tartalmakat, és azokat a saját oldalára másolja. Ám a keresők nem tudják megkülönböztetni az eredeti változatot és a másolatot, így ez a tevékenység az eredeti oldal számára is hátrányos következményekkel járhat.

Miért is büntetik a keresők a duplikált tartalmat?

Képzeld el, hogy információkat keresel egy számodra izgamas témáról. Kapsz 100 találatot - de mind a 100 oldalon ugyanaz a cikk található. Ugye te se örülnél ennek, és a te elvárásod is az, hogy minél többféle tartalmat találj?

Hogyan reagál a Google a duplikált tartalomra?

A keresők algoritmusai felismerik az azonos tartalmakat, és próbálják a találati listákon csak az egyik oldalt megtartani. Például úgy, hogy az újabb oldal kikerül az indexből. De arra is van példa, hogy az eredeti cikk tűnik el, mert az újabbnak magasabb a pagerank-je, több oldal hivatkozik rá. Ebből tehát látszik, hogy a tartalom másolása az eredeti oldal és a másolat számára is veszélyes.

És ha valaki elkéri az általunk írt cikket?

Korrekt eljárásnak tűnik, ha egy szerzőtől engedélyt kérnek az utánközlésre, egy cikk szó szerinti átvételére, a forrás megjelölésével.

Az idők azonban változnak, és ebben az esetben nem az oldalra mutató link jótékony hatása érvényesül, hanem előfordulhat, hogy az eredeti szerzőt éri a büntetés.

Jó megoldás, ha a teljes átvétel helyett rövidebb-hosszabb összefoglaló készül a cikkből, az engedélykérő hozzáfűzi saját gondolatait, és így hivatkozik az eredeti tartalomra.

Hogyan találhatjuk meg oldalaink másolatait?

A CopyScape oldalon található egy eszköz, amelynek segítségével összegyűjthetjük egy-egy oldal másolatait. (Arra persze nincs garancia, hogy a Google, vagy bármelyik másik kereső ugyanezzel az algoritmussal vizsgálja az egyezéseket.)

Forrás: Achtung Gefahr!! Double Content oder Doppelter Inhalt

—————————-

És akkor most térjünk vissza a százalékokra. A Similar Page Checker eszköz segítségével megállapíthatjuk, hogy két oldal tartalma hány százalékban egyezik. Végeztem néhány próbát a CopyScape-pel megtalált másolatokkal. Az eredmények 2 és 38% között mozogtak. Ennek ellenére kizártnak tartom, hogy már egy 30-40 százalékos egyezés gondot jelenthetne. A találgatások szerint is a legalább 80%-os hasonlóság problémás - de elég sokan vannak azon a véleményen is, hogy nem százalékos alapon értékelik a keresők a duplikálást.

A témáról bővebben a webni.innen.hu oldalon: Duplikált tartalom (pontos százalék itt sem szerepel :) )

2 hozzászólás a bejegyzéshez: “A duplikált tartalom és a százalékok”

  1. Amit a százalékokról írtál a végén, az pont a helyes válasz. A kérdés becsapós volt direkt, hiszen a google algoritmus részeként az info titkos. A legközelebb az igazsághoz a 28-30% állhat, de ez változik, változhat. 40%, vagy a biztonság kedvéért inkább 50% eltérés javasolt.

    De ez az infó nem a tartalom lopásnál érdekes ám :) Sokkal nagyobb a félelem a tartalom lopástól, mint amekkora veszélyt jelent.

    A tartalom duplikációja a domainen belül igazán veszélyes, mert ezt észre sem veszik az emberek. A CMS rendszereknél kialakulhat, hogy nem indexeli az aloldalakat vagy egyes aloldalakat a kereső, mert nincs meg a minimum eltérés… Például egy rövid blogbejegyzés vagy kép + 1 sor leírás, ami mellett ott van a statikus hasáb (magamról, blogroll, stb.) Ha a statikus szövegből több van, mint a dinamikusból, lehet, hogy a Google ejti az aloldalt.

  2. Vero.Boglarka | 2008. január 24., 12:30

    Dávid, köszönöm a kiegészítést!

Mi a véleményed?