Pdf-ek optimalizálása
Az Adobe cég szenzációs pdf-formátuma már jónéhány éve létezik, és szinte észrevétlenül az internet szerves részévé vált. A keresők gond nélkül indexelik, a html-oldalak konkurense a találati listákon. Minden keresőoptimalizálónak érdemes ismernie a tulajdonságait, hogy kihasználhassa a benne rejlő lehetőségeket. A pdf-ek optimalizálásához Dan Larkin ad tanácsokat, insideblog című oldalán.
A legfontosabb keresők ugyanúgy indexelik a pdf-eket, mint a html-oldalakat, a pdf-ekben lévő linkek ugyanolyan értékesek, mint a “szokásos” weboldalakon használtak. A Google ezen a területen is az élen jár: alig tesz különbséget a formátumok között. Csak az számít, hogy egy adott tartalom online elérhető-e, és másodlagos, hogy az html, pdf vagy valami más – a lényeg, hogy a benne lévő információ hozzáférhető legyen.
Ha például valaki a hírlevelét pdf-formátumban felteszi a weboldalára, de a blogjában meg is jeleníti a teljes szöveget, akkor ezzel duplikált tartalmat állít elő, és viselnie kell annak minden következményét.
Előre el kell dönteni, hogy melyik verziót helyezzük előtérbe, a html-t vagy a pdf-et. Ha a blogbejegyzés a fontosabb, akkor meg kell oldani, hogy a pdf ne kerüljön az indexbe: a rámutató linkben egy “rel=noindex” beépítésével, vagy a robots.txt segítségével.
Aki gyakran használ pdf-eket, annak alaposabb ismeretekre is szüksége van, hogy ki tudja használni a pdf összes adottságát az optimalizálás során. Ide tartoznak például a dokumentum tulajdonságai.
Sok szoftver lehetőséget nyújt arra, hogy a pdf-hez meta-adatokat lehessen megadni. Ilyen meta-adat többek között a cím, a téma, a szerző. Ezek az információk xml-formátumban a pdf-be is bekerülnek, így a keresők robotjai be tudják olvasni őket. Aki ezeket a mezőket nem tölti ki, értékes keresőoptimalizálási lehetőséget hagy ki!
Arra is figyelni kell, hogy ha szövegszerkesztőből mentjük a pdf-et, akkor már a szöveg szerkesztése során használjuk a h1, h2 stb. formázásokat, hiszen ezeket átveszi a pdf, a keresők pedig ugyanúgy értékelik, mint a html-oldalaknál – azt pedig talán nem kell részletezni, hogy a jó helyezés érdekében mennyire fontos ezek használata.
Forrás: Pimp my PDF oder wie man eine PDF suchmaschinenfreundlicher macht

Ezt a “duplikált tartalmat” mennyire kell komolyan venni? Mik lehetnek a kovetkezmenyei?
A duplikált tartalomról és annak hatásairól mindenképp érdemes elolvasni Longhand cikkét: http://optimalizalas.info/kereso-optimalizalas/duplikalt-tartalom.php , illetve én is írtam róla korábban: http://www.onlinemarketingwelt.hu/tag/duplikalt-tartalom .
Sok seo-fórumban folyik a vita arról, hogy a pdf is okozhat-e duplikált tartalmat és így büntetést, egyelőre még nem született konszenzus.
Szerintem a Google szempontjából logikus ugyanúgy kezelni a pdf-ben lévő tartalmat, mint ahogy a html-oldalakét, hiszen ugyanazon a találati listán jelennek meg, és a felhasználónak nem jelent új információt, ha ugyanazt a szöveget más megjelenítésben tudja olvasni.
Szia.
Nagyon tetszik a cikk és szeretnék egy kicsit jobban elmerülni a témában, de sajnos a linkek nem élnek. Tudsz nekem ebben segíteni?
Köszi, h szóltál, kijavítottam őket!