Hogyan javítsuk a Feltérképezési hibákat a Webmestereszközökben? | Weboptim
Az utóbbi években sok minden megváltozott a Webmestereszközökben. A Keresési statisztikák és Az Ön webhelyére mutató linkek szekciók a két eddigi legjobb újítás.
Feltérképezési hibák rész
A Webmestereszközök 2 fő részre osztható: Webhelyhibák és URL-hibák.
A hibák besorolása e két csoportba nagyon hasznos, hiszen határozott eltérés van a weboldal illetve az aloldal szinten megjelenő hibák között.
- A weboldal szintű hibák sokkal súlyosabbak, hiszen tönkretehetik akár az egész oldal használhatóságát.
- Az URL hibák egy-egy aloldalhoz kapcsolódnak, ezért kevésbé sürgető problémák.
A WMT kezdőoldalán egy gyors áttekintést kaphatunk az oldalunkról, 3 fontos eszközt láthatunk: Feltérképezési hibák, keresési statisztikák, Webhelytérképek.
A Feltérképezési hibákat könnyedén elérhetjük a Webmestereszközök kezelőfelületén.
1. Webhelyhibák
A Webhelyhibák rész az egész weboldalra vonatkozó hibákat mutatja. Ezek a legmagasabb szintű hibák, ezért soha ne hagyjuk őket figyelmen kívül. Az oldalon az elmúlt 90 nap adatait láthatjuk.
Ha volt bármilyen tevékenység az elmúlt 90 napban, akkor ezt láthatjuk itt:
Ha 100%-ban hibamentes volt az oldal az elmúlt 90 napban, akkor pedig ezt:
Milyen gyakran ellenőrizzük ezeket a webhelyhibákat?
Ideális esetben minden nap meg kellene néznünk, hogy nincs-e probléma. Ez nagyon monoton munka, mert a legtöbb nap semmi sem változik, de mi van ha nem nézzük és lemaradunk kritikus hibákról?
Legalább minden 90 napban ellenőrizni kell a korábbi hibákat! Ez a szekció kritikus és 100%-os hibamentességre van szükség minden nap.
A, DNS hibák
Mit jelent ez?
A DNS hibák fontosak. Az első és legfontosabb hibák, mert ha a Googlebot DNS hibát talál, az azt jelenti, hogy a Google nem tud kapcsolódni a domainhez a DNS szerveren keresztül.
Miért fontos ez?
Ha egy súlyos DNS problémát észlelünk, azonnal cselekedni kell. A DNS nagyon fontos, hiszen ez az első lépés az oldal eléréséhez. Határozott lépéseket kell tennünk, ha DNS hibát látunk.
Hogyan javítsuk?
1. Először is, a Google ajánl egy Megtekintés Google-ként eszközt, ahol láthatjuk, hogy a Googlebot hogyan térképezi fel az oldalunkat.
2. Ha csak a DNS állapotot szeretnénk vizsgálni, a Lekérés lehetőséget válasszuk. A Lekérés és Megjelenítés valamivel lassabb folyamat, de akkor hasznos, ha össze szeretnénk hasonlítani, hogy a Google hogyan látja az oldalt a felhasználókhoz képest.
3. Ellenőrizzük a DNS szolgáltatót. Ha a Google nem tudja lekérni az oldalt, akkor további lépésekre van szükség.
4. Biztosítsuk, hogy a szerver mutatja a 404 és 500 hibakódokat. Ahelyett hogy hibás kapcsolatot mutat, 404 (nem található) vagy 500 (szerverhiba) kódot kellene mutatnia.
B, Szerverhibák
Mit jelent ez?
A szerverhiba legtöbbször azt jelenti, hogy a szerver válaszideje túl hosszú és a lekérés túllépte a megengedett időt. A Googlebot, amikor próbálja feltérképezni az oldalt, csak egy bizonyos betöltési időt vár meg, mielőtt abbahagyja a folyamatot. Ha a betöltési idő túl hosszú, megáll.
A szerverhibák különböznek a DNS hibáktól. A DNS azt jelenti, hogy a Googlebot nem látja az URL-t DNS probléma miatt, miközben a szerverhiba esetén a Google tud kapcsolódni az oldalhoz, de nem tudja betölteni az oldalt szerverhiba miatt.
A szerverhibák akkor történhetnek, ha az oldalunkon túl sok a látogató és a szerver nem tudja ezt a megnövekedett forgalmat kezelni.
Miért fontos ez?
Csak úgy, mint a DNS hibák, a szerverhibák megoldása is sietős. Ez egy alap hiba és az egész weboldalra káros hatással van.
Hogyan javítsuk?
Győződjünk meg róla első lépésben, hogy a Googlebot tud kapcsolódni a DNS-hez.
Abban az esetben, ha a weboldal jól fut és ezt a hibát tapasztaljuk, azt jelentheti, hogy a múltban már voltak szerverhibák. Még ha ez a hiba meg is oldódott mostanra, változtatnunk kell, hogy többet ne forduljon elő.
A Google hivatalos leírása a szerverhibák megoldására:
Használjuk a Megtekintés Google-ként eszközt, hogy lássuk a Googlebot feltérképezi az oldalt. Ha lekérünk egy oldalt és a Google a főoldalt probléma nélkül megjeleníti, akkor feltételezhetjük, hogy a Google képes hozzáférni megfelelően az oldalhoz.
A szerverhibáknak több oka/típusa lehet: időtúllépés, csonkított fejlécek. kapcsolat helyreállítása, kapcsolat elutasítása, sikertelen csatlakozás, csatlakozási időtúllépés, nincs válasz. Az egyes hibák javításához használjunk a Webmestereszközök súgóját: https://support.google.com/webmasters/answer/35120?hl=en
C, Sikertelen robots.txt lekérés
A robots.txt sikertelen lekérése azt jelenti, hogy a Googlebot nem tudja letölteni a weboldal robots.txt fájlját, ami a [yourdomain.com]/robots.txt URL alatt található.
Mit jelent ez?
Az egyik legmeglepőbb dolog a robots.txt fájllal kapcsolatosan, hogy csak akkor van rá szükség, ha azt szeretnénk, hogy a Google egyes oldalakat ne térképezzen fel. (pl. admin oldalak)
Miért fontos ez?
Ez nagyon lényeges kérdés. Kisebb, statikus weboldalaknak, kevés változtatással vagy új oldallal, ez nem olyan fontos. De persze érdemes javítani.
De ha az oldalunk gyakran változtat a tartalmán, akkor azonnali feladat a hiba megoldása. Ha a Googlebot nem tudja letölteni a robots.txt fájlt, nem tudja feltérképezni az oldalt és így az új oldalak vagy a változtatások nem kerülnek be az indexelésbe.
Hogyan javítsuk?
Győződjünk meg róla, hogy a robots.txt fájl helyesen van konfigurálva.
Ellenőrizzük le kétszer, melyik oldalakat nem szeretnénk, ha feltérképezésre kerülne.
Háromszor ellenőrizzük a legfontosabb sort “disallow:/” és biztosítsuk, hogy ez nem létezik, hacsak valamilyen okból nem szeretnénk, hogy a weboldal ne jelenjen meg a keresési eredmények között.
Ha a fájl jónak tűnik, de még mindig hibát mutat, használjunk HTML kód ellenőrző programot, hogy lássuk 200 vagy 400 HTML kódot ad-e vissza.
Jobb, ha egyáltalán nincs robots.txt fájlunk, mintha van egy, ami nincs jól beállítva. Ha nincs, a Google a szokásos módon végzi a feltérképezést. Ha van és hibás, akkor abbahagyja a feltérképezést, amíg nem javítjuk ki a fájlt.
2. URL hibák
Az URL hibák nagyban különböznek a webhelyhibákról, mert ezek a weboldalon belül csak egyes oldalakra vannak hatással, nem magára az egész oldalra.
A Webmestereszközök mutatja a top URL hibákat kategóriánként – asztal, okostelefon. Nagyobb oldalaknál ez a lista valószínűleg nem elég az összes hiba azonosításához, de a legtöbb oldalnál minden problémát képes azonosítani.
Túl sok hibát látunk? Jelöljük meg javítottként!
Sok weboldal tulajdonos a rengeteg URL hibát látva megrémül. A legfontosabb dolog hogy emlékezzünk rá
- a, a Google a legfontosabb hibákat mutatja csak
- b, ezek egy része már megoldódott
Ha valami drasztikus változást végeztünk az oldalon, hogy helyrehozzuk a hibákat, vagy úgy gondoljuk egy csomó URL hiba már nem áll fenn, válasszuk a megjelölés javítottként lehetőséget és nézzünk vissza pár nap múlva.
Ha így teszünk, a hibák eltűnnek most a táblázatból, és ha nem lett javítva, akkora Google a következő feltérképezés alkalmával újra megjeleníti majd. Ha valóban javítottuk a hibákat, akkor nem jelennek meg újra. Ha a hibák még léteznek, akkor tudni fogjuk, hogy befolyásolja az oldalunkat.
A, lágy 404
A lágy 404-es hiba azt jelenti, hogy az aloldal 200 (ok) válaszkódot ad vissza ahelyett, hogy 404 (nem található)-t mutatna.
Mit jelent ez?
Csak azért mert a 404-es oldalunk úgy néz ki, mint egy 404-es oldal még nem jelenti azt, hogy az is. A felhasználó által látható 404-es oldal a tartalom egy része. A látható üzenet tudatja velük, hogy az adott oldal már nem található. Gyakran, a weboldal tulajdonosok hasznos linkeket vagy vicces képeket helyeznek el a 404-es oldalon.
A 404-es oldal lényege a feltérképezéskor látható válasz. A fejléc HTTP válaszkódja 404 (nem található) vagy 410 (eltűnt) kell legyen.
Ha a 404-es hibaoldalt kapjuk vissza és a listában lágy 404-es hibaként szerepel, azt jelenti, hogy a válaszkód nem 404.
Egy másik szituáció, amikor 404-es hiba megjelenhet, ha az egyes oldalak 301-es átirányítással nem kapcsolódó oldalakra mutatnak, hanem például a főoldalra.
A Google hivatalos álláspontja:
Egy nem létező (vagy a főoldalra átirányítás alatt álló) oldal számára a 404 vagy 410 HTML kódtól eltérő kód problémás lehet.
Ad ugyan pár iránymutatást, de nem teljesen világos, mikor indokolt a lejárt oldalt a főoldalra irányítani és mikor nem. A gyakorlatban, ha sok oldalt irányítunk a főoldalra, a Google úgy értelmezheti az átirányított URL-eket, mint lágy 404-es hibák, a valódi 301-es átirányítás helyett.
Ezért ha a régi oldalt átirányítjuk egy kapcsolódó oldalra ehelyett, nem valószínű, hogy lágy 404-es hibaként felmerül.
Miért fontos ez?
Ha a lágy 404-es hibákat mutató lista nem tartalmaz kritikus oldalakat, akkor nem azonnali feladat a javításuk. Ha kritikus oldalak vannak listázva, mint lágy 404-es hibák, akkor gyors intézkedésre van szükség.
Hogyan javítsuk?
Azon oldalak esetében, amik már nem léteznek:
- Használjunk 404-es vagy 410-es kódot, ha az oldal már nincs és nem fogad jelentős forgalmat vagy linket. Biztosítsuk, hogy a szerver válaszkód 404 vagy 410, nem 200.
- A 301-es átirányításokkal a régi oldalakat releváns új oldalakra irányítsuk.
- Ne irányítsunk nagyszámú halott oldalt a főoldalra.
Azon oldalak esetében, amik élők és nem kellene 404-es lágy hibát adniuk:
- Győződjünk meg róla, hogy megfelelő mennyiségű tartalom van az oldalon, mivel a kevés tartalom is lágy 404-es hibának tűnhet.
- Győződjünk meg róla, hogy az oldal tartalma nem tűnik 404-es oldalnak.
A lágy 404 furcsa hiba. Sok zavart okozhat, mert a 404-es és a normál oldal egyfajta hibrid keveréke és éppen ezért nem lehet mindig egyértelműen azonosítani. A lényeg, hogy biztosítsuk, hogy a legfontosabb oldalak nem lágy 404-es hibák.
B, 404-es hiba
A 404 azt jelenti, hogy a Googlebot próbálja feltérképezni az oldalt, ami nem létezik. Akkor is 404-es hibát mutat, ha más website vagy aloldal linkel egy nem létező oldalra.
Mit jelent ez?
A Google irányelve a következőt mondja:
Általánosan, a 404-es hiba nincs hatással a weboldal Google helyezéseire, ezért figyelmen kívül hagyhatjuk őket.
Ez így szép, de ha kritikus oldalak adnak 404-es hibát, akkor nem ignorálhatjuk őket.
Különbséget kell tenni aközött, amikor figyelmen kívül hagyhatjuk a hibát és aközött, amikor késő estig az irodában kell maradni, hogy megoldjuk.
Egy időtlen időkre érvényes tanács:
Ha 404-es hibával találkozunk, hacsak az oldal nem:
a, sok fontos linket kap külső forrásokból
b, jelentős mennyiségű forgalmat kap
c, nyilvánvaló URL-je van, amit a látogatók könnyen elérnek,
Hagyjuk meg 404-nek.
A munka legnehezebb része eldönteni, hogy mi számít fontos külső hivatkozásnak és érdemi mennyiségű forgalomnak az adott URL esetében.
Miért fontos ez?
Talán az egyik legtrükkösebb és legegyszerűbb probléma a felmerülhető hibák közül. A közepes és nagy oldalak hatalmas mennyiségű 404-es URL-jeit elegendő elrettentésnek felhozni.
Akkor igényelnek azonnali megoldást, ha fontos oldalak adnak 404-es hibakódot. Ahogy a Google is mondta, ha az oldal már régóta megszűnt és nem felel meg a fenti kritériumoknak, akkor hagyjuk úgy. Akármilyen fájdalmas is látni a hibák százait a Webmestereszközökben, csak hagyjuk őket figyelmen kívül.
Hogyan javítsuk?
Ha fontos oldalunk mutat 404-es hibát és nem akarjuk így hagyni, tegyük a következőt:
- Győződjünk meg róla, hogy az oldal publikálva van és nem vázlatként elmentve.
- Győződjünk meg róla, hogy a 404 hibás URL a helyes oldal és nem egy variációja.
- Ellenőrizzük, hogy a www vagy www nélküli, illetve a http vagy https verzióban látható a hiba.
- Ha nem akarjuk újraéleszteni az oldalt, de szeretnénk átirányítani máshova, győződjünk meg róla, hogy a legjobban kapcsolódó oldalra irányítottuk.
Röviden, ha az oldalunk halott, tegyük újra élővé. Ha nem akarjuk élővé tenni, akkor 301-el irányítsuk át egy jó oldalra.
Hogyan lehet megállítani a régi 404-es oldalak megjelenését a feltérképezési hibák jelentésben?
Ha a 404 hibás oldal többé nem kell, a Google ajánlása szerint hagyjuk figyelmen kívül. De ahhoz, hogy megakadályozzuk, hogy újra megjelenjen a Feltérképezési hibák jelentésben, néhány dolgot tehetünk.
A Google azokat a 404-es hibákat mutatja az első helyen, amelyekre vagy az oldalon belülről vagy külső weboldalról link érkezik. Más szavakkal, ha beírunk egy URL-t, nem fog megjelenni a feltérképezési hibák között, hacsak nem kap linket valahonnan.
Hogy megtudjuk, honnan kap linket a hibás oldal, kattintsunk az adott URL-re. Ezután keressük meg az oldal forráskódjában a linket és javítsuk ki.
Fáradtságos munka, de ha el akarjuk érni, hogy a 404-es oldal többet ne jelenjen meg a jelentésben, akkor minden oldalról el kell távolítanunk a hibás linket. A külső weboldalakról is.
Ha a régi webhelytérképről kapunk linket, akkor onnan is el kell távolítanunk. Ne irányítsuk át őket az új oldaltérképre.
C, Hozzáférés megtagadva
A hozzáférés megtagadva azt jelenti, hogy a Googlebot nem tudja feltérképezni az oldalt.
Mit jelent ez?
A hozzáférés megtagadva hibák gyakran blokkolják a Googlebot-ot a következőkben:
- Meg kell kérnünk a felhasználókat, hogy jelentkezzenek be az oldalra az URL megtekintéséhez, mert a Googlebot blokkolja.
- A robots.txt fájl blokkolja a Googlebotot, így az egyéni URL-eket, egy mappát vagy akár a teljes weboldalt.
- A tárhely szolgáltató blokkolja a Googlebotot, vagy a kiszolgáló a felhasználók proxy alapú hitelesítését kéri.
Miért fontos ez?
Hasonlóan a lágy 404-es és 404-es hibákhoz, ha egy blokkolt oldalt esetében fontos, hogy feltérképezve és indexelve legyen, akkor azonnal cselekednünk kell.
Ha nem akarjuk, hogy az adott oldal feltérképezésre és indexelésre kerüljön, akkor egyszerűen hagyjuk figyelmen kívül.
Hogyan javítsuk?
A hozzáférés megtagadva hibák javításához el kell távolítanunk azokat az elemeket, amik blokkolják a Googlebot hozzáférését:
- Távolítsuk el a bejelentkezést azokról az oldalakról, amit szeretnénk, ha a Google feltérképezne, akár belső oldal akár felugró ablak.
- Ellenőrizzük a robots.txt-t, tudjuk, hogy az oldalak, amik szerepelnek benne, azt jelenti, hogy blokkolva lesznek.
- Használjuk a robots.txt ellenőrző eszközt, hogy lássuk a benne található hibákat, és hogy teszteljünk egyedi URL-eket.
- Használjunk a Megtekintés Google-ként eszközt, hogy megtudjuk, hogyan jelenik meg a webhely a Google számára.
Ugyan nem olyan gyakori, mint a 404-es hiba, a hozzáférés megtagadva hiba mégis károsíthatja az oldal helyezéseit, ha rossz oldalak vannak blokkolva.
D, Not followed
Mit jelent ez?
Nem tévesztendő össze a “nofollow” link attribútummal, a not followed hiba azt jelenti, hogy a Google nem tudja követni az adott URL-t. Az ilyen hibák legtöbbje a Flash, Javascript tartalmakból vagy az átirányításokból ered.
Miért fontos ez?
Ha not followed problémával találkozunk magas prioritású URL esetében, akkor igen, fontos.
Ha a hiba régi URL-ekből ered, amik már nem aktívak, vagy egyes paraméterei nincsenek indexelve és csak egy extra lehetőség, akkor a prioritás alacsony szintű – de azért elemezni kell őket.
Hogyan javítsuk?
A Google és egyéb keresőmotorok több dolgot azonosítottak, amik akadályozhatják a feltérképezést: JavaScript, Sütik, Egyedi ID, Frame, DHTML, Flash tartalom
Használjuk a Lekérés és Megjelenítés eszközt, hogy lássuk, mit lát a Google. Ha Google-ként nem látjuk az oldalt vagy hiányoznak fontos tartalmak a fenti technológiák valamelyike miatt, akkor hiba van. Hiszen látható tartalom és linkek nélkül az URL nem tud követett lenni.
Ha paraméter probléma van, vizsgáljuk meg, a Google hogyan kezeli a paramétereinket.
A not followed oldalak hasonlóak az átirányításokhoz, figyeljünk a következőkre:
- Ellenőrizzük az átirányítás láncokat.
- Ha lehet frissítsük az oldalstruktúrát, hogy minden aloldal legyen elérhető egy statikus oldalról.
- A webhelytérkép ne tartalmazza az átirányított URL-t, kivéve a cél URL-t.
E, Szerver és DNS hibák
Az URL hibák alatt a Google még egyszer listázza a szerver és DNS hibákat, ugyanúgy, mint a webhelyhibák esetében.
A Google álláspontja szerint ugyanúgy kell ezeket kezelni, mint az oldal szintű DNS és szerver hibákat.
Ha külön beállításunk van az egyéni URL-ekre, mint például a minioldalak, vagy más konfigurációt használunk bizonyos URL-ek esetében a domainen belül, akkor itt megjelenhetnek.
A feltérképezési hibák összefoglalása
Konklúzió
Senki sem akarja egyenként átnézni és megjavítani a jelentéktelennek tűnő URL hibákat vagy épp ellenkezőleg, valakire a pánik tör rá, mikor meglátja a több ezer hibát a Webmestereszközökben.
Tapasztalattal és ismétléssel megtanulhatjuk, hogyan reagáljunk a hibákra: melyikek, fontosak és melyiket hagyhatjuk nyugodtan figyelmen kívül.
A hibák javítása nem csak segíthet a keresési rangsorban elért helyezés javításában, jobb felhasználói élményt nyújthat a látogatóknak és elősegíti az üzleti célok gyorsabb elérését.
Source: moz.com