Google: 500 chýb zostane indexovaných, keď ich zopakujú

Na stretnutí Johna Muellera dňa 13. 8. 2021 mal správca webu obavy z 500 chýb, ktoré sa zobrazujú v službe Google Search Console.

John vysvetlil, že v tomto neexistujú žiadne skutočné hranice. Vysvetlil tiež, že Google bude tieto chyby 5xx opakovať znova a znova a zostanú indexované.

Ak Google po niekoľkých pokusoch zistí, že tieto stránky sú skutočne preč, zahodí ich.

Toto sú efekty, ktoré uvidíte pri 500 chybách. Ak existuje viac ako 1-percentný problém s týmito chybami – v porovnaní s počtom stránok na vašom webe – budete chcieť na svojom webe skontrolovať závažné problémy pre prípad, že by sa niečo pokazilo.

Správca webu mal tiež obavy z chýb 504 a problémom je, či sa chyba 200 číta presne v rovnakom čase – na tej istej adrese URL ako chyba 500 – alebo nie.

Správca webu 4 13:46
V pohode. Ďakujem, John. Takže určité pozadie, naše systémy a sieť na doručovanie obsahu sú navrhnuté tak, aby umožnili všetkým skutočným používateľom prezerať si náš obsah a odfiltrovať niektoré roboty, zatiaľ čo ostatným, ako je Googlebot, umožniť prejsť. A len pre nejaký dodatočný kontext. Začiatkom tohto roka sme zmenili našu sadu monitorovania serverov. A mysleli sme si, že sme preniesli všetky požiadavky na podávanie správ. Museli sme zabezpečiť, aby mal Googlebot prístup k nášmu obsahu.

Žiaľ, zdá sa, že sme niektoré vynechali a v službe Search Console sme si všimli, že koncom minulého mesiaca sa objavilo približne 500 chýb série. Náš technologický tím prišiel s otázkou, či to predstavuje skutočný vplyv na používateľa a prečo by sme sa špecificky pozreli na Googlebota, nie na skutočné používateľské metriky, aby sme dokázali, že tu je problém. Takže vzhľadom na tento kontext mám niekoľko otázok. Prvým je len dostať technologické obavy z cesty. Ako z vášho pohľadu vidí Googlebot chyby série 500? A mohli by ste objasniť stanovené limity, v ktorých bude Googlebot, viete, indexovo prehľadávať zdrojový obsah – menej na základe týchto chýb?

Čítať:  Čo robiť, keď WordPress prekročí maximálnu veľkosť nahrávania pre web

Ján 14:58
Nemáme na to žiadne silné prahy. Ale v podstate to, čo sa stane s 500 chybami, je, že sa ich pokúsime zopakovať. A ak budeme naďalej vidieť, že ide o 500 chýb, tak trochu spomalíme prehľadávanie. A ak budeme naďalej vidieť, že ide o 500 chýb, potom tieto adresy URL z indexu vypustíme. Takže to je niečo, kde ak každú chvíľu majú jednotlivé stránky chybu 500, nevadí, že to skúsime znova, zostanú indexované.

A nabudúce ich skúsime znova. Ak však veľká časť lokality neustále obsahuje 500 chýb a môžeme predpokladať, že problém možno spôsobujeme my, spomalíme prehľadávanie celej lokality a v určitom okamihu povieme: , zdá sa, že tieto stránky sú naozaj preč, zahodíme ich.“ Takže to sú v podstate účinky, ktoré by ste tam videli.

A ak hovoríte o veľkom webe a zaujíma vás, aké percento z 500 chýb je v poriadku? Neviem, môj, môj pocit je, že ak vidíte niečo viac ako 1 percento, potom to znie, ako keby niečo bolo, je to trochu pokazené a pravdepodobne by to bolo niečo, kde by sme začali spomaľovať. Nemyslím si však, že máme nejaké pevné prahové hodnoty, pri ktorých by sme povedali, že toľko žiadostí, a toľko chýb znamená také veľké spomalenie.

Správca webu 4 16:28
V pohode. Ďakujem. V denníkoch našich serverov sa tiež zobrazuje číslo 200 pridelené robotovi Googlebot v rovnakej časovej pečiatke ako číslo 504 v službe Search Console a naša sieť na doručovanie obsahu nám hovorí, že ak robot Googlebot dostane číslo 504 z CDN, automaticky sa ho pokúsi načítať z pôvodu. Mohli by ste mi to potvrdiť, vyvrátiť alebo prípadne zameniť?

Čítať:  Google vysvetľuje, prečo sú adresy URL parametrov indexované

Ján 16:54
Nemyslím si, že robíme nič zvláštne, čo sa týka 504. Ale nejako to potrebujem, musel by som to skontrolovať. Takže v dokumentácii pre vývojárov vyhľadávania sme jednoducho umiestnili stránku so všetkými stavovými kódmi HTTP a s tým, ako na to reagujeme. Nemyslím si, že máme nič, o čom by sme povedali, že by sme sa odložili na iný pôvod ako CDN, pretože v skutočnosti nevidíme ten rozdiel. Pretože z nášho pohľadu pristupujeme k názvu domény. A ak sa názov domény rozdelí na CDN, tak to je to, čo dostaneme. Nebudeme hovoriť: “No, vezmeme inú IP adresu a potom to skúsime znova.”

Správca webu 4 17:39
V pohode. To skutočne pomôže pri ďalšej diskusii s naším CDN. Takže ďakujem. Záverečná otázka. Ak spravujem webovú stránku pre čajovňu, nastavím všetky moje stránky na 418? Viete, pomôžte mi zaradiť sa lepšie? To asi nie. Správny.

Ján 17:56
Vlastne neviem, čo by sme s tým robili. Pravdepodobne sme ich vypustili ako 400 chýb. Takže to vyzerá ako zlý nápad. Prepáč. Jednoducho sa mi páčil stavový kód 418. Je to tak zábavné.

Nové Publikácie:

ODPORÚČANIE