John Mueller mal otázku položenú odborníkom v oblasti SEO počas segmentu otázok a odpovedí na stretnutí o pridávaní všetkých metaznačiek na stránku, aj keď sú stránky blokované súborom robots.txt.
Ich hlavná otázka znie: mali by na stránku pridať značku noindex, aj keď je stránka blokovaná súborom robots.txt a stránka má tiež kanonickú?
John odpovedá: Pravdepodobne nie. Vysvetlil, že ak je adresa URL zablokovaná súborom robots.txt, Google na stránke neuvidí žiadnu metaznačku.
Google na stránke neuvidí značku rel=canonical, pretože ak je blokovaná súborom robots.txt, Google túto stránku vôbec neprehľadá.
Ak chcete, aby Google bral do úvahy rel=canonical alebo noindex, ktoré pridáte na stránku, musíte sa uistiť, že Google dokáže indexovo prehľadávať samotnú stránku.
Ďalším aspektom je, že tieto stránky môžu byť často indexované, ak sú blokované súborom robots.txt, ale sú indexované bez akéhokoľvek obsahu, pretože Google ich nemôže indexovo prehľadávať.
A zvyčajne to znamená, že tieto stránky sa aj tak nezobrazia vo výsledkoch vyhľadávania. Ak teda niekto hľadá nejaký druh produktu, ktorý predávate na svojom webe, nebude sa hrabať a zisťovať, či existuje aj stránka, ktorá je blokovaná súborom robots.txt, čo by bolo relevantné, pretože už má naozaj dobré stránky z webovej lokality, ktoré môžu normálne indexovať a môžu zobrazovať.
Na druhej strane, ak vykonáte dotaz site:pre túto konkrétnu adresu URL, možno túto adresu URL stále uvidíte vo výsledkoch vyhľadávania, ale bez obsahu.
To sa deje približne v 44:23 vo videu.
John Mueller prepis stretnutia
Ján (Predložená otázka) 44:23
Máme problém s aktívami elektronického obchodu, filtrami, ktoré sa indexujú, aj keď sú blokované súborom robots.txt a majú kanonickú značku, ktorá ukazuje… Má zmysel pridávať aj značky noindex?
Ján (odpoveď) 44:38
Takže asi nie. Stručná odpoveď, myslím, je, že ak je adresa URL zablokovaná súborom robots.txt, potom na stránke nevidíme žiadne z týchto metaznačiek. Na stránke nevidíme rel=canonical, pretože túto stránku vôbec neprehľadávame. Ak teda chcete, aby sme brali do úvahy rel=canonical alebo noindex, ktorý vložíte na stránku, musíte sa uistiť, že to nemôžeme alebo že môžeme indexovo prehľadávať samotnú stránku.
Ďalším aspektom je, že tieto stránky môžu byť často indexované, ak sú blokované súborom robots.txt, ale sú indexované bez akéhokoľvek obsahu, pretože ich nemôžeme indexovo prehľadávať. A zvyčajne to znamená, že tieto stránky sa aj tak nezobrazia vo výsledkoch vyhľadávania. Ak teda niekto hľadá nejaký druh produktu, ktorý predávate na svojom webe, nebudeme sa hrabať a zisťovať, či existuje aj stránka, ktorá je blokovaná súborom robots.txt, čo by bolo relevantné, pretože už mať skutočne dobré stránky z vašej webovej lokality, ktoré môžeme normálne prehľadávať a indexovať a ktoré môžeme zobrazovať.
Na druhej strane, ak zadáte dotaz na stránku pre túto konkrétnu adresu URL, možno túto adresu URL stále uvidíte vo výsledkoch vyhľadávania bez obsahu. Takže veľakrát som si všimol, že ide skôr o teoretický problém ako o praktický problém. A že teoreticky môžu byť tieto adresy URL indexované bez obsahu, ale v praxi nespôsobia žiadne problémy pri vyhľadávaní. A ak ich vidíte, že sa zobrazujú pri praktických dopytoch na vašom webe, väčšinou je to skôr znak toho, že zvyšok vášho webu je naozaj ťažké pochopiť.
Takže ak niekto hľadá jeden z vašich typov produktov a my zobrazíme jednu z týchto robotizovaných stránok kategórie alebo aktív, z môjho pohľadu by to znamenalo, že viditeľný obsah na vašej webovej lokalite je nestačí na to, aby sme pochopili, že bežné stránky, ktoré ste mohli indexovať, sú tu skutočne relevantné.
Takže to by bol môj prvý krok k tomu, aby som sa pokúsil zistiť, či normálni používatelia vidia tieto stránky, keď normálne hľadajú? A ak ich nevidia, tak je to v poriadku. Môžete ich jednoducho ignorovať. Ak sa im tieto stránky zobrazia pri bežnom vyhľadávaní, znamená to, že by ste sa možno mali zamerať na iné veci na zvyšku svojho webu.