Crawlování

Crawlování - co to je? K čemu crawlování slouží? Kdy se vyplatí crawlovat? Jaké nástroje se na crawlování používají? Čtěte dál a dozvíte se víc!
3 min.
David Lefnar

Co to je?

Odborná definice

Crawlování (z anglického „crawling“) je automatizovaná činnost, při které vyhledávací robot (například Googlebot) systematicky navštěvuje jednotlivé stránky webu, stahuje jejich obsah, sleduje interní odkazy a vyhledává nové nebo aktualizované stránky. Získaná data jsou dále zpracovávána pro účely indexace a zobrazování výsledků ve vyhledávačích.

Definice pro běžného uživatele

Crawlování znamená, že robot vyhledávače (jako Google nebo Seznam) pravidelně navštěvuje váš web, prohlíží nové nebo změněné stránky a díky tomu rozhoduje, co se ukáže lidem ve vyhledávači.

Co ovlivňuje crawlování

Technické faktory

  • Robots.txt určuje, ke kterým částem webu mají roboti přístup. Nesprávně nastavený soubor může znemožnit procházení důležitých stránek.
  • Sitemap.xml slouží jako mapa webu a pomáhá robotům najít všechny důležité stránky.
  • Stavové kódy a přesměrování (například 200, 301, 404, 500) informují roboty, zda je stránka dostupná nebo byla přesunuta jinam.
  • Rychlost a dostupnost webu ovlivňuje, kolik stránek stihne robot projít.
  • Interní prolinkování a hloubka stránek – čím je stránka lépe dostupná z hlavní stránky, tím větší šance, že ji robot navštíví.
  • Duplicate content a canonical – duplicity robotům komplikují orientaci; pomocí atributu canonical lze určit hlavní verzi stránky.

Obsahové faktory

Dobře strukturovaný obsah pomáhá robotům snadněji porozumět struktuře webu a zařazovat stránky správně.

Externí faktory

Kvalitní zpětné odkazy mohou zvýšit četnost návštěv robotů. Naopak nízká důvěryhodnost domény nebo penalizace může crawlování omezit.

Kdy sledovat crawlování v SEO

Při vstupním SEO auditu

Je potřeba zkontrolovat, zda jsou všechny klíčové stránky přístupné pro roboty a jestli něco není omylem blokováno. Ověřuje se robots.txt, sitemap i vnitřní struktura webu.

Pravidelné kontroly

Web se vyvíjí, obsah přibývá nebo se mění. Pravidelné sledování crawlování pomáhá odhalit nové chyby, například chybné přesměrování, výpadky nebo nechtěně zablokované sekce.

Po technických změnách a přesunech v rámci webu

Po větších změnách (například při přesunech kategorií, změně URL, migraci na nový systém) je potřeba ověřit, že robot stále prochází všechny stránky správně a že nedošlo k omezení nebo přerušení crawlování.

David Lefnar

Více

Hreflang

Odborná definice Hreflang je HTML atribut, kterým označujeme jazykovou a geografickou verzi webové stránky. Umožňuje vyhledáva...

více

Kanonizace

Definice kanonizace jasně a stručně. Co je to kanonizace si řekneme odborným výkladem a taky formou, které porozumí běžný pozemšť...

více

Indexace

Co je to indexace? Jaké faktory ovlivňují indexaci? Jak a pomocí jakých nástrojů lze indexaci kontrolovat? To vše a trochu více s...

více
URL adresa

URL

Co si představit pod pojmem URL? Z čeho se URL skládá a jaké existují formy? Má smysl se zabývat tvarem URL adresy a je zapotřebí...

více
indexovatelnost

Indexovatelnost

Co je to indexovatelnost? Jaké faktory ovlivňují, jestli je stránka indexovatelná? Jakým způsobem indexovatelnost zkontrolovat? T...

více

Dejte spolupráci zelenou

DAVID LEFNAR

+420 731 420 523 david.lefnar@astrolimetka.cz

Astrolimetka

28. října 3346/91
702 00 Ostrava
IČ: 06141064

Napište nám