🤖 LLMS.txt, AI crawlery a budoucnost dohledatelnosti: jak správně otevřít (nebo zavřít) e-shop moderním AI nástrojům?

23.11.2025

Digitální svět se během dvou let změnil víc než za celou dekádu předtím. Ještě v roce 2022 jsme řešili primárně SEO pro Google a Seznam, strukturu webu, obsah, zpětné odkazy a technickou základnu, která zajistí dobré pozice ve vyhledávačích.

Rok 2025 je ale v úplně jiné realitě. Do hry vstoupily velké jazykové modely (LLM) a AI asistenti, kteří analyzují weby po svém – ne jen jako klasický crawler, ale jako systém, který se snaží porozumět vztahům, entitám, obchodním kategoriím a celkovému významu webu. A právě proto se objevuje koncept llms.txt, nový způsob, jak AI říct, co smí a nesmí vidět.

Tento článek ti podrobně vysvětlí, jak s llms.txt pracovat i na platformách, které jej nativně nepodporují, jak upravit robots.txt tak, aby dával AI maximální signály, a také proč je v roce 2025 klíčové být dohledatelný nejen ve vyhledávačích, ale i v AI asistentech. Povíme si také, jak AI crawlery úplně zablokovat, pokud chceš obsah chránit, a ukážeme si konkrétní příklady pravidel, která dávají smysl v praxi.

seo-ai-llms-txt

🔍 Proč je v roce 2025 důležité být dohledatelný pro AI modely

Ještě před několika lety měl e-shop ambici být vidět v organice Google, Seznamu a na srovnávačích typu Heureka. V roce 2025 ale zákazník často začíná svou cestu úplně jinde – ptá se ChatGPT, Perplexity, Googlu s AI Overviews nebo hlasových asistentů postavených na LLM. Pokud tvůj web AI nenajde, nečte nebo není schopná pochopit jeho strukturu, staneš se pro tuto vrstvu internetu neviditelný. A AI začne doporučovat někoho jiného – typicky konkurenci.

Moderní AI modely nejsou klasické vyhledávače. Nehledají jen klíčová slova, ale snaží se pochopit význam tvého webu.

popisy kategorií
parametry produktů a variant
strukturu webu a interní prolinkování
informace o značce a o tom, pro koho prodáváš
články, poradny a FAQ

Čím víc toho model přečte, tím lépe chápe, čím se zabýváš, komu prodáváš a co přesně nabízíš. Teprve tehdy má důvod tvůj web zahrnout do svých odpovědí. Proto je tak důležité dát AI nástrojům jasné povolení – a právě k tomu slouží llms.txt.

Co je llms.txt a proč vznikl

Soubor llms.txt je něco jako „mladší sourozenec“ robots.txt. Zatímco robots.txt řídí chování klasických crawlerů (Googlebot, SeznamBot, Bingbot), llms.txt je navržený pro AI modely. Umožní ti říct například:

co mohou AI modely číst
co nesmí použít pro trénink
které části webu mají ignorovat
zda smí obsah použít ve svých odpovědích
nebo zda jim přístup úplně zakazuješ

Výhoda je v tom, že AI modely se řídí více zdroji instrukcí. Pokud llms.txt neexistuje, hledají robots.txt, meta tagy nebo jiné signály.

To znamená, že i weby, které llms.txt neumí nahrát (typicky Shoptet a jiné SaaS platformy), s tím stále mohou efektivně pracovat pomocí kombinace robots.txt a HTML hlavičky.

⚙️ Jak AI modely čtou web, když nemáš llms.txt

Pokud llms.txt nenajdou v kořeni domény, přejdou AI modely automaticky na další zdroje:

robots.txt – základní instrukce, které respektuje téměř každý model
hlavičkové meta tagy – doplňkový signál „allow / disallow“
XML sitemapy – logická struktura webu
interní prolinkování – pochopení vztahů mezi stránkami
samotný obsah – texty, názvy, parametry, články

To znamená, že i když llms.txt fyzicky mít nebudeš, můžeš AI modelům dát velmi přesnou instrukci jen pomocí správně napsaného robots.txt. A to je přesně to, co dává největší smysl u většiny e-shopů, které běží na krabicovém řešení.

Jak správně povolit AI modelům přístup k celému webu

Základem je robots.txt, který kombinuje dvě části:

• blokace systémových částí e-shopu (administrace, košík, přihlášení, filtry, technické parametry)
• povolení chytrým AI robotům, aby mohli e-shop přečíst téměř celý

Výsledkem je robots.txt, který je bezpečný pro SEO a zároveň otevřený pro moderní AI.

✅ Ukázka plně otevřeného přístupu pro AI

User-agent: GPTBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: GoogleOther
Allow: /

User-agent: Anthropic-AI
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: CCBot
Allow: /

Toto je úplně nejjednodušší forma, která jasně říká: „AI modely, vítejte. Jste vítané a máte přístup k celému webu.“ Typicky ji doplňuješ o obecný blok User-agent: * s Disallow jen pro citlivé části (admin, košík, filtry).

🛡️ Jak přístup AI modelům naopak zakázat

Ne každý chce, aby AI četla obsah webu. Typicky jde o weby s uzamčeným placeným obsahem, členskými sekcemi, unikátním know-how nebo médii, která si chrání články. Pro takové situace existuje jednoduchý zákaz:

User-agent: GPTBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: Anthropic-AI
Disallow: /

User-agent: PerplexityBot
Disallow: /

Tady říkáš: „AI modely, nelezte sem.“ Obsah zůstává mimo rozsah jejich crawlování a nebude zahrnut do tréninku ani do odpovědí.

Chceš-li to skutečně totální, můžeš přidat ještě:

User-agent: *
Disallow: /

To už ale uzavře web úplně všem robotům – tedy i Googlu, Seznamu a dalším vyhledávačům, což ve většině případů nedává smysl. Proto je lepší blokovat selektivně jen konkrétní AI boty nebo citlivé sekce.

Kombinace reálných blokací a otevření AI modelům

Na běžném e-shopu používáš Disallow pro části, které nikdy nemají být indexované:

• administrace
• košík a objednávkový proces
• přihlášení, registrace, zapomenuté heslo
• technické skripty a API
• přefiltrované URL a dočasné parametry

Ukázkový blok může vypadat například takto:

User-agent: *
Disallow: /admin/
Disallow: /api/
Disallow: /script/
Disallow: /kosik/
Disallow: /login/
Disallow: /registrace/
Disallow: /*?priceMax=
Disallow: /*?parameterId=

A až poté následuje sekce přístupu pro konkrétní AI modely:

User-agent: GPTBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: PerplexityBot
Allow: /

Tahle kombinace dává maximální smysl: věci, které nemají být indexované, zůstávají zavřené, zatímco veškerý běžný obsah webu mají AI modely otevřený. Tím získáš výhodu v dohledatelnosti bez toho, aby ses vystavoval zbytečným rizikům.

Jak vypnout trénování, ale povolit čtení

Některé weby chtějí, aby AI jejich obsah četla kvůli dohledatelnosti, ale nesmí jej použít pro trénink modelu. Tuto jemnější formu kontroly je možné vyjádřit například takto:

User-agent: GPTBot
Allow: /
NoTrain: /

User-agent: Google-Extended
Allow: /
NoTrain: /

Tím říkáš: „Můžeš použít obsah pro odpovědi, ale ne pro trénink modelu.“ Standard kolem direktivy NoTrain se stále vyvíjí, ale velcí hráči jako OpenAI a Google ji postupně začínají brát v potaz.

Meta tagy jako doplňkový signál

Kromě robots.txt můžeš AI modelům posílat signály i přes HTML hlavičku. Do <head> lze vložit například:

<meta name="ai-access" content="allow">
<meta name="llm-crawl" content="allow">
<meta name="llm-use" content="allow">

Tyto značky fungují jako doplňkové sémantické povolení. Pokud crawler najde povolení v robots.txt i v meta tagách, vnímá web s vyšší důvěrou a má tendenci načíst z něj větší množství dat. Je to podobný princip jako kombinace robots.txt a meta robots tagu v SEO.

📂 Co dělat, pokud chceš vytvořit skutečný llms.txt

Pokud běžíš celý web na uzavřeném řešení bez přístupu k souborům v rootu, llms.txt do kořene domény nedostaneš. Ale pokud máš root domény pod vlastní správou (například WordPress na hlavní doméně a e-shop na subdoméně), můžeš do rootu vložit jednoduchý llms.txt s obsahem:

User-agent: *
Allow: /

Tím dáš AI crawlerům naprosto explicitní globální povolení. Robots.txt a meta tagy na subdoménách pak mohou chování dále zpřesňovat (například omezit konkrétní sekce).

🚀 Proč to celé dává smysl už dnes, ne až „někdy“

Vyhledávání se mění před očima. Google AI Overviews dnes běžně doporučuje konkrétní e-shopy, které mají kvalitní informace a jsou dobře pochopené modelem. Perplexity dokáže generovat odchozí návštěvnost podobně jako klasický vyhledávač. ChatGPT umí uvádět konkrétní značky a e-shopy jako zdroje doporučení.

Tohle je nová organika. A o tom, jestli v ní budeš vidět, nebo ne, rozhoduje mimo jiné i to, jestli AI modelům otevřeš dveře – nebo je necháš stát venku. Je to podobný přelom, jako byl přechod z desktopu na mobilní zařízení. Kdo tehdy ignoroval mobilní optimalizaci, postupně ztrácel viditelnost. Kdo ignoruje AI dnes, riskuje totéž, jen v mnohem rychlejším tempu.

Další zdroje ke čtení: https://tomaszahalka.cz/jak-na-llms-txt-a-ai-pristup/

Tomáš Zahálka - SEO & PPC Specialista

O autorovi článku: Marketingový specialista zaměřený na SEO a PPC reklamu pro Shoptet e-shopy, investor, bloger seriálu Jak se staví e-shop Dudlu a cestovatel, který spojuje marketing s poznáváním zemí jako Írán, USA, Sýrie, Japonsko, Afghánistán, Island, Mauretánie a Zéland.

Kontaktovat autora

⏫ Potřebujete zlepšit pozice v SEO a hledáte zpětné odkazy? Spojte síly s Dudlu! ⏫

Další článek

Diskuze (0)

Buďte první, kdo napíše příspěvek k této položce.

Přidat komentář

🤖 LLMS.txt, AI crawlery a budoucnost dohledatelnosti: jak správně otevřít (nebo zavřít) e-shop moderním AI nástrojům?

🔍 Proč je v roce 2025 důležité být dohledatelný pro AI modely

Co je llms.txt a proč vznikl

⚙️ Jak AI modely čtou web, když nemáš llms.txt

Jak správně povolit AI modelům přístup k celému webu

✅ Ukázka plně otevřeného přístupu pro AI

🛡️ Jak přístup AI modelům naopak zakázat

Kombinace reálných blokací a otevření AI modelům

Jak vypnout trénování, ale povolit čtení

Meta tagy jako doplňkový signál

📂 Co dělat, pokud chceš vytvořit skutečný llms.txt

🚀 Proč to celé dává smysl už dnes, ne až „někdy“

Tomáš Zahálka - SEO & PPC Specialista

⏫ Potřebujete zlepšit pozice v SEO a hledáte zpětné odkazy? Spojte síly s Dudlu! ⏫

Diskuze (0)

Informace

Pro maminky a tatínky

Kontakt

Oblíbené kategorie

Dětské
oblečení

Kojenecké
potřeby

Spánek pro
mimina

Dětský
pokojíček

Hračky pro
miminka

Auta, lodě,
vláčky

Panenky a
doplňky

Plyšáci

Doplňky
do kuchyně

Doplňky
do koupelny

Doplňky
do ložnice

Doplňky
do bytu