Co to jest plik robots.txt?

Robots.txt to prosty plik tekstowy umieszczany w głównym katalogu strony, który informuje roboty wyszukiwarek, które zasoby mogą być indeksowane, a które należy pominąć. To podstawowe narzędzie technicznego SEO pozwalające kontrolować widoczność strony w wynikach wyszukiwania.

Do czego służy plik robots.txt w sklepie internetowym?

Plik pozwala zablokować indeksowanie panelu logowania, koszyka, filtrowania i historii zamówień oraz chronić powielające się adresy URL. Pomaga też skierować roboty do właściwej mapy strony i zapobiega marnowaniu budżetu indeksowania.

Jakie dyrektywy zawiera plik robots.txt?

Plik składa się z dyrektyw User-agent, która określa robota, oraz Disallow blokującej dostęp do ścieżki. Dostępne są także Allow umożliwiająca dostęp w precyzyjnych konfiguracjach oraz Sitemap, która podaje lokalizację mapy strony.

Jak wygląda przykładowy robots.txt dla PrestaShop?

Bezpieczna wersja dla PrestaShop blokuje katalogi techniczne, takie jak /app/, /config/, /modules/ czy /admin*/, a także ścieżki /cart, /order, /login i /search. Warto też zablokować adresy z parametrami sortowania oraz wskazać lokalizację sitemap.xml.

Czy zablokowanie strony w robots.txt usuwa ją z Google?

Nie, zablokowanie w robots.txt nie oznacza, że strona nie pojawi się w wynikach Google. Może zostać zindeksowana, ale bez treści. Aby całkowicie wykluczyć stronę z indeksu, lepiej użyć tagu noindex, który zadziała tylko przy dostępie robota do strony.

Czego nie robić w pliku robots.txt?

Nie należy przypadkowo blokować dostępu do całej strony dyrektywą Disallow ukośnik ani blokować zasobów CSS i JS, których Google potrzebuje do oceny wyglądu strony. Błędem jest też brak mapy strony oraz blokowanie adresów oznaczonych tagiem noindex.

Czym jest crawl budget i jak robots.txt na niego wpływa?

Crawl budget to budżet indeksowania, czyli zasoby, jakie wyszukiwarka przeznacza na przeglądanie witryny. Robots.txt pozwala go oszczędzać, kierując roboty z dala od folderów technicznych i powielonych adresów w stronę wartościowych treści.

Do czego robots.txt nadaje się najlepiej pod kątem SEO?

Robots.txt warto używać głównie do ograniczania dostępu do folderów technicznych i powielonych adresów z parametrami, a nie do blokowania cennych treści. Do wykluczania stron z indeksu lepiej służy tag noindex w kodzie HTML.

Plik robots.txt – co to jest, jak działa i jak ustawić go w sklepie PrestaShop?

Bezpłatna konsultacja

Spis treści

Co to jest robots.txt?
Do czego służy plik robots.txt?
Przykład pliku robots.txt dla sklepu PrestaShop
Robots.txt a indeksowanie i SEO
Jak edytować plik robots.txt w PrestaShop?
Czego nie robić w robots.txt?

Poznaj sellbox

Sellbox to kompletny system sprzedażowy oparty na PrestaShop 9, który gwarantuje błyskawiczny start.

Zobacz więcej

Z artykułu dowiesz się

Czym jest plik robots.txt, gdzie się go umieszcza i jak roboty wyszukiwarek odczytują go jako pierwszą instrukcję decydującą o indeksowaniu witryny.
Jak działają kluczowe dyrektywy User-agent, Disallow, Allow i Sitemap oraz do czego służą w kontroli crawl budgetu i struktury sklepu.
Gotowy, zoptymalizowany przykład pliku robots.txt dla standardowej instalacji PrestaShop, blokujący katalogi techniczne, koszyk, logowanie i adresy z parametrami sortowania.
Dlaczego blokada w robots.txt nie usuwa strony z Google i kiedy zamiast niej trzeba użyć tagu noindex, by całkowicie wykluczyć podstronę z indeksu.
Jak edytować plik w PrestaShop, generując go automatycznie w Preferencje > SEO i URL lub przez FTP, i jak zweryfikować poprawność w Google Search Console.
Których błędów unikać: całkowitej blokady Disallow: /, blokowania zasobów CSS i JS potrzebnych Google oraz braku mapy strony w pliku.

Plik robots.txt to prosty plik tekstowy umieszczany w głównym katalogu strony internetowej, który informuje roboty wyszukiwarek (np. Googlebot), które zasoby serwisu mogą być indeksowane, a które powinny zostać pominięte. To jedno z podstawowych narzędzi technicznego SEO, które pozwala kontrolować widoczność strony w wynikach wyszukiwania.

W sklepie internetowym, np. opartym na PrestaShop, prawidłowa konfiguracja pliku robots.txt ma kluczowe znaczenie – chroni przed indeksowaniem niepotrzebnych podstron (np. filtrowania, koszyka, logowania), wspiera crawl budget i pomaga unikać duplikacji treści.

Co to jest robots.txt?

Robots.txt to plik, który roboty wyszukiwarek odczytują jako pierwszą instrukcję po wejściu na stronę. Na jego podstawie decydują, które zasoby witryny analizować i indeksować, a które pomijać.

Przykładowy adres pliku:

https://twojsklep.pl/robots.txt

Plik ten składa się z dyrektyw takich jak:

User-agent: – określa, do którego robota odnosi się reguła (np. Googlebot, * dla wszystkich),
Disallow: – blokuje dostęp do określonej ścieżki lub katalogu,
Allow: – umożliwia dostęp (opcjonalne w bardziej precyzyjnych konfiguracjach),
Sitemap: – podaje lokalizację mapy strony (sitemap.xml).

Do czego służy plik robots.txt?

W praktyce plik robots.txt pozwala:

zablokować indeksowanie panelu logowania, koszyka, filtrowania, historii zamówień,
ochronić powielające się lub techniczne adresy URL (np. z parametrami),
skierować roboty do odpowiedniej mapy strony,
zapobiec marnowaniu budżetu indeksowania (crawl budget),
zwiększyć kontrolę nad strukturą i hierarchią witryny.

Przykład pliku robots.txt dla sklepu PrestaShop

Poniżej znajdziesz bezpieczną, zoptymalizowaną wersję pliku robots.txt dla standardowej instalacji PrestaShop:

User-agent: *
Disallow: /app/
Disallow: /bin/
Disallow: /config/
Disallow: /download/
Disallow: /mails/
Disallow: /modules/
Disallow: /translations/
Disallow: /var/
Disallow: /vendor/
Disallow: /cache/
Disallow: /classes/
Disallow: /controllers/
Disallow: /docs/
Disallow: /install/
Disallow: /admin*/  
Disallow: /login
Disallow: /cart
Disallow: /order
Disallow: /search
Disallow: /password-recovery
Disallow: /*?orderby=
Disallow: /*?orderway=
Disallow: /*?tag=
Disallow: /*?id_currency=
Disallow: /*?search_query=
Disallow: /*controller=*

Sitemap: https://twojsklep.pl/sitemap.xml

Uwaga: Ścieżki mogą się różnić w zależności od wersji PrestaShop i struktury Twojego sklepu. Zawsze wykonaj test indeksowania po każdej zmianie.

Robots.txt a indeksowanie i SEO

Wbrew pozorom zablokowanie strony w robots.txt nie oznacza, że nie pojawi się ona w wynikach Google – może być zindeksowana, ale bez treści. Jeśli chcesz całkowicie wykluczyć stronę z indeksu, lepiej użyć tagu noindex w kodzie HTML (który zadziała tylko, jeśli robot ma dostęp do strony).

Dlatego używaj robots.txt głównie do ograniczania dostępu do folderów technicznych i powielonych adresów, a nie do blokowania cennych treści.

Jak edytować plik robots.txt w PrestaShop?

Otrzymaj bezpłatną konsultację Twoich wyzwań

W PrestaShop plik robots.txt można:

wygenerować automatycznie z poziomu zaplecza:
Preferencje > SEO i URL > Generuj plik robots.txt
ręcznie edytować przez FTP lub menedżer plików (np. public_html/robots.txt),
uzupełniać niestandardowe wpisy o wykluczenia dynamiczne (np. filtry, parametry).

Po zmianach warto sprawdzić poprawność pliku za pomocą:

Google Search Console > Test pliku robots.txt

Czego nie robić w robots.txt?

Najczęstsze błędy:

całkowite zablokowanie dostępu do strony (Disallow: /) – np. przez przypadek,
blokowanie zasobów CSS i JS – Google potrzebuje ich do oceny wyglądu strony,
brak mapy strony w pliku,
niepotrzebne blokowanie adresów z tagiem noindex, co uniemożliwia jego działanie,
niezachowanie spójności pliku robots.txt po aktualizacji PrestaShop.

FAQ

Co to jest plik robots.txt?

Robots.txt to prosty plik tekstowy umieszczany w głównym katalogu strony, który informuje roboty wyszukiwarek, które zasoby mogą być indeksowane, a które należy pominąć. To podstawowe narzędzie technicznego SEO pozwalające kontrolować widoczność strony w wynikach wyszukiwania.
Do czego służy plik robots.txt w sklepie internetowym?

Plik pozwala zablokować indeksowanie panelu logowania, koszyka, filtrowania i historii zamówień oraz chronić powielające się adresy URL. Pomaga też skierować roboty do właściwej mapy strony i zapobiega marnowaniu budżetu indeksowania.
Jakie dyrektywy zawiera plik robots.txt?

Plik składa się z dyrektyw User-agent, która określa robota, oraz Disallow blokującej dostęp do ścieżki. Dostępne są także Allow umożliwiająca dostęp w precyzyjnych konfiguracjach oraz Sitemap, która podaje lokalizację mapy strony.
Jak wygląda przykładowy robots.txt dla PrestaShop?

Bezpieczna wersja dla PrestaShop blokuje katalogi techniczne, takie jak /app/, /config/, /modules/ czy /admin*/, a także ścieżki /cart, /order, /login i /search. Warto też zablokować adresy z parametrami sortowania oraz wskazać lokalizację sitemap.xml.
Czy zablokowanie strony w robots.txt usuwa ją z Google?

Nie, zablokowanie w robots.txt nie oznacza, że strona nie pojawi się w wynikach Google. Może zostać zindeksowana, ale bez treści. Aby całkowicie wykluczyć stronę z indeksu, lepiej użyć tagu noindex, który zadziała tylko przy dostępie robota do strony.
Jak edytować plik robots.txt w PrestaShop?

W PrestaShop plik można wygenerować automatycznie z zaplecza w sekcji Preferencje, SEO i URL, korzystając z opcji generowania pliku robots.txt. Można go też edytować ręcznie przez FTP lub menedżer plików i uzupełniać o niestandardowe wykluczenia.
Jak sprawdzić poprawność pliku robots.txt?

Po każdej zmianie warto zweryfikować plik za pomocą testu w Google Search Console. Ścieżki mogą się różnić w zależności od wersji PrestaShop i struktury sklepu, dlatego test indeksowania po zmianach jest niezbędny.
Czego nie robić w pliku robots.txt?

Nie należy przypadkowo blokować dostępu do całej strony dyrektywą Disallow ukośnik ani blokować zasobów CSS i JS, których Google potrzebuje do oceny wyglądu strony. Błędem jest też brak mapy strony oraz blokowanie adresów oznaczonych tagiem noindex.
Czym jest crawl budget i jak robots.txt na niego wpływa?

Crawl budget to budżet indeksowania, czyli zasoby, jakie wyszukiwarka przeznacza na przeglądanie witryny. Robots.txt pozwala go oszczędzać, kierując roboty z dala od folderów technicznych i powielonych adresów w stronę wartościowych treści.
Do czego robots.txt nadaje się najlepiej pod kątem SEO?

Robots.txt warto używać głównie do ograniczania dostępu do folderów technicznych i powielonych adresów z parametrami, a nie do blokowania cennych treści. Do wykluczania stron z indeksu lepiej służy tag noindex w kodzie HTML.

Czytaj dalej

Agnieszka Rydwan

Blog

10 przyszłych trendów w e-commerce

10 przyszłych trendów w e-commerce, które zmienią handel online. Poznaj kierunki rozwoju sprzedaży i przygotuj sklep na to, co przyniesie rynek.

Dagmara Sagan

Blog

Agencja e-commerce - jak ją wybrać?

Agencja e-commerce – jak ją wybrać, by nie przepalić budżetu? Poznaj kryteria, kompetencje i pytania, które pomogą znaleźć partnera do rozwoju sklepu.

Design System w Sellbox. Jak pogodzić gotowe rozwiązanie z unikalnym brandem? UX/UI bez kompromisów.

Tomasz Moras

Blog

Design System w Sellbox. Jak pogodzić gotowe rozwiązanie z unikalnym brandem? UX/UI bez kompromisów.

Design System w Sellbox – zobacz, jak połączyć gotowe rozwiązanie z unikalnym brandem i zadbać o spójny UX/UI sklepu PrestaShop bez kompromisów wizualnych.

Dobra agencja PrestaShop? Jak wybrać? Kompleksowy przewodnik przed wdrożeniem

Daniel Tomaszewski

Blog

Dobra agencja PrestaShop? Jak wybrać? Kompleksowy przewodnik przed wdrożeniem

Jak wybrać dobrą agencję PrestaShop przed wdrożeniem? Kompleksowy przewodnik po kryteriach, kompetencjach i pytaniach, które chronią budżet Twojego sklepu.

Budowa i wdrożenie konfiguratora produktów w e-commerce – co musisz wiedzieć?

Dagmara Sagan

Blog

Budowa i wdrożenie konfiguratora produktów w e-commerce – co musisz wiedzieć?

Konfigurator produktów w e-commerce – poznaj zasady budowy i wdrożenia. Dowiedz się, co musisz wiedzieć, by narzędzie realnie napędzało sprzedaż w sklepie.

Plik robots.txt – co to jest, jak działa i jak ustawić go w sklepie PrestaShop?

Daniel Tomaszewski

Baza wiedzy

Blog

Plik robots.txt – co to jest, jak działa i jak ustawić go w sklepie PrestaShop?

Plik robots.txt – poznaj, czym jest, jak działa i jak poprawnie skonfigurować go w sklepie PrestaShop, by kontrolować indeksowanie i chronić zasoby sklepu.