Що таке robots.txt?

Що таке robots.txt? Повне пояснення для початківців

У цій статті ви дізнаєтесь, що таке robots.txt, як він працює і як правильно його налаштувати для SEO.

Що таке robots.txt простими словами

robots.txt — це файл, який вказує пошуковим роботам, які сторінки сайту можна сканувати, а які — ні.

Простіше кажучи:

robots.txt — це “інструкція” для Google, що йому можна переглядати на сайті.

Де знаходиться robots.txt

Файл завжди доступний за адресою:

https://yourdomain.com/robots.txt

Наприклад:

https://example.com/robots.txt

Як працює robots.txt

Коли пошуковий бот заходить на сайт, він:

  1. відкриває файл robots.txt
  2. читає правила
  3. вирішує, які сторінки сканувати

Основні команди robots.txt

User-agent

Вказує, для якого бота правило

User-agent: *

означає всі пошукові системи

Disallow

Забороняє сканування

Disallow: /admin/

Allow

Дозволяє доступ

Allow: /blog/

Sitemap

Вказує на карту сайту

Sitemap: https://example.com/sitemap.xml

Простий приклад robots.txt

User-agent: *
Disallow: /admin/
Disallow: /login/
Allow: /
Sitemap: https://example.com/sitemap.xml

Для чого потрібен robots.txt

Файл допомагає:

  • закривати службові сторінки
  • економити crawl budget
  • керувати індексацією

Важливо: robots.txt не забороняє індексацію

Це критичний момент.

robots.txt:

  • забороняє сканування
  • але не гарантує, що сторінка не потрапить в індекс

Для цього використовують meta noindex.

Коли потрібно використовувати robots.txt

Закривайте:

  • адмін-панель
  • сторінки логіну
  • технічні сторінки
  • фільтри інтернет-магазину

Типові помилки

1. Закритий весь сайт

User-agent: *
Disallow: /

Це блокує весь сайт

2. Закриття важливих сторінок

Наприклад:

  • категорій
  • товарів
  • статей

3. Відсутність sitemap

Це ускладнює індексацію

robots.txt і SEO

robots.txt напряму впливає на:

  • індексацію
  • crawl budget
  • швидкість появи сторінок у Google

Як перевірити robots.txt

Використовуйте:

Як robots.txt пов’язаний з іншими SEO елементами

robots.txt працює разом з:

  • файлом sitemap.xml
  • внутрішньою перелінковкою
  • технічною оптимізацією

Якщо ти ще не читав:

обов’язково переглянь їх для повного розуміння.

Що читати далі

Висновок

robots.txt — це базовий інструмент Technical SEO.

Він допомагає керувати тим, як Google бачить ваш сайт.
Але використовувати його потрібно обережно.