Соберите корректный файл robots.txt, чтобы задать краулерам Google, Bing и других систем, какие разделы сайта можно обходить и индексировать.
Правила обхода (User-agent: *)
Сгенерированный robots.txt
User-agent: * Allow: /
Готовые конфигурации под типичные задачи — можно скопировать и адаптировать под свой домен.
Открыто для всех ботов. Типичный вариант для публичных сайтов.
User-agent: * Allow: /
Публичный контент в обходе, служебные пути под запретом.
User-agent: * Disallow: /admin Disallow: /wp-admin Disallow: /private Sitemap: https://example.com/sitemap.xml
Поисковые боты ходят как обычно, обучение моделей — по отдельным user-agent.
User-agent: * Allow: / User-agent: GPTBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: Google-Extended Disallow: / User-agent: PerplexityBot Disallow: / User-agent: Bytespider Disallow: / User-agent: CCBot Disallow: /
Полностью приватный сайт — без обхода роботами.
User-agent: * Disallow: /
Файл robots.txt — простой текст в корне сайта по адресу ваш-домен.ru/robots.txt, в котором вы сообщаете ботам, какие URL можно обходить, а какие нет. Это общепринятый протокол (Robots Exclusion Protocol), который учитывают Google, Bing и другие системы.
robots.txt не заменяет безопасность: умышленный обход возможен. Но для технического SEO файл важен: так вы не расходуете краулинг на админку, дубли и служебные страницы и направляете поиск на полезный контент.
Коротко о robots.txt и директивах для краулеров.
Другие бесплатные утилиты из каталога.
Заголовок или фраза в чистый SEO-friendly slug: нижний регистр и дефисы.
Техника, on-page, контент и ссылки — по шагам без пропусков.
Как title и description выглядят в выдаче Google до публикации.
HTML: title, description, Open Graph и Twitter Card для страницы.
Остались вопросы?
Напишите нашей команде поддержки
SeoSync возьмёт на себя рутину с контентом и SEO — вам остаётся развивать продукт и идеи.
Начать бесплатно