robot.txt в Друпал и СЕО

Опубликовано Ksenia-Polo - пт, 11/30/2018 - 10:03

За основу беру сам файл и статью о роботс для Друпал.

1)Так как все файлы хранятся по умолчанию в  sites/defaults/files, то при такой настройке робот их просто не проиндексирует. Поэтому нужно либо поменять путь к файлам на сайте на /admin/config/media/file-system,

либо убрать этот пункт из файла роботс (убрать Disallow: /sites/, либо тогда поменять путь к файлам).

2)Если настроен pathauto, можно закрыть все ноды Disallow: /node/

3)Убрать дубли и кириллицу Disallow: /*%

4)Убирает параметры, кроме пейджера:

Disallow: /*&
Disallow: /*?page=0
Allow: /*?page=
Disallow: /*?

В Яндексе раньше была важнее первая директива, теперь они учитывают длину урла директивы

5)

Практика:

Также сейчас вижу, что несмотря на наличие в роботс
Disallow: /user/register/
<img src="/sites/default/files/inline/images/2018-11-30_14-35-55.png" alt="" />

В поиске статистике обхода есть  /user/register?destination=node/57%23comment-form
<img src="/sites/default/files/inline/images/2018-11-30_14-37-36.png" alt="" />


 

То, что действительно нужно было добавить

User-agent: *

Sitemap: http://…./sitemap.xml
Disallow: /database/
Disallow: /updates/
Disallow: /logout/
Disallow: /top-rated-
Disallow: /messages/
Disallow: /your-votes
Disallow: /*/edit/
Disallow: /*/delete/
Disallow: /*/export/html/
Disallow: /taxonomy
Disallow: /*/edit$
Disallow: /*/outline$
Disallow: /*/revisions$
Disallow: /*/contact$
Disallow: /*downloadpipe
Disallow: /*&
Disallow: /*%
Disallow: /*?page=0
Allow: /*?page=
Disallow: /*?

Disallow: /node

Весь список:

User-agent: *

Sitemap: http://…./sitemap.xml
Disallow: /database/
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /sites/
Disallow: /themes/
Disallow: /scripts/
Disallow: /updates/
Disallow: /profiles/
Disallow: /xmlrpc.php
Disallow: /cron.php
Disallow: /update.php
Disallow: /install.php
Disallow: /index.php
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /logout/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
Disallow: /top-rated-
Disallow: /messages/
Disallow: /book/export/
Disallow: /files/pin/
Disallow: /your-votes
Disallow: /*/edit/
Disallow: /*/delete/
Disallow: /*/export/html/
Disallow: /taxonomy
Disallow: /*/edit$
Disallow: /*/outline$
Disallow: /*/revisions$
Disallow: /*/contact$
Disallow: /*downloadpipe
Disallow: /*&
Disallow: /*%
Disallow: /*?page=0
Allow: /*?page=
Disallow: /*?

Disallow: /node

Host: mysite.ru

Исключенные

Disallow: /contact/

Disallow: /user2userpoints/
Disallow: /myuserpoints/
Disallow: /tagadelic/
Disallow: /referral/
Disallow: /aggregator/

Disallow: /comments/recent

Disallow: /node$
Disallow: /node/*/track$

(вместо них Disallow: /node)

Об оптимизации.