WordPress è uno dei CMS più utilizzati al mondo. Avere un file robots.txt
ottimizzato per WordPress può aiutarti a migliorare l'indicizzazione del tuo sito da parte dei motori di ricerca, prevenendo allo stesso tempo l'indicizzazione di pagine e risorse non necessarie.
1. Cos'è il file robots.txt
?
Il file robots.txt
fornisce istruzioni ai motori di ricerca su quali pagine o file del tuo sito possono o non possono essere richiesti. Si trova alla radice del sito, per esempio: https://www.tuosito.com/robots.txt
.
2. Creare un robots.txt
per WordPress
Se non hai ancora un file robots.txt
, puoi crearne uno manualmente. Basta creare un nuovo file di testo e rinominarlo come "robots.txt".
3. Configurazione di Base
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Spiegazione:
User-agent: *
: Questa direttiva si rivolge a tutti i motori di ricerca.Disallow: /wp-admin/
: Impedisce ai motori di ricerca di accedere alla dashboard di WordPress.Allow: /wp-admin/admin-ajax.php
: Molte funzioni di WordPress e dei plugin fanno affidamento suadmin-ajax.php
per funzionare correttamente, quindi è importante permetterne l'accesso.
4. Altre Direttive Utili
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-content/plugins/
Disallow: /readme.html
Spiegazione:
- Blocco di accesso alle pagine di login e registrazione.
- Blocco di accesso ai file dei plugin.
- Blocco del file
readme.html
per evitare l'esposizione di informazioni sulla versione di WordPress.
5. Sitemap
Per aiutare i motori di ricerca a trovare e indicizzare il tuo contenuto più rapidamente, puoi indicare la posizione della tua sitemap nel robots.txt
.
Sitemap: https://www.tuosito.com/sitemap.xml
Molte estensioni SEO per WordPress, come Yoast o All in One SEO, generano automaticamente una sitemap per te. Assicurati di sostituire "www.tuosito.com" con l'URL reale del tuo sito.
6. Verifica e Test
Dopo aver configurato il tuo robots.txt
, utilizza lo strumento di test del file robots.txt nella Google Search Console per assicurarti che tutto funzioni come previsto.
7. Caricamento del robots.txt
Una volta che hai il tuo file robots.txt
pronto, caricalo nella directory principale del tuo sito web usando un client FTP o attraverso il file manager del tuo hosting.
Nota finale: La configurazione del robots.txt
può variare in base alle esigenze specifiche del tuo sito. Se hai funzionalità personalizzate o plugin che richiedono accesso da parte dei motori di ricerca, potresti dover modificare le regole di conseguenza. È sempre una buona pratica testare frequentemente e monitorare il comportamento dei motori di ricerca sul tuo sito per assicurarti che tutto funzioni correttamente.
Ecco il mio file Robots che usiamo per i siti web che gestisco:
# Regole generali per tutti i motori di ricerca
User-agent: *
# Blocco della dashboard e dei file core di WordPress
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
# Blocco dei plugin, dei temi, degli aggiornamenti e delle directory di backup
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-content/backups/
Disallow: /wp-content/upgrade/
# Blocco dei file di sistema e delle risorse non essenziali
Disallow: /readme.html
Disallow: /license.txt
Disallow: /xmlrpc.php
Disallow: /wp-config.php
Disallow: /wp-includes/
Disallow: /cgi-bin/
# Blocco dei percorsi e delle funzionalità specifiche
Disallow: /trackback/
Disallow: /comment-page-
Disallow: /comments/
Disallow: /*?*
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /20*/
Disallow: /author/
Disallow: /*/embed/
Disallow: /*/feed/
# Paginazione, allegati e immagini
Disallow: /page/
Disallow: /attachment/
# Indicazione della sitemap
Sitemap: https://www.tuosito.com/sitemap.xml
# Per tutti i crawler
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-content/backups/
Disallow: /wp-content/upgrade/
Disallow: /readme.html
Disallow: /license.txt
Disallow: /xmlrpc.php
Disallow: /wp-config.php
Disallow: /wp-includes/
Disallow: /cgi-bin/
Disallow: /trackback/
Disallow: /comment-page-
Disallow: /*?*
Disallow: /*.php$
Disallow: /20*/
Disallow: /*/embed/
Disallow: /*/feed/
Disallow: /page/
Disallow: /attachment/
# Consentire ai principali motori di ricerca
User-agent: Googlebot
Allow: /
User-agent: Bingbot
Allow: /
User-agent: Slurp
Allow: /
User-agent: DuckDuckBot
Allow: /
User-agent: Baiduspider
Allow: /
User-agent: Yandex
Allow: /
# Blocco di bot noti per essere dannosi o sospetti
User-agent: SemrushBot
Disallow: /
User-agent: AhrefsBot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: Uptimebot
Disallow: /
User-agent: rogerbot
Disallow: /