La guida completa ai segnali tecnici che governano la canonicalizzazione, la paginazione, il targeting internazionale e la nuova ottimizzazione per i motori generativi (GEO / AI Search).
Il tag <link rel="canonical"> è un segnale che indica ai motori di ricerca qual è la versione ufficiale (canonica) di una pagina quando esistono più URL con contenuto identico o molto simile. Serve a consolidare i segnali di ranking (link, autorità, pertinenza) su un unico URL ed evitare i problemi di contenuto duplicato.
Si inserisce nel <head> della pagina e deve puntare sempre a un'URL assoluta:
<link rel="canonical" href="https://www.tuosito.it/pagina/" />
⚠️ A differenza del redirect 301, il canonical è un suggerimento, non un comando: Google lo considera insieme ad altri segnali e in alcuni casi può scegliere un canonico diverso da quello dichiarato.
https://, senza parametri di tracking, nella versione www/non-www scelta come canonica.rel="canonical" si annullano a vicenda e Google li ignora tutti.sitemap.xml.
I tag <link rel="next"> e <link rel="prev"> nascono per
segnalare ai motori di ricerca la relazione di sequenza tra le pagine di una serie paginata
(es. /blog/?page=1, /blog/?page=2, …) o tra le pagine di un articolo suddiviso.
<!-- Su /blog/page/2/ -->
<link rel="prev" href="https://www.tuosito.it/blog/page/1/" />
<link rel="next" href="https://www.tuosito.it/blog/page/3/" />
📌 Nota fondamentale: dal 2019 Google non usa più rel=next/prev
come segnale di indicizzazione. Continua però a essere utile per:
Poiché rel=next/prev non basta più, la gestione moderna della paginazione si fonda su questi principi:
rel=next/prev per gli altri motori e per la semantica: costa poco e non fa danni.L'attributo hreflang indica a Google la lingua e (facoltativamente) la regione di una pagina, permettendogli di servire all'utente la versione corretta in base alla sua lingua/paese. È essenziale per i siti multilingua o multi-paese.
<!-- Nel <head> di OGNI versione della pagina -->
<link rel="alternate" hreflang="it" href="https://www.tuosito.it/pagina/" />
<link rel="alternate" hreflang="en" href="https://www.tuosito.com/page/" />
<link rel="alternate" hreflang="en-US" href="https://www.tuosito.com/us/page/" />
<link rel="alternate" hreflang="x-default" href="https://www.tuosito.com/page/" />
Il valore segue lo standard ISO 639-1 per la lingua (es. it, en, de)
ed eventualmente ISO 3166-1 Alpha-2 per il paese (es. en-US, en-GB, pt-BR).
Hai tre metodi alternativi (scegline uno e sii coerente su tutto il sito):
<link rel="alternate" hreflang> nel <head>. Il più diffuso.xhtml:link, ideale per siti molto grandi perché centralizza tutto in un unico file.<!-- Variante in sitemap.xml -->
<url>
<loc>https://www.tuosito.it/pagina/</loc>
<xhtml:link rel="alternate" hreflang="it" href="https://www.tuosito.it/pagina/"/>
<xhtml:link rel="alternate" hreflang="en" href="https://www.tuosito.com/page/"/>
<xhtml:link rel="alternate" hreflang="x-default" href="https://www.tuosito.com/page/"/>
</url>
en-UK non esiste (è en-GB); la lingua va prima, il paese dopo.La GEO (Generative Engine Optimization) è l'insieme delle tecniche per rendere i contenuti facilmente compresi, estratti e citati dai motori generativi e dagli assistenti AI: Google AI Overviews, ChatGPT, Perplexity, Gemini, Copilot e gli agenti AI in generale.
A differenza della SEO classica — che punta al posizionamento di un link in SERP — la GEO punta a far sì che il tuo contenuto venga usato come fonte nella risposta sintetizzata dall'AI. Cambiano quindi i segnali da curare.
/llms.txt) che fornisce agli LLM una mappa curata dei contenuti più importanti in formato Markdown.
È l'equivalente del robots.txt ma pensato per i modelli linguistici.
<article>, <section>,
<main>, <header>, <nav> aiuta i parser AI a isolare il contenuto reale dal "rumore".
Article, FAQPage, HowTo,
Product, Organization: forniscono all'AI fatti espliciti e disambiguati.
robots.txt user-agent come
GPTBot, ClaudeBot, PerplexityBot, Google-Extended:
decidi se vuoi essere fonte di addestramento e/o di citazione.
# tuosito.it
> Agenzia SEO e Digital Marketing. Guide tecniche su SEO,
> redirect, canonicalizzazione e ottimizzazione per AI.
## Guide principali
- [Guida ai Redirect 301](https://www.tuosito.it/redirect-301.php): gestione reindirizzamenti
- [Robots.txt e Sitemap.xml](https://www.tuosito.it/robots-sitemap.php): controllo scansione
- [Canonical, Hreflang e GEO](https://www.tuosito.it/canonical-hreflang-geo.php): segnali tecnici
## Contatti
- [Chi siamo](https://www.tuosito.it/chi-siamo/)
- Email: info@tuosito.it
# Consenti la citazione, blocca eventualmente il training:
# OpenAI (ChatGPT)
User-agent: GPTBot
Allow: /
# Anthropic (Claude)
User-agent: ClaudeBot
Allow: /
# Perplexity
User-agent: PerplexityBot
Allow: /
# Controllo training dei contenuti per Google
User-agent: Google-Extended
Disallow: # vuoto = consenti; "/" = blocca il training
Sitemap: https://www.tuosito.it/sitemap.xml
⚠️ Bloccare i bot AI riduce la visibilità nelle risposte generative ma protegge i contenuti dall'uso in addestramento: è una scelta strategica, non solo tecnica.
La regola di coerenza: canonical, hreflang e sitemap devono raccontare la stessa storia. Quando questi segnali concordano, i motori di ricerca tradizionali e quelli generativi interpretano il sito correttamente; quando si contraddicono, perdi posizionamenti e citazioni.
rel=next/prev presenti per gli altri motori (opzionale ma consigliato)x-default dichiarato/llms.txt pubblicato e aggiornatorobots.txt