Le keyword sono ancora il cuore della SEO. Ma, tra i fattori che Google considera per indicizzare e posizionare i documenti web, il loro peso è diminuito. Vediamo perché.

Una buona keyword strategy è vitale in ambito SEO. Questo lo sanno anche i bambini. Ed è qualcosa che resta profondamente vero, nonostante i tanti cambiamenti degli ultimi anni. Ancora oggi Google lavora, prima di tutto, sul match fra chiavi di ricerca impostate dall’utente – singole parole o frasi – e contenuto del nostro documento. Il peso delle keyword è diminuito, ma resta rilevante. Soprattutto è cambiato l’approccio del set dell’algoritmo di Google, che valorizza raggruppamenti sempre più ampi di termini, per tentare di ricostruire il significato complessivo di un documento (naturalmente quando diciamo che “Google tenta di ricostruire il significato di un documento”, l’espressione va intesa in senso metaforico).

Questo significa che non basta impostare una buona strategia di keyword a livello di metadati (titolo, descrizione, intestazioni). È sempre più importante che il testo nel suo complesso renda evidente ciò che intendiamo dire. Dobbiamo disseminarlo di spie semantiche, con un certo livello di ridondanza. Servono ripetizioni, varianti morfologiche dello stesso termine, sinonimi, parafrasi: il testo deve diventare un campo di rimandi incrociati. La sua lunghezza conta non in quanto tale, ma perché permette di rendere tale campo più solido e riconoscibile. Un testo lungo non è necessariamente un testo interessante e ricco di spunti. Tuttavia la lunghezza – se organizzata – aiuta Google a classificare i nostri contenuti.

RankBrain, oltre la coda lunga

Ma non è solo questione di coda lunga. Non si tratta, cioè, semplicemente di identificare una serie di parole-chiave correlate, per aumentare le probabilità di corrispondenza con la query dell’utente e segmentare l’audience. Si tratta di aiutare Google a capire che cosa stiamo dicendo, al di là delle singole parole impiegate. In questo senso possiamo dire che il peso delle keyword tra i fattori di indicizzazione e ranking sta diminuendo.

Da qualche anno Google integra progressivamente nel proprio sistema di algoritmi la logica dell’autoapprendimento. Il salto di qualità è arrivato con RankBrain, una tecnologia di machine learning operativa dalla fine del 2015 e considerata tuttora un oggetto alquanto misterioso. Pare di capire che RankBrain sia diventato il terzo segnale, in ordine di importanza, fra gli oltre 200 considerati da Google per posizionare i risultati delle ricerche.

L’obiettivo di RankBrain è riconoscere il senso della richiesta dell’utente, al di là della presenza nella sua query di specifiche parole-chiave, singole o raggruppate in stringhe, e della corrispondenza fra queste e il contenuto dei documenti indicizzati.

A tale scopo RankBrain cerca correlazioni fra più query di ricerca, creando pattern comuni. Così, anche una ricerca impostata in modo ambiguo e priva delle parole-chiave più coerenti può ottenere una risposta puntuale, in quanto correlata ad altre ricerche sullo stesso argomento. All’inizio l’operazione non era eseguita con tutte le query, ma solo con quelle che contenevano più termini o concatenazioni di espressioni complesse. L’algoritmo cercava correlazioni fra stringhe di ricerca che non contengono gli stessi termini o che sono mancanti di alcune parole chiave.

Consideriamo, per esempio, la correlazione fra la stringa “Michelle Obama” e la stringa “moglie di Barack Obama”. La seconda manca di una parola importante: “Michelle”. Ma RankBrain permette di stabilire una relazione fra le due query. Aumentando la complessità del problema, Google arriva a gestire query del tipo: “quanti anni ha la moglie di Michelle Obama?”, come se comprendesse il senso della domanda.

Facciamo un esempio ancora più complesso. Se impostate una query contenente il termine “consumatore”, Google vi restituisce coerentemente risultati relativi al mondo economico e in particolare al consumo di beni e servizi; ma se la query è “come si chiama il consumatore al più alto livello della catena alimentare?”, Google non si lascia ingannare: capisce che “consumatore” va inteso come “predatore”, e si regola di conseguenza.

C’era una volta Knowledge Graph

Che impatto avrà RankBrain sulla SEO? È presto per dirlo. In un’intervista concessa a Bloomberg nell’ottobre scorso Google lasciava intendere che solo il 15% delle query fosse impattato dal nuovo algoritmo. A distanza di nove mesi, però, Search Engine Land aveva evidenza del fatto che ormai tutte le ricerche sono gestite in questo modo (si veda Google uses RankBrain for every search, impacts rankings of “lots” of them).

Certo siamo ben oltre il tradizionale meccanismo di stemming, che consente a un software di considerare “casa” e case” due varianti dello stesso termine. Da tempo gli algoritmi di Google integrano stemming e altre operazioni di routine, con cui vengono riconosciuti anche i nostri errori di digitazione, un po’ come accade con l’autocorrettore nei programmi di word processing.

Ma RankBrain ha poco a che vedere anche con Knowledge Graph, lanciato da Google nel 2012. Knowledge Graph è un database contenente descrizioni di fatti fra loro correlati, una sorta di enciclopedia ipertestuale su persone, luoghi e altre entità notevoli. Provate a impostare una ricerca con la chiave “Barack Obama” e guardate il contenuto che appare nella parte destra della pagina dei risultati per farvi un’idea del tipo di correlazioni valorizzate da Knowledge Graph.