Page Authority 2.0: un aggiornamento su test e tempistica

 

Una delle decisioni più difficili da prendere in qualsiasi campo è scegliere consapevolmente di non rispettare una scadenza. Negli ultimi mesi, un team di alcuni dei più brillanti ingegneri, data scientist, project manager, editor e professionisti del marketing ha ha lavorato per una data di rilascio della nuova Page Authority (PA) il 30 settembre 2020. Il nuovo modello è eccezionale in quasi tutti i modi per l'attuale PA, ma la nostra ultima misura di controllo della qualità ha rivelato un'anomalia che non abbiamo potuto ignorare.

Continua a leggere...

Di conseguenza, abbiamo preso la decisione difficile ritardare il lancio di Page Authority 2.0. Quindi, lasciami prendere un momento per tornare sui nostri passi su come siamo arrivati ​​qui, dove ci lascia e come intendiamo procedere.

Vedere un vecchio problema con occhi nuovi

Storicamente, Moz ha utilizzato lo stesso metodo più e più volte per costruire un modello di Page Authority (così come Domain Authority). Il vantaggio di questo modello era la sua semplicità, ma lasciava molto a desiderare.

Modelli di Page Authority precedenti addestrati contro le SERP, cercando di prevedere se un URL si sarebbe classificato rispetto a un altro, in base a una serie di metriche di collegamento calcolate dall'indice di backlink di Link Explorer. Un problema chiave con questo tipo di modello era che non poteva affrontare in modo significativo la forza massima di un particolare insieme di metriche di collegamento.

Ad esempio, immagina gli URL più potenti su Internet in termini di link: le home page di Google, Youtube, Facebook o gli URL di condivisione dei pulsanti dei social network seguiti. Non ci sono SERP che mettono questi URL l'uno contro l'altro. Invece, questi URL estremamente potenti spesso si classificano al primo posto, seguiti da pagine con metriche notevolmente inferiori. Immagina se Michael Jordan, Kobe Bryant e Lebron James si affrontassero uno contro uno contro giocatori delle superiori. Ciascuno vincerebbe ogni volta. Ma avremmo grandi difficoltà a estrapolare da quei risultati se Michael Jordan, Kobe Bryant o Lebron James avrebbero vinto in gare uno contro uno l'uno contro l'altro.

Quando abbiamo avuto il compito di rivisitare l'autorità di dominio, alla fine abbiamo scelto un modello con il quale abbiamo avuto una grande esperienza: il metodo di formazione SERP originale (anche se con una serie di modifiche). Con Page Authority, abbiamo deciso di adottare un metodo di formazione completamente diverso prevedendo quale pagina avrebbe avuto più traffico organico totale. Questo modello presentava diverse qualità promettenti come la possibilità di confrontare URL che non si verificano sulla stessa SERP, ma presentava anche altre difficoltà, come una pagina con un'elevata link equity ma semplicemente trovarsi in un'area tematica poco ricercata. Abbiamo affrontato molte di queste preoccupazioni, come il miglioramento del set di formazione, per tenere conto della competitività utilizzando una metrica senza collegamento.

Misurare la qualità della nuova Page Authority

I risultati erano - e sono - molto promettenti.

In primo luogo, il nuovo modello prevedeva ovviamente la probabilità che una pagina avesse un traffico organico più prezioso di un'altra. Questo era previsto, perché il nuovo modello era diretto a questo particolare obiettivo, mentre l'attuale Page Authority tentava semplicemente di prevedere se una pagina si sarebbe classificata rispetto a un'altra.

previsione del traffico 1 16879 2

In secondo luogo, abbiamo scoperto che il nuovo modello prevedeva se una pagina si sarebbe classificata meglio di un'altra rispetto alla precedente Page Authority. Ciò è stato particolarmente piacevole, poiché ha messo a tacere molte delle nostre preoccupazioni sul fatto che il nuovo modello avrebbe avuto prestazioni inferiori ai vecchi controlli di qualità a causa del nuovo modello di formazione.

Quanto è migliore il nuovo modello nel prevedere le SERP rispetto all'attuale PA? Ad ogni intervallo, fino alla posizione 4 vs 5, il nuovo modello ha pareggiato o supera il modello attuale. Non ha mai perso.

classifica predittiva 15979

Tutto sembrava fantastico. Abbiamo quindi iniziato ad analizzare i valori anomali. Mi piace chiamarlo "qualcosa sembra stupido?" test. L'apprendimento automatico commette errori, proprio come fanno gli esseri umani, ma gli umani tendono a commettere errori in un modo molto particolare. Quando un essere umano commette un errore, spesso capiamo esattamente perché l'errore è stato commesso. Questo non è il caso del ML, soprattutto delle reti neurali; abbiamo estratto gli URL con autorità di pagina elevate con il nuovo modello che non aveva traffico organico e li abbiamo inclusi nel set di formazione per apprendere tali errori. Abbiamo subito visto bizzarri 90+ ​​PA scendere a 60 e 70 molto più ragionevoli ... un'altra vittoria.

Eravamo arrivati ​​a un ultimo test.

Il problema con la ricerca con marchio

Alcune delle parole chiave più popolari sul Web sono la navigazione. Le persone cercano su Google Facebook, Youtube e persino Google stesso. Queste parole chiave vengono cercate un numero astronomico di volte rispetto ad altre parole chiave. Successivamente, una manciata di marchi altamente potenti può avere un impatto enorme su un modello che considera il volume di ricerca totale come parte del suo obiettivo di formazione principale.

L'ultimo test prevede il confronto dell'attuale Page Authority con la nuova Page Authority, al fine di determinare se ci sono bizzarri valori anomali (dove la PA è cambiata drasticamente e senza una ragione ovvia). Per prima cosa, diamo un'occhiata a un semplice confronto tra il LOG dei domini radice di collegamento rispetto all'autorità della pagina.

5f73d1e628f475.91755667

Non troppo malandato. Vediamo una correlazione generalmente positiva tra Linking Root Domains e Page Authority. Ma riesci a individuare le stranezze? Vai avanti e prenditi un minuto ...

Ci sono due anomalie che risaltano in questo grafico:

  1. C'è un curioso divario che separa la distribuzione principale degli URL dai valori anomali sopra e sotto.
  2. La varianza maggiore per un singolo punteggio è a PA 99. Ci sono un numero enorme di PA 99 con un'ampia gamma di domini radice di collegamento.

Ecco una visualizzazione che aiuterà a evidenziare queste anomalie:

5f73d1e6dd96d0.80234353

Gli spazi grigi tra il verde e il rosso rappresentano questo strano divario tra la maggior parte della distribuzione e i valori anomali. I valori anomali (in rosso) tendono a raggrupparsi, soprattutto sopra la distribuzione principale. E, naturalmente, possiamo vedere la scarsa distribuzione nella parte superiore dei PA 99.

Tieni presente che questi problemi non sono sufficienti per rendere il nuovo modello di Page Authority meno accurato del modello attuale. Tuttavia, dopo un ulteriore esame, abbiamo scoperto che gli errori prodotti dal modello erano sufficientemente significativi da poter influenzare negativamente le decisioni dei nostri clienti. È meglio avere un modello che è un po 'fuori posto ovunque (perché le regolazioni apportate dai SEO non sono incredibilmente perfezionate) piuttosto che avere un modello giusto per lo più ovunque ma stranamente sbagliato in un numero limitato di casi.
Fortunatamente, siamo abbastanza fiduciosi su quale sia il problema. Sembra che gli AP della homepage siano gonfiati in modo sproporzionato e che il probabile colpevole sia il set di formazione. Non possiamo essere certi che questa sia la causa finché non completeremo la riqualificazione, ma è un forte vantaggio.

La buona notizia e la cattiva notizia

Siamo in buona forma nella misura in cui abbiamo più modelli candidati che superano la Page Authority esistente. Siamo sul punto di eliminare i bug, non di costruire modelli. Tuttavia, non invieremo una nuova partitura fino a quando non saremo certi che guiderà i nostri clienti nella giusta direzione. Siamo estremamente coscienziosi delle decisioni che i nostri clienti prendono in base alle nostre metriche, non solo se le metriche soddisfano alcuni criteri statistici.

Alla luce di tutto ciò, abbiamo deciso di ritardare il lancio di Page Authority 2.0. Questo ci darà il tempo necessario per affrontare queste preoccupazioni primarie e produrre una metrica stellare. Frustrante? Sì, ma anche necessario.

Come sempre, ti ringraziamo per la tua pazienza e non vediamo l'ora di produrre la migliore metrica di Page Authority che abbiamo mai rilasciato.

Visita il Centro risorse PA

Articolo originale

Related posts