Get free SEO audit

Contenuti

Esplora cos'è la pagina 404, perché appare e come rintracciare gli errori 404 sul sito web

Esplora cos'è la pagina 404, perché appare e come rintracciare gli errori 404 sul sito web

Cos’è l’errore 404?

 

“Errore 404” (or “Page Not Found”) – è un codice di stato standard HTTP che appare quando il server non riesce a trovare un documento richiesto da un utente. Fondamentalmente, questa è una pagina che non esiste.

 

404 page example

 

I motivi per l’errore page not found

 

  • La pagina è stata cancellata da un sito
  • L’utente ha digitato l’URL in modo errato
  • La pagina è stata spostata e il redirect è stato configurato in modo errato
  • Malfunzionamenti del server (accade molto raramente)

Idealmente, non ci devono essere collegamenti che mostrano l’errore 404 del server sul sito (o collegamenti esterni). Ma, francamente, se il sito ha più di mille pagine, non si può evitare un problema di errore 404. Ma ciò che è veramente strano è quando trovi un sito con un piccolo numero di pagine (il che significa che tutte le pagine rotte possono essere tracciate manualmente) che contiene tre collegamenti interrotti agli articoli nella rubrica “Notizie fresche” nella prima pagina.

 

Incremento significativo in errore 404 page not found

 

Un caso è quando durante il controllo di un sito i bot di ricerca riportano una dozzina di errori, ma cosa succede se il loro numero aumenta di centinaia o addirittura di migliaia? Il pronto intervento e la soluzione dovrebbero essere trovati se il numero di errori 404 ha superato del 10% il numero totale di pagine sul sito web. Ci sono vari motivi per cui un numero così grande di pagine non trovate appare, ma principalmente questo è a causa dei problemi con il codice di errore 404 (ad esempio, queste pagine sono state create con l’aiuto di script e stili e gli stili sono nel codice del modello, ma non nel file separato).
L’altro motivo per cui i robot evitano le pagine che non sono mai state disponibili sul sito è l’attacco informatico (ad esempio, posizionando le pagine delle porte sul sito Web). Anche dopo la sua cancellazione, i robot continueranno a evitare le pagine Web create per qualche tempo e questo può portare alla comparsa di numerosi errori 404. Ma, con l’aiuto di vari strumenti, è possibile tracciare facilmente i seguenti collegamenti.

 

Come rintracciare i collegamenti non funzionanti e i loro successivi?

 

Yandex.Metrica
Dovresti usare “Parametri delle visite” in Yandex.Metrica se vuoi controllare i salti degli utenti tramite collegamenti interrotti. Basta inserire questa riga nel codice contatore:

params:window.yaParams||{ }});

Inoltre dovresti inserire questo codice JS da qualche parte sulla pagina 404:

<script>
var url = document.location.pathname + document.location.search
var url_referrer = document.referrer;
var yaParams = {error404: {page: url, from: url_referrer}};
</script>

Qui url – è l’indirizzo corrente della pagina 404, e il referente url è un indirizzo che hai usato per arrivare su di esso. In questo modo puoi non solo tracciare tutti i link non funzionanti, ma anche tutte le pagine su cui sono posizionati.

 

Google Analytics
Per tracciare i salti, è necessario installare questo codice su una pagina 404:

<script>
ga('send', 'pageview', '404.html?page='+ document.location.pathname + document.location.search +'&from=' + document.referrer);
</script>

Dove document.location.pathname + document.location.search – è l’URL della pagina che non è stata trovata sul sito;
document.referrer – URL della pagina, usato da un utente per saltare sulla pagina 404

 

Yandex.Webmaster
Per trovare queste pagine devi selezionare la sezione “Indicizzazione” – “Pagine ricercabili” – “Pagine escluse”. Qui puoi selezionare solo le pagine con l’errore usando il filtro “Errore HTTP: 404”.

 

404 pages in Yandex Webmasters

 

Google Search Console
Puoi anche trovare gli errori utilizzando “Scansione” – “Errori di scansione” – “Errore 404” in Google Webmaster.

 

404 pages in Google Search Console

 

Qual è il pericolo dell’errore 404?

 

Si dice che le pagine non trovate influenzino direttamente l’indicizzazione del sito e la sua posizione nei risultati della ricerca in modo negativo, ma nella maggior parte dei casi questa affermazione è sbagliata. Cosa succede a questa pagina quando il robot la trova? Lo cancella da un indice (nel caso in cui ci sia già entrato, se no – bot non lo scansiona). Ovviamente, questo è perché la pagina non è più informativa e utile. Ma non dovresti dimenticarti degli errori SOFT. SOFT 404 non è una risposta ufficiale da un sito, ma piuttosto un tag, dato alle pagine dai motori di ricerca dopo la scansione.
Cosa c’è di sbagliato in queste pagine e perché i motori di ricerca prendono tali decisioni?

  1. C’è poco o addirittura nessun contenuto nella pagina (Google può considerarlo come 404, Yandex come non di buona qualità).
  2. C’è un reindirizzamento alla pagina, che non risponde alle richieste degli utenti.
  3. La pagina non trovata non fornisce la risposta del server 404 o 410

 

Quale scegliere: 301 o 404?
Una nuova domanda sorge dopo la cancellazione di una pagina: qual è il tuo prossimo passo? Dovresti regolare la risposta del server 404 o il reindirizzamento 301? Devi analizzare ogni caso separatamente: ad esempio, il metodo, che hai utilizzato con successo per un negozio online, potrebbe non essere una buona scelta per il sito che offre servizi o un altro negozio online. Imposta la risposta del server 404 se, per alcuni motivi, una pagina viene completamente cancellata da un sito.

301 redirect è meglio quando:

  • L’indirizzo della pagina è stato modificato (ad esempio a causa delle modifiche alla struttura);
  • Una pagina è pertinente alla richiesta degli utenti;
  • Il reindirizzamento all’altra pagina con un contenuto simile è possibile (lo stesso tema o da una pagina di articolo a un catalogo);
  • Ci sono link esterni alla pagina.

Il redirect 301 per la home page non è la migliore variante sia per gli utenti (causerà loro confusione) e SEO (ad esempio, Googlebot li considera come SOFT 404).

 

Errore 404 e fattori comportamentali
Ricordi i tuoi sentimenti quando, dopo aver visitato un sito in cerca di qualcosa, ti sei trovato il monitor bianco con 404 Error Page Not Found invece delle informazioni che stavi cercando. Cosa farà un utente normale in questo caso? Ovviamente, chiude questa scheda e cerca un nuovo sito. È naturale, più pagine sul sito danno una risposta al server 404, quindi gli utenti più gli utenti trovano questo errore, meno tempo dedicheranno a questo sito e maggiori saranno i cali. Gli algoritmi dei motori di ricerca funzionano con fattori comportamentali, e stanno prestando la massima attenzione in quanto svolgono un ruolo molto importante nel processo di classificazione. Se vuoi evitare il peggioramento dei fattori comportamentali, dovresti motivare gli utenti a rimanere sul sito, quindi dovresti affrontare il problema della creazione della pagina 404 in modo interessante e razionale.

 

La tua pagina 404

 

Se vuoi che gli utenti rimangano sul sito, dovresti pensare a creare la tua pagina 404, che verrà visualizzata una volta che si è verificato un errore. Nella maggior parte dei casi, i webmaster non prestano molta attenzione ad essa.

 

Obiettivi della pagina:

  • Attirare l’attenzione dell’utente;
  • Spiegare cosa è success;
  • Suggerire soluzioni al problema.

I motori di ricerca a loro volta, parlando della propria pagina 404, raccomandano quanto segue:

 

Yandex:

  • Una pagina dovrebbe differire dalle altre pagine del sito web come design;
  • Dovresti usare colori diversi o addirittura non usare la grafica quando crei una pagina.

 

Google:

  • Una pagina deve essere creata nello stesso stile (inclusa la navigazione) del sito Web principale;
  • È necessario posizionare i collegamenti agli articoli più popolari e alle sezioni dei commenti su questa pagina;
  • Offri ai tuoi utenti la possibilità di segnalare link non funzionanti.

 

Raccomandazioni generali:

  • Deve contenere un collegamento a una homepage;
  • Dovresti informare in modo educato un utente che una pagina che desidera visitare non è disponibile.

Le raccomandazioni di cui sopra non sono regole incondizionate per le pagine 404. Tutto dipende dal tema del sito web e dal pubblico di destinazione, quindi per un negozio online è rilevante aggiungere la linea di ricerca e per i siti web che offrono servizi – contatti.

 

Hotjar 404 error

 

404 error on hotjar website

 

GitHub 404 error

 

404 error on Github

 

Facebook 404 error

 

404 error on facebook

 

Ahrefs 404 error

 

404 error on ahrefs

 

Semrush 404 page

 

404 error on Semrush

Controlla il tuo sito web per errori

No limits! Upgrade your account to crawl this domain

Check your website SEO performance

Get a personalized checklist on how to improve your website to rank higher on Google

No limits! Upgrade your account to crawl this domain
close

Reset Password

Enter your e-mail to reset your password

Your email

Password Reset Sent!

Please check your inbox for instructions on how to reset your password. If you don't get an email, please check your SPAM folder. letter icon

Your password has been reset successfully!

We’ve just sent a verification letter to . Please follow the link in this letter to verify your mailbox and start your free trial. In case you don’t see the letter, please check your SPAM folder.

Thank you for registration!

We are redirecting you to PayPal

Sitechecker can’t crawl this website, because the home page responds HTTP status code.
This can happen for several reasons. Please, enter a working website or make this website accessible to the Sitechecker bot.
Sitechecker can’t crawl this website, because it has too many redirects.

Often this is the result of competing redirects, one trying to force HTTPS (SSL) and another redirecting back to HTTP (non-SSL), or between www and non-www forms of the URL.

Please, contact your hosting provider or web developer to fix this issue or paste another website.

Sitechecker can’t check this website, because the home page responds HTTP status code.

Domain name
redirects to
{domain_200}