Come posso trovare errori di ortografia comuni per il mio nome di dominio?


38

Mi piacerebbe registrare errori di ortografia per il mio nome di dominio, ma non voglio registrare speculativamente un milione di moduli "solo indovinando". Ad esempio, questo strumento offre le seguenti opzioni in un generatore di parole chiave Typo

  • salta le lettere
  • doppie lettere
  • lettere inverse
  • salta spazi
  • chiave mancata
  • chiave inserita

Il che è fantastico e genera dozzine se non centinaia di possibili nomi di dominio ... ma non mi dice la cosa più cruciale: quale di questi errori ortografici si verifica effettivamente di più con utenti reali reali su Internet?

Come posso trovare dati di ortografia effettivi da utenti reali?

Risposte:


25

Ci sono alcune risorse su Wikipedia, ma dovresti essere abbastanza fortunato da avere un dominio che è una semplice parola inglese vaniglia, abbastanza comune da apparire qui.

Potresti usare lo strumento generatore di parole chiave typo o qualcosa del genere, quindi inserire faticosamente ciascuno in Google - che ironicamente cercherà di correggere l'ortografia - quindi utilizzare la "ricerca invece di {versione errata}" e vedere quante ricerche risultati ottenuti per quello specifico errore di ortografia:

Visualizzazione dei risultati per il trattato

Cerca invece tretise

Ciò fornisce circa 117.000 risultati per "tretise" contro 17.800.000 risultati per "trattati". Quindi ora hai idea di quanto sia comune quell'ortografia su Internet! Quindi puoi favorire gli errori ortografici che si verificano più spesso nel mondo reale.

Forse soprattutto, ho trovato anche queste pagine:

http://how-to-spell.net/treatise

Come si scrive il trattato?

Corretto: trattato .

Errori ortografici comuni: tretise - 100%

Che a quanto pare fa utilizzare i dati reali!

Abbiamo raccolto percentuali di errori di ortografia da quasi 15.423.252 sessioni di controllo ortografico sul sito Web spellchecker.net (gennaio 2010 - giugno 2012).

Idealmente mi piacerebbe che Google condividesse i dati sugli errori di ortografia, dal momento che sospetto che abbiano molti più dati .. ma non sono sicuro che siano disposti a condividere, forse vedono la correzione automatica dell'ortografia dei termini di ricerca errati come vantaggio competitivo.

Sarebbe fantastico se lo facessero!


2
Non dimenticare che puoi anche chiedere ai tuoi utenti!
Alex L

2
Il corpus di parole di Google Triliion includeva sicuramente sia le parole corrette che quelle errate, in modo da poterlo usare e un sacco di scricchiolii di parole e numeri per calcolarli dai dati grezzi che Google condivide.
hippietrail,

OpenDNS e Google Public DNS hanno sicuramente questo tipo di informazioni, ma nessuna le sta dando via, ma invece le utilizza per migliorare i propri servizi (OpenDNS ha una funzione di correzione dell'errore di battitura). Potresti avviare il tuo servizio DNS gratuito / gratuito e raccogliere dati, immagino.
Christian Davén,

1
Non penso che usare i risultati di Google sia una buona idea (anche se poco pratica). Come sottolinea xkcd sulla sua blag , "Il" numero di risultati "conta che Google dà quando la tua ricerca è chiaramente fabbricata".
rodrigoq,

9

Problema interessante. Puoi utilizzare lo strumento di ricerca per parole chiave di google all'indirizzo https://adwords.google.com/o/KeywordTool per scoprire quante ricerche al mese vengono eseguite per ogni errore di battitura del tuo nome di dominio (dovresti generare un elenco di errori di battitura con strumento di cui sopra). Non perfetto, ma rappresenterebbe errori di battitura dell'utente reale e ti darebbe alcuni dati decenti per andare avanti. (L'ho appena testato e ho ottenuto alcuni risultati che sembravano ragionevoli.)


Purtroppo, questo non è più vero, ora che abbiamo Hummingbird. Lo Strumento per le parole chiave di Google è stato deprecated. È stato sostituito con Keyword Planner, un prodotto Google AdSense.
Ellie Kesselman,

4

Domanda interessante, analizzare i risultati della ricerca come descritto qui dovrebbe sicuramente essere una buona posizione di partenza, ma è sensibile ai falsi positivi causati da altri siti Web con nomi simili ai tuoi. Potrebbero anche mancare errori comuni a cui non hai pensato, guardando l'elenco che direi potrebbe essere interessante anche analizzare il cambio di parole.

Un metodo particolarmente utile per scoprire quali errori vengono commessi più comunemente dai visitatori comuni consiste nel chiedere loro di digitare il nome. Ovviamente non tutti i siti Web sono adatti a questo, supponendo che la pagina sia interattiva dovrebbe adattarsi perfettamente.

Invece di usare i normali captcha, mostra solo alcuni dei tuoi loghi del sito con (parte del) nome scritto lì e chiedi alle persone di digitarlo prima che possano fare le loro cose.

I dati non si baseranno su un'enorme popolazione come la ricerca su Google, ma saranno esattamente il gruppo target e i risultati dovrebbero quindi essere abbastanza potenti.


1

Puoi provare questo typo finder di dominio . Cerca le opzioni seguenti, singolarmente o in combinazione:

  • La tastiera QWERTY scivola
  • Scambio di lettere
  • Chiavi adesive, per lettere extra o mancanti
  • Look-a-like come la lettera lcontro il numero1

Esistono tre "punti di vista" per la ricerca. Il registrante è l'impostazione predefinita. DNS è una vista ordinabile che mostra il server dei nomi e l'indirizzo IP di ogni errore di battitura. TLD trova errori di battitura nei nomi in uno di questi sei TLD: .com .net .org .biz .us .infoe se è registrato.

È diverso dallo strumento per le parole chiave di OP? Può essere. Afferma di "trovare errori di battitura comuni associati ai nomi di dominio". Ciò significa che i dati sono stati raccolti dagli utenti durante la digitazione manuale dei nomi di dominio nella barra di navigazione del browser .

  • La ricerca "Tasti permanenti" include varianti comuni, con o senza trattini. Questo tipo di errori di battitura non è dovuto a chiavi appiccicose e appiccicose, piuttosto a errori nella percezione umana. Ciò indica l'uso di qualcosa di meglio di un approccio basato su regole, basato su un sistema esperto.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.