È una cattiva idea usare la Ricerca Google sul tuo sito web?


11

Se hai un'applicazione web con molti record, è una cattiva idea usare la Ricerca Google sul tuo sito web? Invece di scrivere una funzione di ricerca e gestire i problemi di prestazioni, "esternalizzi" la funzione di ricerca a Google.


1
Questo mi porta alla mia curiosità, potresti fornire maggiori dettagli alla domanda? perché pensi che questa potrebbe essere una cattiva idea? hai più documentazione ti farà pensare che sia una cattiva idea? Hai letto qualcosa che ti ha fatto pensare di averlo?
RTOSkit

Ciao @RTOSkit, ho sviluppato alcune piccole applicazioni Web e la funzionalità di ricerca rimane ancora una delle maggiori sfide. Devo prendere in considerazione l'accuratezza del risultato della ricerca e le prestazioni del server. Personalmente non penso sia una cattiva idea ma un po '"imbarazzante" in quanto è l'unica parte dell'applicazione che non è stata sviluppata da te.
John Doe,

Ok ho capito, @ JCL1178 ti ha offerto una risposta ottimale.
RTOSkit,

Risposte:


3

Come indicato nella loro risposta JCL1178, Google restituirà risultati solo per ciò che ha indicizzato. Questo non significa solo che alcuni dei tuoi risultati potrebbero non apparire mai, ma se il tuo sito viene mai de-indicizzato per qualche motivo, hai perso la ricerca dal tuo sito web. Avere qualcosa di così importante come la ricerca si basa su un servizio di terze parti non supportato è pericoloso.

Dato che hai accesso diretto ai dati, puoi fornire una ricerca molto migliore e più dettagliata di Google o di qualsiasi altro motore di ricerca. Puoi consentire ai tuoi utenti di cercare campi specifici, filtrando qualsiasi altro hit da campi non correlati. Google non ha alcun contesto per i valori che sta cercando, quindi una ricerca per la famiglia "Smith" potrebbe far emergere qualsiasi risultato per le persone che vivono su "Smith St." o qualcuno con l'occupazione di "fabbro".

La maggior parte dei database relazionali più diffusi ha la capacità di eseguire ricerche full-text, quindi aggiungere una funzione di ricerca di base potrebbe essere semplice come scrivere alcune istruzioni SQL.

Uso i motori di ricerca personalizzati di Google per la ricerca generale sui miei siti Web, ma non li utilizzerei per cercare informazioni archiviate in un database, a meno che la mia capacità di effettuare ricerche full-text fosse limitata (limitazioni del software, problemi di prestazioni dovuti a hardware / dimensione del set di dati). Dipende dalla complessità dei dati e dall'importanza della ricerca nella navigazione dei dati ... ma fornire le proprie strutture di ricerca mi sembra la scommessa più sicura.


Tutti i punti molto buoni e ho completamente ignorato la possibilità di de-indicizzazione nella mia risposta.
JCL1178,

Ciao @Jacob Hume. Ottimo punto qui sull'affidamento a servizi di terze parti. Era anche quello che avevo in mente. Ho sperimentato ricerche full-text e anche vari motori di ricerca, ma come ho già detto in uno dei miei commenti, ho sempre problemi con l'accuratezza dei risultati e / o le prestazioni del server. Ancora una volta, grazie mille per il tuo contributo.
John Doe,

3
Quindi, invece di avere una probabilità dello 0,00001% di ricerca in calo (è probabile che Google non indicizzerà il tuo sito a meno che tu non faccia qualcosa di veramente stupido), stai proponendo che il sito abbia un'implementazione della ricerca full-text ingenua Il 100% delle volte? Non un buon compromesso IMO. La ricerca full-text è una funzione molto utile per accedere rapidamente alle funzionalità di ricerca di base, ma la creazione di un'utile funzione di ricerca, molto meno di una user-friendly come quella di Google, è un po 'più complicata del semplice "scrivere alcune istruzioni SQL".
Lèse majesté,

2
I veri motori di ricerca come Google, Solr, Lucene, Sphinx, ecc. Sono in grado di fare cose come pesare la prossimità delle parole chiave, ricerche di sottostringa, distanza di levenshtein / metafono / parole / ricerca di testo sfocato, ecc. Che migliorano notevolmente l' usabilità. La ricerca full-text è un buon punto di partenza, ma in realtà ci vuole molto più lavoro per costruire una funzione di ricerca decente in grado di restituire costantemente risultati pertinenti. La maggior parte degli sviluppatori che non sono esperti nello sviluppo dei motori di ricerca farebbero bene a utilizzare un servizio di terze parti o almeno una soluzione standard collaudata come Lucene o Solr.
Lèse majesté,

2
Anche le grandi aziende come Oracle hanno difficoltà a creare internamente utili ricerche all'interno del sito (confronta la ricerca della documentazione di MySQL.com prima e dopo l'acquisizione di Oracle). Inoltre, la tua caratterizzazione del motore di ricerca di Google è più appropriata per la ricerca full-text sviluppata in casa rispetto al motore di ricerca di Google, che attualmente utilizza probabilmente gli algoritmi di previsione euristica e di intento dell'utente più avanzati nel settore.
Lèse majesté,

7

Ai fini di questa risposta, presumo che tu stia parlando di Ricerca personalizzata di Google / Ricerca su sito e non di Google Search Appliance, che sarebbe un'ottima idea, anche se costosa.

Esternalizzare la tua ricerca su Ricerca personalizzata di Google non è una cattiva idea, ma potrebbe non essere la soluzione migliore per il tuo sito / modello di business / qualunque cosa a causa delle limitazioni e delle regole di Google.

La ricerca personalizzata è essenzialmente la stessa cosa che digitare search terms site: yoursite.comin Google tranne per il fatto che non è necessario specificare la site: yoursite.comparte e è possibile incorporare un modulo di ricerca sul proprio sito. Ricerca sito è una versione non libera di Ricerca personalizzata con più opzioni di personalizzazione e un certo accesso all'API. Esistono alcune altre differenze tra Ricerca su sito / personalizzata e utilizzo di Google come spiegato nella documentazione collegata, ma la cosa importante da notare è che funzionano solo con ciò che Google può vedere.

Pertanto, "molti record" nella tua applicazione web devono essere pienamente in grado di essere individuati da Google affinché la Ricerca personalizzata restituisca risultati accurati. Se limiti / proteggi i record dalla visualizzazione pubblica per qualsiasi motivo devi mostrare a Google gli stessi risultati limitati che un utente disconnesso vedrebbe o potresti avere Google indicizzare il contenuto completo ma devi rispettare le regole del primo clic gratis o rischiare di essere mangiato da un Panda arrabbiato. Se presenti una cosa a Google e un'altra ai visitatori, è Cloaking e genererai una penalità per il tuo sito. Se tutti i record che desideri includere nei risultati di ricerca non possono essere sottoposti a spidering per qualsiasi motivo, l'utilizzo della Ricerca personalizzata di Google o della Ricerca su sito non è una buona idea per il tuo modello specifico.

Ma se puoi consentire a tutto di essere indicizzato, non ti dispiace come Google restituisce i risultati della ricerca per la Ricerca personalizzata (o non sei disposto a pagare per la Ricerca su sito per risolverlo) e sei disposto a rischiare che una pagina critica non venga indicizzata per qualunque motivo, allora puoi e dovresti prenderlo seriamente in considerazione.


1

Ti suggerirei di utilizzare la Ricerca Google, se desideri che tutti i dati del tuo sito vengano visualizzati anche da altri. Salverà il bit extra di codifica.

Se si tratta di un sistema chiuso e non vuoi che gli altri vedano i dati, procurati il ​​tuo sistema di ricerca.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.