Perché nella prima pagina Google dice che ci sono migliaia di risultati ma nell'ultima pagina ce ne sono meno di cento?


11

Perché nella prima pagina Google dice che ci sono migliaia di risultati ma nell'ultima pagina ce ne sono meno di cento?

È una specie di ricerca Google ricorsiva che dovrebbe essere autoesplicativa. Mi ci è voluto del tempo per modificare la frase e cercare di trovare un numero che corrispondesse esattamente, il motivo per cui l'ho cambiato in " centinaia " invece! : P

Se hai usato Google abbastanza a lungo, sicuramente ti sei imbattuto in situazioni simili a questa, molte volte. Ogni volta che mostra meno di 10 pagine è abbastanza facile vederlo. Il punto è: il numero di risultati su qualsiasi pagina tranne l'ultima sembra una stima terribile .

Cosa ancora più strana, alcune volte casuali la stima diventa improvvisamente molto migliore e quasi esattamente la stessa su tutte le pagine rispetto all'ultima pagina - l'unica pagina che è sempre corretta.

Quindi, qualcuno sa perché?


1
In questo momento a pagina uno per quella ricerca dice 3200 risultati, ma sull'ultima pagina dice 75 (per le persone interessate a un aggiornamento)
dkuntz2

@DKuntz sono 2990 e 65 per me (mentre sono loggato) mentre se esco (ed è così che ho fatto la prima volta) si trasforma in 3120 e 77. Forse dopo cambierò leggermente la domanda e costruirò una query ricorsiva più coerente, ma anche chiunque è invitato a farlo! : P
cregox,

Google è strano.
dkuntz2,

Il mio dice sempre 208 risultati nell'ultima pagina, che si tratti di 4 pagine di risultati o 22, dice sempre 208.
mchid

Risposte:


6

Non conosco la risposta esatta, forse nessuno al di fuori di Google lo sa. Ma ho due punti dati che possono essere utili.

Il primo è il punto di vista di XKCD sul problema:

Quindi sembra davvero che ci sia una certa soglia del volume dei risultati oltre la quale Google apparentemente dice "fanculo" e lancia un numero gigantesco. Immagino che ciò sia probabilmente dovuto all'incompetenza piuttosto che all'inganno intenzionale; Sono sicuro che è difficile generare pagine rapidamente da molte fonti e forse per le ricerche con molti risultati non hanno il tempo di sincronizzare tutto. Quindi sfiorano i numeri. Il fatto che ciò sembri avere molti più risultati di loro è presumibilmente solo un bonus non intenzionale.

Il secondo punto di dati proviene da un professore di informatica che ho avuto che era piuttosto curioso del problema e ha infastidito alcuni amici di Google al riguardo. Gli hanno detto che a volte diventa molto costoso capire quanti risultati sono stati effettivamente restituiti da una ricerca, quindi fanno solo una ipotesi migliore e restituiscono la prima pagina dei risultati, che è tutto ciò che interessa alla maggior parte delle persone. Solo quando inizi effettivamente a eseguire il drill down delle pagine, Google si preoccupa di calcolare completamente le pagine rimanenti.

Quindi nessuna di queste è una risposta definitiva, ma speriamo che possano essere utili per spiegare i tipi di problemi che potrebbero causare le inesattezze di Google.

MODIFICARE:

La risposta di Sathya in questa pagina ha una risposta dal Webmaster KB di Google .

Quando si esegue una ricerca, i risultati vengono spesso visualizzati con le informazioni: Risultati 1 - 10 di circa XXXX.

Il calcolo di Google del numero totale dei risultati della ricerca è una stima. Comprendiamo che una cifra da ballpark è preziosa e fornendo una stima anziché un account esatto, possiamo restituire risultati di ricerca di qualità più rapidamente.

Inoltre, quando si fa clic sulla pagina successiva dei risultati della ricerca, il numero totale dei risultati della ricerca può cambiare. In questo caso, ci rendiamo conto che alcuni dei risultati della query sono duplicati e li comprimiamo in modo da poter trovare più facilmente il risultato specifico che stai cercando. La compressione dei duplicati riduce il numero stimato di risultati, nonché il numero complessivo di pagine dei risultati.


Mentre adoro XKCD e gli ex cari insegnanti, quello che mi stai dicendo è che probabilmente dovrei chiedere questo su
stackoverflow.com

Non credo che nessuno su StackOverflow avrà una risposta definitiva: se hai davvero bisogno di sapere, dovresti chiedere a Google. Posso solo inoltrare la risposta da qualcuno che ha chiesto a Google qualche mese fa.
dsolimano,

non cercare una risposta definitiva, solo una con una spiegazione più approfondita ragionevole, preferibilmente di buona provenienza. Non fraintendermi, il tuo è ragionevole, ma dire "perché è difficile" anche se è autorevole e ha senso, è troppo poco per me. Hmm ... forse skeptics.se: o
cregox,

Bella modifica, ora è una buona fonte! Anche se continua a dire "perché è difficile", il che significa che sto ancora sperando in maggiori dettagli. : P
cregox,

7

No - il numero è solo un'approssimazione .

Quando si esegue una ricerca, i risultati vengono spesso visualizzati con le informazioni: Risultati 1 - 10 di circa XXXX.

Il calcolo di Google del numero totale dei risultati della ricerca è una stima. Comprendiamo che una cifra da ballpark è preziosa e fornendo una stima anziché un account esatto, possiamo restituire risultati di ricerca di qualità più rapidamente.

Inoltre, quando si fa clic sulla pagina successiva dei risultati della ricerca, il numero totale dei risultati della ricerca può cambiare. In questo caso, ci rendiamo conto che alcuni dei risultati della query sono duplicati e li comprimiamo in modo da poter trovare più facilmente il risultato specifico che stai cercando. La compressione dei duplicati riduce il numero stimato di risultati, nonché il numero complessivo di pagine dei risultati.


Penso che questo non sia un buon comportamento se limitano sempre il numero di risultati a più o meno solo 1000. Nel caso in cui l'utente desideri di più, dovrebbe mostrare di più. Dal mio punto di vista, alcune parole chiave comuni dovrebbero restituire una grande quantità di risultati di ricerca (come fiori, libri ...) e penso che su Internet esistano tonnellate di immagini diverse!

@ user11656 stai assumendo che Google Image Search funzioni allo stesso modo di una ricerca in un'app standard che potresti utilizzare. Le cose in genere funzionano in modo molto diverso su quella scala. Probabilmente non esiste un'unica risposta per "tutte le immagini che corrispondono al fiore" in quanto un server in Australia potrebbe avere un'immagine caricata di recente che non si è ancora propagata al server negli Stati Uniti. Quindi devi occuparti di cose come come presentare i duplicati e come fare tutto ciò attraverso milioni di immagini per milioni di utenti istantaneamente. È roba dura e devi scendere a compromessi architettonici.
George Mauer,


2

Nessuna delle risposte sopra è corretta.

La stima di Google deve essere più vicina al numero reale di risultati rispetto a quanto indicato.

Questo può essere mostrato da un semplice esempio. Scegli una parola un po 'frequente come "Russia" o "michael". In verità ci devono essere migliaia, se non centinaia di migliaia, di siti Web su Internet che contengono tali parole in qualche luogo del loro sito. Ma i risultati di Google potrebbero darti solo 700.

La verità non è che Google dia grandi sopravvalutazioni, ma che ora Google limita enormemente il numero di risultati che ti darà. Accorcia gravemente i risultati, a nostro svantaggio principale come individui. È un peccato perché in alcuni casi voglio leggere le migliaia di siti con i miei termini.

Lo so perché ho usato Google per molto tempo, forse 10-15 anni e ho notato che, come regola generale, i risultati per i termini sono stati più brevi, non più lunghi, anche se il numero di siti con gli stessi termini generalmente deve sono aumentati nel tempo in cui utilizzo Google.

Mentre in passato, anni fa, avrei potuto ottenere forse 1000 risultati per alcuni termini, ora sto ottenendo 500 risultati per gli stessi termini per i quali avrei ottenuto 1000 risultati.


2
Si noti che "sopra" non ha alcun contesto nelle risposte, poiché possono essere ordinati in diversi modi. Anche se si assume l'ordinamento predefinito per "voti", le loro posizioni cambieranno man mano che vengono aggiunti i voti su e giù.
Ale

Molto interessante! La Russia in questo momento mi dà solo 322 risultati e lo mostra solo nell'ultima 34a pagina . Fino ad allora si direbbero 799.000.000 di risultati! Mentre questa è una bella intuizione, non sembra ancora giusta. Non credo nemmeno che le prime stime siano corrette e l'intenzione sta portando solo risultati che vengono mostrati, non "quanti ne ritiene esistano sul web", quindi, l'ultima pagina lo risolve.
Cregox,

1

Il problema con il motore di ricerca di Google (Immagine) è che mira alla pertinenza eliminando la varianza. Innanzitutto, è importante capire come funziona. Un'immagine caricata su Internet deve essere indicizzata in due modi:

  • basato sull'originalità (l'immagine viene analizzata da un "robot intelligente" basato su colore, dimensioni, motivi, riconoscimento della forma, tipo, ecc.)
  • in base alla somiglianza (l'immagine viene analizzata da uno "smart bot2" e referenziata con immagini già esistenti in un database e ulteriormente taggata con una o due etichette di categoria: "immagine corrisponde" e "immagine simile a ... ")

Al termine dell'indicizzazione, l'immagine erediterà le "parole chiave" come risultato del riconoscimento per evitare di mostrare i risultati off-topic all'utente finale. Il fatto è che ogni parola chiave è una frase autonoma con valore assegnato in% in base alla forza della pertinenza (ecco perché raggruppare più parole nella casella di ricerca si traduce in un minor numero di risultati e anche quando si cerca un'immagine caricandola o inserendo un URL, Google assegnerà una "ipotesi" con solo le parole chiave migliori, il che significa che la ricerca non ti mostrerà mai tutte le immagini semplicemente perché la ricerca non è progettata per farlo)

Quindi alla fine di una giornata quando esegui una ricerca di immagini e proprio sotto la casella di ricerca, vedrai un numero incredibile che dice "25.270.000.000 di risultati (0,55 secondi)" è per lo più sempre un tipo falso, perché non otterrai più di 200 (massimo 500 ma solo dopo che l'utente lo ha richiesto) risultati che sono anche filtrati per escludere:

  • duplicati esterni (se la stessa immagine è 2+ volte nella stessa pagina del sito)
  • duplicati di pertinenza (mostra solo i "migliori risultati" - vedi immagine sotto)
  • immagini che hanno problemi con la legge (vedi immagine sotto)
  • immagini che violano DMCA (vedi immagine sotto)
  • immagini che provengono da fonti SPAM, MALWARE, PHISHING
  • immagini nascoste (se un utente non ha disabilitato la ricerca sicura)
  • immagini inserite nella lista nera di Google ( articolo )
  • immagini con AR diverso (in pratica tutte le immagini con proporzioni diverse rispetto al riferimento di ricerca delle immagini, ad es. puoi perdere tutti i risultati desiderati se cerchi l'immagine selezionata, diciamo con un rapporto 9: 7 strano, mentre tutte le immagini sono indicizzate in Google ha un rapporto 3: 4 - che è forse il più grande svantaggio di questo motore di ricerca perché obbedisce sempre al rapporto di aspetto come primo criterio)
  • e molti altri ancora

Per riassumere: i risultati di ricerca di un'immagine non sono mai pienamente pertinenti. A volte otterrai il risultato finale desiderato con una frase di ricerca "poster di gate", altrimenti potrebbe essere "cover gate", "gate bluray", "gate dvd", "gate 2015" o persino "自衛隊 彼 の 地 に て 斯 く 戦え り "- non puoi avere risultati" TUTTI "sull'immagine, perché non c'è nulla che sia" TUTTO ", ecco perché è necessario giocarci per arrivarci. Ed è anche importante ricordare che esistono altri motori di ricerca di immagini che possono svolgere il lavoro in modo più diverso, poiché lavorano su standard e criteri diversi. Non è e non è mai stato "Google" -solo ... >> https://www.yandex.com/images/

estensioni notevoli:


Ancora una volta, contrassegnarli come duplicati sarebbe molto più utile che pubblicare la risposta su ogni domanda.
jonsca

0

Nella parte superiore indica la pagina 70 di 7000 risultati (esempio). Fornirà il numero di pagina e quanti risultati. Non ci sono 70 risultati, ma 70 pagine. Spero che sia di aiuto.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.