I motori di ricerca vengono sempre più spesso considerati come gatekeeper delle informazioni, ma i criteri utilizzati dai motori di ricerca per classificare i risultati sono opachi per gli utenti. In che modo gli utenti possono essere sicuri che i loro risultati non siano distorti o manomessi in qualche modo a beneficio di alcuni interessi a scapito della qualità dei risultati di ricerca?
I governi richiedono abitualmente che i provider di ricerca rimuovano o riducano la classifica dei siti Web ritenuti politicamente indesiderabili. Le aziende possono pagare i fornitori per aumentare determinati risultati rispetto ad altri per aumentare i loro ricavi. I firewall possono interferire con i risultati prima che vengano ritrasmessi agli utenti.
Anche le modifiche apparentemente innocue agli algoritmi di classificazione che potrebbero non apparire in superficie sembrano essere di parte, potrebbero in realtà essere progettate subdolamente per danneggiare i siti Web che condividono alcuni attributi comuni (non correlati alla qualità effettiva).
È possibile rilevare la distorsione dei motori di ricerca, ad esempio monitorando i risultati per un periodo di tempo e valutando se una "variabile nascosta" (forse un'affiliazione politica) è un fattore trainante nel cambiamento delle classifiche dei siti Web?
Un subdolo fornitore può gradualmente abbassare nel tempo la classifica dei siti Web mirati (e forse anche dei siti Web casuali per distrarre gli utenti). Quali sono i limiti di quanta distorsione può introdurre un provider senza essere rilevato? Oppure è possibile nascondere sempre tale interferenza selezionando subdolamente criteri di classificazione ponderati che incidentalmente producono il risultato desiderato (mediante "snooping dei dati").
Qualcosa di questo cambia se i criteri di classificazione vengono resi pubblici? Dobbiamo open-source i criteri utilizzati dai motori di ricerca?
Questo mi ricorda il risultato che rilevare se uno strumento finanziario complesso come un CDO è stato manomesso o meno dal venditore equivale a risolvere il problema del sottografo più denso:
http://www.cs.princeton.edu/~rongge/derivative.pdf
Grazie!