Mia madre sta seguendo un corso online per essere una sorta di bibliotecaria, in questo corso coprono ricerche booleane, quindi possono cercare database in modo efficiente, tuttavia, ha una domanda che suona in questo modo:
La ricerca "x OR y" genererà 105.000 risultati, mentre una ricerca di solo x comporterà 80.000 risultati e una ricerca di solo y otterrà 35.000 risultati. Perché la ricerca "x OR y" genera 105000 risultati, quando le singole ricerche combinate danno 115.000 risultati?
Per me sembrava strano, quindi l'ho provato io stesso, usando le parole pancetta e sandwich .
- Solo la pancetta ha prodotto 179.000.000 di risultati
- Solo il sandwich ha prodotto 312.000.000 di risultati
- pancetta o sandwich ha dato 491.000.000 di risultati
Ma per me si somma: 179.000.000 (pancetta) + 312.000.000 (sandwich) = 491.000.000 (pancetta O sandwich)
Perché una query OR può comportare meno hit rispetto a entrambe le singole query combinate?