Per misurare l'efficacia della ricerca del Finder


0

Ho notato che la ricerca del Finder manca molte volte corrispondenze da documenti PDF anche nella ricerca di cartelle rigorose.

Sarebbe molto bello avere informazioni su possibili partite saltate. Una partita saltata è come 100 punti negativi. La ricerca Adobe sembra essere il must da usare qui altrimenti.

La risposta di Zhora mi ricorda il problema in questione. Le utilità di ricerca predefinite dei sistemi operativi sono instabili a causa della varietà di tipi di file diversi. Personalmente produco file Tex, quindi nessun problema nell'indicizzazione del tex semplice e nella ricerca veloce. Tuttavia, i miei college producono documenti WYSIWYG con output PDF. Questa cosa crea una richiesta di ricerca a livello di codice.

Un approccio necessario nell'efficacia della ricerca è limitare lo spazio di ricerca. Mi piace chflags e l' estensione .noindex nel fare questo .

Come puoi misurare l'efficacia della ricerca di Finder per Python o altre lingue?


Mi chiedo solo! che bene farà?
Ruskes,

A volte un risultato mancato è molto più costoso rispetto al resto dei risultati. Se ci sono voci ignorate, devo sapere. Tale ricerca è molto instabile.
Léo Léopold Hertz 준영

Risposte:


1

Nel corso degli anni di utilizzo degli strumenti di ricerca di OS X (Spotlight, Find, Smart Folders), tutti i quali, a mio avviso, usano i metadati dei file raccolti in vari modi e avendo avuto una buona idea di quali combinazioni diverse di termini di ricerca potrebbero trovare sono ancora spesso incapace di recuperare con successo ogni file che penso che la mia ricerca dovrebbe trovare. A un certo punto ho iniziato a testare sistematicamente varie ricerche per cercare di determinare alcuni schemi di base in modo da poter essere certo che i file risultanti contenessero tutti i file (o anche "specifici") che stavo cercando. Ho scoperto che c'erano così tante cose che potevano influenzare sottilmente una ricerca (come ordine delle parole, lettere maiuscole, differenze tra l'uso di caratteri numerici e alfabetici, usando parole parziali che corrispondevano all'inizio di un pezzo di metadati rispetto a una sottostringa che corrisponderebbe all'interno uno stesso attributo, virgolette e virgolette doppie, virgolette senza eguali, i vari operatori logici [AND, OR, NOT o &, |, ^ o &&, ||, o alcuni o tutti questi in modo da non ricordare del tutto il modulo giusto da usare], il vari "nomi" per pezzi di metadati come "data:" o "tipo:" o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, fondamentalmente ho imparato alcune cose su cui potevo contare ma mi chiedo se c'è qualcuno che potrebbe effettivamente prevedere i risultati esatti di tutti tranne la ricerca più elementare. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. virgolette senza eguali, i vari operatori logici [AND, OR, NOT o &, |, ^ o &&, ||, o alcuni o tutti questi in modo da non ricordare del tutto la forma giusta da usare], i vari "nomi" per pezzi di metadati come "date:" o "kind:" o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, in pratica ho imparato alcune cose su cui poter contare ma mi chiedo se ci sia qualcuno che potrebbe effettivamente prevedere i risultati esatti di tutti tranne la ricerca più semplice. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. virgolette senza eguali, i vari operatori logici [AND, OR, NOT o &, |, ^ o &&, ||, o alcuni o tutti questi in modo da non ricordare del tutto la forma giusta da usare], i vari "nomi" per pezzi di metadati come "date:" o "kind:" o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, in pratica ho imparato alcune cose su cui poter contare ma mi chiedo se ci sia qualcuno che potrebbe effettivamente prevedere i risultati esatti di tutti tranne la ricerca più semplice. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. NOT oppure &, |, ^ o &&, || o alcuni o tutti questi, quindi non riesco mai a ricordare la forma giusta da usare], i vari "nomi" per pezzi di metadati come "date:" o "kind : "o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, fondamentalmente ho imparato alcune cose su cui poter contare ma mi chiedo se c'è qualcuno in grado di prevedere i risultati esatti di tutti tranne il più ricerca di base. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. NOT oppure &, |, ^ o &&, || o alcuni o tutti questi, quindi non riesco mai a ricordare la forma giusta da usare], i vari "nomi" per pezzi di metadati come "date:" o "kind : "o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, fondamentalmente ho imparato alcune cose su cui poter contare ma mi chiedo se c'è qualcuno in grado di prevedere i risultati esatti di tutti tranne il più ricerca di base. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. i vari "nomi" per pezzi di metadati come "data:" o "tipo:" o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, in pratica ho imparato alcune cose su cui poter contare ma Mi chiedo se c'è qualcuno che potrebbe effettivamente prevedere i risultati esatti di tutti tranne la ricerca più elementare. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. i vari "nomi" per pezzi di metadati come "data:" o "tipo:" o molti altri, l'elenco completo nascosto alla maggior parte delle capacità degli utenti di trovare) ... beh, in pratica ho imparato alcune cose su cui poter contare ma Mi chiedo se c'è qualcuno che potrebbe effettivamente prevedere i risultati esatti di tutti tranne la ricerca più elementare. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. fondamentalmente ho imparato alcune cose su cui poter contare, ma mi chiedo se ci sia qualcuno che possa effettivamente prevedere i risultati esatti di tutti tranne la ricerca più elementare. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai. fondamentalmente ho imparato alcune cose su cui poter contare, ma mi chiedo se ci sia qualcuno che possa effettivamente prevedere i risultati esatti di tutti tranne la ricerca più elementare. E poi ho eseguito ricerche di base che producono elenchi di file di cui sono sicuro che mancano alcuni file che dovrebbero essere trovati o altri mancanti che dovrebbero essere lì e tuttavia non sono sicuro del perché. A volte dopo il tempo trascorso a fissare i risultati, posso vedere cosa è successo; a volte non lo faccio mai.

Tutto ciò significa che sono anche infastidito da incoerenze per alcuni tipi di ricerche che voglio o voglio dipendere dal fatto di essere completo (poiché penso che tu stia cercando te stesso). D'altra parte, questi stessi strumenti di ricerca sono così essenziali per la facilità d'uso del mio Mac che mi mancherebbero davvero se non fossero disponibili (a volte sono rimasto sorpreso da ciò che avrei potuto trovare, come pezzi più vecchi del mio scrivendo che si trovavano in file che avevano perso i nomi dei file a causa della cancellazione accidentale, ma con alcune parole chiave si potevano trovare rapidamente.) Ho anche visto persone che conosco cercare file su un PC con Windows e pensare: "perché non lo fai? cercarlo e basta? " Poi ricordo come spesso evitavo di usare le funzionalità di ricerca dei file quando Windows era il mio sistema operativo principale.

Credo che le strutture di ricerca di Apple non saranno probabilmente soddisfacenti per ciò che si desidera, almeno se utilizzate "in modo intuitivo". Detto questo, ci sono diversi comandi che possono essere eseguiti usando il terminale che possono consentire di ottenere risultati migliori nel tuo caso, ma che possono essere determinati solo da tentativi ed errori. Il loro valore, tuttavia, può essere nel fornire modi per vedere esattamente quali metadati esistono per alcuni file che ritieni siano esclusi dai risultati di una ricerca e se manca il tipo di dati desiderato o manca un particolare tipo di dati corrispondente o altrimenti. I vari comandi di sistema sono quelli come mdutile mdlsaltri comandi correlati e possibilmente. Di solito corro manper uno di questi, come ad esempio man mdlse quindi fare riferimento ai comandi correlati alla fine della pagina di manuale sotto ilSEE ALSOintestazione. La difficoltà è che la curva di apprendimento può essere ripida a seconda di quanto si desidera approfondire le varie tecniche di ricerca. Spesso l'aspetto più difficile non è sapere come eseguire un tipo di ricerca, ma piuttosto essere in grado di scoprire i vari nomi delle chiavi di ricerca su cui cercare, il che potrebbe richiedere l'esecuzione di altri md…comandi per scaricare determinate chiavi e / o valori del metadati di sistema.

Insieme a tutti i fattori sconosciuti di base c'è sempre la possibilità che il negozio di metadati sia corrotto o non completo e debba essere ricostruito. Inoltre, i metadati vengono estratti dai file man mano che vengono creati o modificati da vari "moduli", ognuno dei quali gestisce alcuni tipi o tipi particolari di estrazione dei metadati. Molti di questi moduli sono forniti da Apple e molti provengono da vari fornitori per consentire l'elaborazione di diversi tipi di file e la raccolta di diversi attributi. Quindi i miei problemi esistono nella raccolta di metadati proprio come potrebbero nelle strutture di ricerca. Ecco dove alcuni comandi di sistema possono aiutare a vedere esattamente cosa c'è che non va nei metadati dei file o in una particolare stringa di query.

Se sei sostanzialmente interessato alla ricerca di file PDF e le funzionalità di ricerca di Adobe soddisfano le tue esigenze, ti suggerirei probabilmente di utilizzarli (o forse altri strumenti di ricerca di terze parti che potrebbero avere una metodologia di ricerca più definita e prevedibile). E usa le funzionalità di ricerca di Apple per ciò che possono aiutare (e in molti casi, nonostante possibilmente non restituisca tutti i file desiderati, può produrre risultati più "fuzzi" che possono aiutare a formare una query migliore da utilizzare in un motore di ricerca alternativo).

Mi dispiace andare avanti senza essere in grado di dare idee più utili, ma spero che parte di ciò che ho detto ti aiuti a decidere un metodo che funzioni per te. (Adoro il mio Mac ... molto probabilmente userà sempre un Mac ... ma a volte penso che Apple non documenti parti di OS X solo quindi non è mai possibile indicare qualcosa e dire che non funziona bene, dal momento che potrebbe funzionare esattamente come era previsto. In realtà non si sa mai con certezza!)


Questo mi ha ricordato un programmatore che usa sempre Python per fare semplici ricerche sul suo computer (OSX o Windows). Funziona e basta. Dice che gli strumenti di ricerca predefiniti dei sistemi operativi sono instabili (come vediamo). Tuttavia, nessuno dei due aveva sviluppato uno strumento in grado di misurare l'efficacia di queste ricerche predefinite nei sistemi operativi. Sto scrivendo i miei documenti come file Tex che hanno solo testo semplice e possono quindi essere indicizzati velocemente. Quindi la decisione di fare una buona ricerca dipende da come lavori. Produco file Tex ma collegi - file WYSIWYG e quindi file PDF. Quindi Python sembra essere un ottimo strumento qui per gli sviluppatori.
Léo Léopold Hertz

Questo è in realtà il più vicino alla ricerca di Python che il mio amico fa stackoverflow.com/questions/2186525/… , nei vecchi Python tuttavia con os.walk.
Léo Léopold Hertz 준영

Ho aperto una domanda più generale su questo qui stackoverflow.com/questions/24533029/… poiché il problema non è così diverso in altri sistemi operativi.
Léo Léopold Hertz

In realtà, sono riuscito a migliorare la mia ricerca locale molte volte scoprendo noindex apple.stackexchange.com/questions/148850/… . Avere un indice troppo grande con documenti errati rende qualsiasi ricerca negativa. Quindi limitare lo spazio è una buona strada da percorrere. Mi piace mdls per vedere le cose.
Léo Léopold Hertz
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.