Per prima cosa ho creato io stesso un'espressione regolare che corrisponderà a tutti i percorsi di libreria esterna univoci in un elenco di tutti i file di intestazione in un progetto. Ho posto una domanda sulla creazione di quella regexp una settimana fa.
Ho iniziato a immischiarmi per vedere come si sarebbe comportato quando era asincrono e quando si trasformava in un web worker. Per comodità e affidabilità ho creato questo file universale che funziona in tutte e tre le modalità:
/** Will call result() callback with every match it founds. Asynchronous unless called
* with interval = -1.
* Javadoc style comment for Arnold Rimmer and other Java programmers:
*
* @param regex regular expression to match in string
* @param string guess what
* @param result callback function that accepts one parameter, string match
* @param done callback on finish, has no parameters
* @param interval delay (not actual interval) between finding matches. If -1,
* function will be blocking
* @property working false if loop isn't running, otherwise contains timeout ID
* for use with clearTimeout
* @property done copy of done parameter
* @throws heavy boulders
**/
function processRegex(regex, string, result, done, interval) {
var m;
//Please tell me interpreter optimizes this
interval = typeof interval!='number'?1:interval;
//And this
processRegex.done = done;
while ((m = regex.exec(string))) {
Array.prototype.splice.call(m,0,1);
var path = m.join("");
//It's good to keep in mind that result() slows down the process
result(path);
if (interval>=0) {
processRegex.working = setTimeout(processRegex,
interval, regex, string,
result, done, interval);
// Comment these out for maximum speed
processRegex.progress = regex.lastIndex/string.length;
console.log("Progress: "+Math.round(processRegex.progress*100)+"%");
return;
}
}
processRegex.working = false;
processRegex.done = null;
if (typeof done=="function")
done();
}
processRegex.working = false;
Ho creato un file di prova, invece di incollarlo qui l'ho caricato su un web hosting molto affidabile: Demo - Dati di prova .
Quello che trovo molto sorprendente è che c'è una differenza così significativa tra il web worker e l'esecuzione del browser di RegExp. I risultati che ho ottenuto:
- Mozilla Firefox
[WORKER]: Time elapsed:16.860s
[WORKER-SYNC]: Time elapsed:16.739s
[TIMEOUT]: Time elapsed:5.186s
[LOOP]: Time elapsed:5.028s
Puoi anche vedere che con la mia particolare espressione regolare, la differenza tra un ciclo sincrono e un ciclo asincrono è insignificante. Ho provato a utilizzare un elenco di corrispondenze invece di un'espressione di lookahead ei risultati sono cambiati molto. Ecco le modifiche alla vecchia funzione:
function processRegexUnique(regex, string, result, done, interval) {
var matchList = arguments[5]||[];
... same as before ...
while ((m = regex.exec(string))) {
... same as before ...
if (matchList.indexOf(path)==-1) {
result(path);
matchList.push(path);
}
if (interval>=0) {
processRegex.working = setTimeout(processRegex, interval,
regex, string, result,
done, interval, matchList);
... same as before ...
}
}
... same as before ...
}
E i risultati:
- Mozilla Firefox
[WORKER]: Time elapsed:0.062s
[WORKER-SYNC]: Time elapsed:0.023s
[TIMEOUT]: Time elapsed:12.250s
(nota a me stesso: sta diventando più strano ogni minuto)[LOOP]: Time elapsed:0.006s
Qualcuno può spiegare una tale differenza di velocità?