Abbastanza spesso, ho riscontrato la necessità di elaborare un elenco per coppie. Mi chiedevo quale sarebbe il modo pitonico ed efficiente per farlo, e ho trovato questo su Google:
pairs = zip(t[::2], t[1::2])
Ho pensato che fosse abbastanza pitonico, ma dopo una recente discussione sugli idiomi contro l'efficienza , ho deciso di fare alcuni test:
import time
from itertools import islice, izip
def pairs_1(t):
return zip(t[::2], t[1::2])
def pairs_2(t):
return izip(t[::2], t[1::2])
def pairs_3(t):
return izip(islice(t,None,None,2), islice(t,1,None,2))
A = range(10000)
B = xrange(len(A))
def pairs_4(t):
# ignore value of t!
t = B
return izip(islice(t,None,None,2), islice(t,1,None,2))
for f in pairs_1, pairs_2, pairs_3, pairs_4:
# time the pairing
s = time.time()
for i in range(1000):
p = f(A)
t1 = time.time() - s
# time using the pairs
s = time.time()
for i in range(1000):
p = f(A)
for a, b in p:
pass
t2 = time.time() - s
print t1, t2, t2-t1
Questi erano i risultati sul mio computer:
1.48668909073 2.63187503815 1.14518594742
0.105381965637 1.35109519958 1.24571323395
0.00257992744446 1.46182489395 1.45924496651
0.00251388549805 1.70076990128 1.69825601578
Se li sto interpretando correttamente, ciò dovrebbe significare che l'implementazione di elenchi, indicizzazione di elenchi e affettamento di elenchi in Python è molto efficiente. È un risultato sia confortante che inaspettato.
C'è un altro modo "migliore" di attraversare una lista a coppie?
Nota che se l'elenco ha un numero dispari di elementi, l'ultimo non sarà in nessuna delle coppie.
Quale sarebbe il modo giusto per garantire che tutti gli elementi siano inclusi?
Ho aggiunto questi due suggerimenti dalle risposte ai test:
def pairwise(t):
it = iter(t)
return izip(it, it)
def chunkwise(t, size=2):
it = iter(t)
return izip(*[it]*size)
Questi sono i risultati:
0.00159502029419 1.25745987892 1.25586485863
0.00222492218018 1.23795199394 1.23572707176
Risultati finora
Il più pitonico e molto efficiente:
pairs = izip(t[::2], t[1::2])
Il più efficiente e molto pitonico:
pairs = izip(*[iter(t)]*2)
Mi ci è voluto un momento per capire che la prima risposta utilizza due iteratori mentre la seconda ne utilizza uno solo.
Per trattare sequenze con un numero dispari di elementi, il suggerimento è stato quello di aumentare la sequenza originale aggiungendo un elemento ( None
) che viene accoppiato con l'ultimo elemento precedente, qualcosa che può essere ottenuto con itertools.izip_longest()
.
Finalmente
Nota che, in Python 3.x, zip()
si comporta come itertools.izip()
, e non itertools.izip()
c'è più.
timeit
modulo.