Come aggiungere una nuova riga a una matrice numpy vuota


158

Utilizzando array Python standard, posso fare quanto segue:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

Tuttavia, non posso fare la stessa cosa in numpy. Per esempio:

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

Ho anche esaminato vstack, ma quando uso vstacksu un array vuoto, ottengo:

ValueError: all the input array dimensions except for the concatenation axis must match exactly

Quindi, come faccio ad aggiungere una nuova riga a un array vuoto in numpy?


1
Se è vuoto, perché preoccuparsi? Inizia da un array che contiene solo la prima riga.
jonrsharpe,

10
Voglio solo sapere se è possibile aggiungere a un array numpy vuoto. A volte è più pulito scrivere codice in questo modo poiché le operazioni di aggiunta sono in un ciclo.
Tony Stark,

5
Dato il modo in cui le matrici NumPy lavoro, siete molto meglio costruire un array vuoto poi mettere i dati in, ad esempio See stackoverflow.com/questions/568962/...
jonrsharpe

Risposte:


228

Il modo per "avviare" l'array desiderato è:

arr = np.empty((0,3), int)

Che è un array vuoto ma ha la giusta dimensionalità.

>>> arr
array([], shape=(0, 3), dtype=int64)

Quindi assicurarsi di aggiungere lungo l'asse 0:

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

Ma @jonrsharpe ha ragione. In effetti, se stai per aggiungere in un ciclo, sarebbe molto più veloce aggiungere a un elenco come nel tuo primo esempio, quindi convertire in un array numpy alla fine, poiché non stai davvero usando numpy come inteso durante il ciclo:

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

Il modo numpythonic per farlo dipende dalla tua applicazione, ma sarebbe più simile a:

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True

cosa succede se devo farlo 10 ^ 5 o 10 ^ 6 volte? sembra che nessuno di questi metodi sarà valido. qualche suggerimento?
Rho Phi,

@Roberto, di solito c'è un modo per determinare in anticipo la dimensione o la forma (almeno i valori sarebbero preferibili) dell'array. Pensi di poterlo fare? L'aggiunta dovrebbe essere un'operazione una o due volte.
askewchan,

a volte non puoi indovinare le dimensioni, è la vita. Tuttavia, è possibile allocare un array abbastanza grande e dare valori alle sue viste. Non mi piace però, perché ci sono valori indesiderati che bisogna trovare un modo per "mascherare". Questa idea di mascherare non soddisfa davvero i miei gusti.
Rho Phi,

Non c'è bisogno di mascherare, basta tagliare! a = a[:N] Anche se credo fermamente che dovresti trovare un modo per vettorializzarlo (pubblica una nuova domanda con i tuoi dettagli se hai bisogno di aiuto) o semplicemente usa le liste fino alla fine del ciclo.
askewchan,

29

Ecco la mia soluzione:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
np_arr = np.array(arr)

L'array risultante ha un tipo di oggetto, che in alcuni casi non è accettabile
zer0fool

26

In questo caso potresti voler usare le funzioni np.hstack e np.vstack

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]

È inoltre possibile utilizzare la funzione np.concatenate.

Saluti


7
Non funzionerà se il secondo array ha dimensione> = 2 simili ((2, 2)). Mi sembra che non ci sia modo di evitare casi limite se si stanno costruendo array da vuoto mediante concatenazione.
Taozi,

Non è una buona soluzione in quanto è necessario controllare la dimensione ogni volta.
SKR,

1

usando una definizione di tipo personalizzato, ciò che ha funzionato per me è stato:

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])

1

In caso di aggiunta di nuove righe per array in loop, assegnare direttamente l'array per la prima volta in loop anziché inizializzare un array vuoto.

for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

Ciò è utile soprattutto quando la forma dell'array è sconosciuta


0

Voglio fare un ciclo for, ma con il metodo askewchan non funziona bene, quindi l'ho modificato.

x=np.empty((0,3))
y=np.array([1 2 3])
for i in ...
x = vstack((x,y))
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.