Usando Pillow (che funziona con Python 3.X e Python 2.7+), puoi fare quanto segue:
from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())
Ora hai tutti i valori di pixel. Se è RGB o è possibile leggere un'altra modalità im.mode
. Quindi puoi ottenere pixel (x, y)
:
pixel_values[width*y+x]
In alternativa, puoi usare Numpy e rimodellare l'array:
>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18 18 12]
Una soluzione completa e semplice da usare è
# Third party modules
import numpy
from PIL import Image
def get_image(image_path):
"""Get a numpy array of an image so that one can access values[x][y]."""
image = Image.open(image_path, "r")
width, height = image.size
pixel_values = list(image.getdata())
if image.mode == "RGB":
channels = 3
elif image.mode == "L":
channels = 1
else:
print("Unknown mode: %s" % image.mode)
return None
pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
return pixel_values
image = get_image("gradient.png")
print(image[0])
print(image.shape)
Fumo testare il codice
Potresti essere incerto sull'ordine di larghezza / altezza / canale. Per questo motivo ho creato questo gradiente:
L'immagine ha una larghezza di 100 px e un'altezza di 26 px. Ha una sfumatura di colore che va da #ffaa00
(giallo) a #ffffff
(bianco). L'output è:
[[255 172 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 171 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 172 5]
[255 172 5]
[255 171 5]
[255 171 5]
[255 172 4]
[255 172 5]
[255 171 5]
[255 171 5]
[255 172 5]]
(100, 26, 3)
Cose da notare:
- La forma è (larghezza, altezza, canali)
- La
image[0]
, da qui la prima fila, ha 26 triple dello stesso colore