Controlla se esiste la chiave e itera l'array JSON usando Python


130

Ho un sacco di dati JSON da post di Facebook come quello qui sotto:

{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}

I dati JSON sono semi-strutturati e non sono tutti uguali. Di seguito è il mio codice:

import json 

str = '{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}'
data = json.loads(str)

post_id = data['id']
post_type = data['type']
print(post_id)
print(post_type)

created_time = data['created_time']
updated_time = data['updated_time']
print(created_time)
print(updated_time)

if data.get('application'):
    app_id = data['application'].get('id', 0)
    print(app_id)
else:
    print('null')

#if data.get('to'):
#... This is the part I am not sure how to do
# Since it is in the form "to": {"data":[{"id":...}]}

Voglio che il codice stampi to_id come 1543 altrimenti stampa 'null'

Non sono sicuro di come farlo.

Risposte:


162
import json

jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    if 'to' not in data:
        raise ValueError("No target in given data")
    if 'data' not in data['to']:
        raise ValueError("No data for target")

    for dest in data['to']['data']:
        if 'id' not in dest:
            continue
        targetId = dest['id']
        print("to_id:", targetId)

Produzione:

In [9]: getTargetIds(s)
to_id: 1543

6
Perché questi incontrolli espliciti e raisese mancano? Basta accedervi senza controllare e otterrai esattamente lo stesso comportamento (tranne con un KeyErrorinvece di a ValueError).
abarnert,

101

Se tutto ciò che vuoi è verificare se la chiave esiste o meno

h = {'a': 1}
'b' in h # returns False

Se si desidera verificare se esiste un valore per chiave

h.get('b') # returns None

Restituisce un valore predefinito se manca il valore effettivo

h.get('b', 'Default value')

restituirà 'null' e non 'Valore predefinito' come previsto per b in caso di {'a': 1, 'b': null}
MikeL

16

È buona norma creare metodi di utilità di supporto per cose del genere in modo che ogni volta che è necessario modificare la logica della convalida degli attributi sia in un unico posto e il codice sia più leggibile per i follower.

Ad esempio, creare un metodo helper (o classe JsonUtilscon metodi statici) in json_utils.py:

def get_attribute(data, attribute, default_value):
    return data.get(attribute) or default_value

e poi usalo nel tuo progetto:

from json_utils import get_attribute

def my_cool_iteration_func(data):

    data_to = get_attribute(data, 'to', None)
    if not data_to:
        return

    data_to_data = get_attribute(data_to, 'data', [])
    for item in data_to_data:
        print('The id is: %s' % get_attribute(item, 'id', 'null'))

NOTA IMPORTANTE:

C'è un motivo che sto usando data.get(attribute) or default_valueanziché semplicemente data.get(attribute, default_value):

{'my_key': None}.get('my_key', 'nothing') # returns None
{'my_key': None}.get('my_key') or 'nothing' # returns 'nothing'

Nelle mie applicazioni ottenere l'attributo con valore "null" equivale a non ottenere affatto l'attributo. Se l'utilizzo è diverso, è necessario modificarlo.


4
jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}, {"name": "Joe Schmoe"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        print("to_id:", dest.get('id', 'null'))

Provalo:

>>> getTargetIds(jsonData)
to_id: 1543
to_id: null

In alternativa, se si desidera semplicemente ignorare i valori mancanti id invece di stampare 'null':

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        if 'id' in to_id:
            print("to_id:", dest['id'])

Così:

>>> getTargetIds(jsonData)
to_id: 1543

Ovviamente nella vita reale, probabilmente non vuoi printogni ID, ma conservarli e fare qualcosa con loro, ma questo è un altro problema.



4

Ho scritto una piccola funzione per questo scopo. Sentiti libero di riutilizzare,

def is_json_key_present(json, key):
    try:
        buf = json[key]
    except KeyError:
        return False

    return True
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.