Aggiorna il campo MongoDB usando il valore di un altro campo


372

In MongoDB, è possibile aggiornare il valore di un campo usando il valore di un altro campo? L'equivalente SQL sarebbe simile a:

UPDATE Person SET Name = FirstName + ' ' + LastName

E lo pseudo-codice MongoDB sarebbe:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );

Risposte:


260

Il modo migliore per farlo è in versione 4.2+, che permette di utilizzare di gasdotto aggregazione nel documento di aggiornamento e la updateOne, updateManyo il updatemetodo di raccolta. Si noti che quest'ultimo è stato deprecato nella maggior parte dei driver se non in tutte le lingue.

MongoDB 4.2+

La versione 4.2 ha anche introdotto l' $setoperatore di fase pipeline che è un alias per $addFields. Userò $setqui come mappa con ciò che stiamo cercando di ottenere.

db.collection.<update method>(
    {},
    [
        {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
    ]
)

MongoDB 3.4+

In 3.4+ è possibile utilizzare $addFieldse gli $outoperatori della pipeline di aggregazione.

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": "collection" }
    ]
)

Nota che questo non aggiorna la tua raccolta ma sostituisce invece la raccolta esistente o ne crea una nuova. Anche per le operazioni di aggiornamento che richiedono il "cast di tipo" è necessario l'elaborazione lato client e , a seconda dell'operazione, potrebbe essere necessario utilizzare il find()metodo anziché il .aggreate()metodo.

MongoDB 3.2 e 3.0

Il modo in cui lo facciamo è $projectinging i nostri documenti e utilizzare l' $concatoperatore di aggregazione delle stringhe per restituire la stringa concatenata. noi Da lì, si esegue l'iterazione del cursore e si utilizza l' $setoperatore di aggiornamento per aggiungere il nuovo campo ai documenti utilizzando operazioni in blocco per la massima efficienza.

Query di aggregazione:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2 o successivo

da questo, è necessario utilizzare il bulkWritemetodo

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6 e 3.0

Da questa versione è necessario utilizzare l' BulkAPI ormai obsoleta e i relativi metodi associati .

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})

Penso che ci sia un problema con il codice per "MongoDB 3.2 o versioni successive". Poiché forEach è asincrono, nulla verrà in genere scritto nell'ultimo bulkWrite.
Viktor Hedefalk,

3
4.2+ Non funziona. MongoError: il campo con il dollaro ($) con prefisso "$ concat" in "name. $ Concat" non è valido per l'archiviazione.
Josh Woodcock,

@JoshWoodcock, penso che tu abbia avuto un refuso nella query che stai eseguendo. Ti suggerisco di ricontrollare.
Styvane,

@JoshWoodcock Funziona magnificamente. Per favore prova questo usando MongoDB Web Shell
styvane

2
Per coloro che hanno riscontrato lo stesso problema descritto da @JoshWoodcock: fai attenzione che la risposta per 4.2+ descriva una pipeline di aggregazione , quindi non perdere le parentesi quadre nel secondo parametro!
philsch,

240

Dovresti ripetere. Per il tuo caso specifico:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

4
Cosa succede se un altro utente ha modificato il documento tra find () e save ()?
UpTheCreek,

3
Vero, ma la copia tra i campi non dovrebbe richiedere che le transazioni siano atomiche.
UpTheCreek,

3
È importante notare che save()sostituisce completamente il documento. Dovrebbe usare update()invece.
Carlos,

12
Che ne ditedb.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );
Philipp Jardas

1
Ho creato una funzione chiamata create_guid che produceva una guida univoca per documento solo durante l'iterazione forEachin questo modo (cioè semplicemente usando create_guidin una updatedichiarazione con mutli=truela stessa guida generata per tutti i documenti). Questa risposta ha funzionato perfettamente per me. +1
rmirabelle,

103

Apparentemente c'è un modo per farlo in modo efficiente da MongoDB 3.4, vedi la risposta di Styvane .


Risposta obsoleta di seguito

Non è possibile fare riferimento al documento stesso in un aggiornamento (ancora). Dovrai scorrere i documenti e aggiornare ogni documento usando una funzione. Vedi questa risposta per un esempio o questa per il lato server eval().


31
È ancora valido oggi?
Christian Engel,

3
@ChristianEngel: sembra così. Non sono riuscito a trovare nulla nei documenti MongoDB che menzioni un riferimento al documento corrente in updateun'operazione. Anche questa richiesta di funzionalità correlate è ancora irrisolta.
Niels van der Rest

4
È ancora valido ad aprile 2017? O ci sono già nuove funzionalità che possono farlo?
Kim,

1
@Kim Sembra che sia ancora valido. Inoltre, la richiesta di funzionalità che @ niels-van-der-rest ha sottolineato nel 2013 è ancora in corso OPEN.
Danziger,

8
questa non è più una risposta valida, dai un'occhiata a @styvane answer
aitchkhan

45

Per un database con attività elevate, è possibile che si verifichino problemi in cui i tuoi aggiornamenti influiscono attivamente sulla modifica dei record e per questo motivo ti consiglio di utilizzare lo snapshot ()

db.person.find().snapshot().forEach( function (hombre) {
    hombre.name = hombre.firstName + ' ' + hombre.lastName; 
    db.person.save(hombre); 
});

http://docs.mongodb.org/manual/reference/method/cursor.snapshot/


2
Cosa succede se un altro utente ha modificato la persona tra find () e save ()? Ho un caso in cui è possibile effettuare più chiamate allo stesso oggetto modificandole in base ai loro valori correnti. Il 2 ° utente dovrebbe attendere con la lettura fino a quando il 1 ° non sarà terminato con il salvataggio. Questo ci riesce?
Marco,

4
Informazioni su snapshot(): Deprecated in the mongo Shell since v3.2. Starting in v3.2, the $snapshot operator is deprecated in the mongo shell. In the mongo shell, use cursor.snapshot() instead. link
ppython

10

Per quanto riguarda questa risposta , la funzione snapshot è obsoleta nella versione 3.6, secondo questo aggiornamento . Quindi, sulla versione 3.6 e successive, è possibile eseguire l'operazione in questo modo:

db.person.find().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

9

Di partenza Mongo 4.2 , db.collection.update()può accettare una pipeline di aggregazione, consentendo infine l'aggiornamento / la creazione di un campo basato su un altro campo:

// { firstName: "Hello", lastName: "World" }
db.collection.update(
  {},
  [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
  { multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
  • La prima parte {}è la query di corrispondenza, che filtra i documenti da aggiornare (nel nostro caso tutti i documenti).

  • La seconda parte [{ $set: { name: { ... } }]è la pipeline di aggregazione degli aggiornamenti (notare le parentesi quadre che indicano l'uso di una pipeline di aggregazione). $setè un nuovo operatore di aggregazione e un alias di $addFields.

  • Non dimenticare { multi: true }, altrimenti verrà aggiornato solo il primo documento corrispondente.


8

Ho provato la soluzione di cui sopra ma l'ho trovata inadatta per grandi quantità di dati. Ho quindi scoperto la funzione stream:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})

1
Come è diverso? Il vapore sarà rallentato dall'attività di aggiornamento? Hai qualche riferimento ad esso? I documenti Mongo sono abbastanza poveri.
Nico,

2

Ecco cosa ci è venuto in mente per copiare un campo in un altro per circa 150_000 record. Ci sono voluti circa 6 minuti, ma è ancora significativamente meno dispendioso in termini di risorse rispetto a quanto sarebbe stato per istanziare e iterare sullo stesso numero di oggetti rubini.

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)

1

Con MongoDB versione 4.2+ , gli aggiornamenti sono più flessibili in quanto consente l'utilizzo di gasdotto aggregazione nella sua update, updateOnee updateMany. Ora puoi trasformare i tuoi documenti usando gli operatori di aggregazione, quindi aggiornare senza la necessità di indicare esplicitamente il $setcomando (invece usiamo$replaceRoot: {newRoot: "$$ROOT"} )

Qui usiamo la query aggregata per estrarre il timestamp dal campo "_id" ObjectID di MongoDB e aggiornare i documenti (non sono un esperto in SQL ma penso che SQL non fornisca alcun ObjectID generato automaticamente che abbia il timestamp, dovresti crea automaticamente quella data)

var collection = "person"

agg_query = [
    {
        "$addFields" : {
            "_last_updated" : {
                "$toDate" : "$_id"
            }
        }
    },
    {
        $replaceRoot: {
            newRoot: "$$ROOT"
        } 
    }
]

db.getCollection(collection).updateMany({}, agg_query, {upsert: true})

Non hai bisogno { $replaceRoot: { newRoot: "$$ROOT" } }; significa sostituire il documento da solo, il che è inutile. Se si sostituisce $addFieldscon il suo alias $sete per updateManyquale è uno degli alias update, si arriva alla stessa identica risposta di questo sopra.
Xavier Guihot,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.