Come unire 2 List <T> e rimuovere valori duplicati da esso in C #


159

Ho due elenchi Elenco che devo combinare nel terzo elenco e rimuovere i valori duplicati da tali elenchi

Un po 'difficile da spiegare, quindi lasciatemi mostrare un esempio di come appare il codice e cosa voglio come risultato, nell'esempio utilizzo il tipo int non la classe ResultAnalysisFileSql.

first_list = [1, 12, 12, 5]

second_list = [12, 5, 7, 9, 1]

Il risultato della combinazione dei due elenchi dovrebbe risultare in questo elenco: risultante_elenco = [1, 12, 5, 7, 9]

Noterai che il risultato ha il primo elenco, inclusi i suoi due valori "12", e in second_list ha un valore aggiuntivo di 12, 1 e 5.

Classe ResultAnalysisFileSql

[Serializable]
    public partial class ResultAnalysisFileSql
    {
        public string FileSql { get; set; }

        public string PathFileSql { get; set; }

        public List<ErrorAnalysisSql> Errors { get; set; }

        public List<WarningAnalysisSql> Warnings{ get; set; }

        public ResultAnalysisFileSql()
        {

        }

        public ResultAnalysisFileSql(string fileSql)
        {
            if (string.IsNullOrEmpty(fileSql)
                || fileSql.Trim().Length == 0)
            {
                throw new ArgumentNullException("fileSql", "fileSql is null");
            }

            if (!fileSql.EndsWith(Utility.ExtensionFicherosErrorYWarning))
            {
                throw new ArgumentOutOfRangeException("fileSql", "Ruta de fichero Sql no tiene extensión " + Utility.ExtensionFicherosErrorYWarning);
            }

            PathFileSql = fileSql;
            FileSql = ObtenerNombreFicheroSql(fileSql);
            Errors = new List<ErrorAnalysisSql>();
            Warnings= new List<WarningAnalysisSql>();
        }

        private string ObtenerNombreFicheroSql(string fileSql)
        {
            var f = Path.GetFileName(fileSql);
            return f.Substring(0, f.IndexOf(Utility.ExtensionFicherosErrorYWarning));
        }


        public override bool Equals(object obj)
        {
            if (obj == null)
                return false;
            if (!(obj is ResultAnalysisFileSql))
                return false;

            var t = obj as ResultAnalysisFileSql;
            return t.FileSql== this.FileSql
                && t.PathFileSql == this.PathFileSql
                && t.Errors.Count == this.Errors.Count
                && t.Warnings.Count == this.Warnings.Count;
        }


    }

Qualche codice di esempio per combinare e rimuovere duplicati?

Risposte:


288

Hai dato un'occhiata a Enumerable.Union

Questo metodo esclude i duplicati dal set di restituzione . Questo è un comportamento diverso rispetto al metodo Concat, che restituisce tutti gli elementi nelle sequenze di input inclusi i duplicati.

List<int> list1 = new List<int> { 1, 12, 12, 5};
List<int> list2 = new List<int> { 12, 5, 7, 9, 1 };
List<int> ulist = list1.Union(list2).ToList();

// ulist output : 1, 12, 5, 7, 9

6
@Dr TJ: la tua persona Classe implementa IEqualityComparer <T>? In tal caso, dovrai verificare i metodi GetHashCode e Equals. Vedere la sezione Note di msdn.microsoft.com/en-us/library/bb341731.aspx .
Tomas Narros,

1
Importante notare perché ho riscontrato problemi utilizzando questo in 2 raccolte diverse: "Non è possibile unire due tipi diversi, a meno che uno non erediti dall'altro" da stackoverflow.com/a/6884940/410937 che ha prodotto un cannot be inferred from the usageerrore.
atconway

30

perché non semplicemente ad es

var newList = list1.Union(list2)/*.Distinct()*//*.ToList()*/;

oh ... secondo msdn puoi tralasciare il file.Distinct()

Questo metodo esclude i duplicati dal set di restituzione


25

L'unione non ha buone prestazioni: questo articolo descrive come confrontarli insieme

var dict = list2.ToDictionary(p => p.Number);
foreach (var person in list1)
{
        dict[person.Number] = person;
}
var merged = dict.Values.ToList();

Liste e unione LINQ: 4820ms Unione
dizionario: 16ms
HashSet e IEqualityComparer: 20ms
LINQ Union e IEqualityComparer: 24ms


1
Anche un altro vantaggio dell'utilizzo di un'unione di dizionari -> Ho due liste che tornano dai dati DB. E i miei dati hanno un campo timestamp, che è diverso nei due elenchi di dati. Con l'unione ottengo duplicati perché il timestamp è diverso. Ma con l'unione posso decidere quale campo unico voglio considerare nel dizionario. +1
JimSan,

Può variare in base alla velocità del processore, dipende dal tipo di CPU in uso.
Assad Ali,

7
E alla fine dell'articolo dice "Preferisco LINQ Union perché comunica l'intento in modo molto chiaro". ;) (inoltre, c'era solo una differenza di 8 ms)
James Wilkins,

1
Per piccoli elenchi in cui la differenza è trascurabile, si Unionottiene un codice più pulito e più leggibile. Trascorrere del tempo per ottimizzare il codice quando non è lento può comportare una penalità di manutenzione lungo la strada.
elolos,

14

Usa l'unione di Linq:

using System.Linq;
var l1 = new List<int>() { 1,2,3,4,5 };
var l2 = new List<int>() { 3,5,6,7,8 };
var l3 = l1.Union(l2).ToList();

11
    List<int> first_list = new List<int>() {
        1,
        12,
        12,
        5
    };

    List<int> second_list = new List<int>() {
        12,
        5,
        7,
        9,
        1
    };

    var result = first_list.Union(second_list);
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.