Come posso trovare valori duplicati in una tabella in Oracle?


277

Qual è l'istruzione SQL più semplice che restituirà i valori duplicati per una determinata colonna e il conteggio delle loro occorrenze in una tabella del database Oracle?

Ad esempio: ho una JOBStabella con la colonna JOB_NUMBER. Come posso sapere se ho duplicati JOB_NUMBERe quante volte sono duplicati?


Risposte:


610
SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;

1
Grazie - questa è la risposta che ho appena trovato e mi hai battuto per pubblicarlo di nuovo qui! : o)
Andrew,

3
Prego. Ora sto per pubblicare la mia domanda sulle differenze tra count (colonna) e count (*). :)
Bill the Lizard,

44
+1 oltre 4 anni dopo, funziona ancora bene e può essere regolato per selezionare più colonne purché siano presenti anche in group by, come in: select column_one, column_two, count(*) from tablename group by column_one, column_two having count(column_one) > 1;ecc.
Amos M. Carpenter,

4
o anche having count(*) > 1: D
Stanislav Mamontov del

3
+1 oltre 8 anni dopo, funziona ancora bene per entrambe le ultime versioni di Oracle e MySQL (rimuovi la funzione spazio dopo conteggio in linea).
PhatHV,

58

Un altro modo:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Funziona bene (abbastanza veloce) quando è attivo l'indice column_name. Ed è il modo migliore per eliminare o aggiornare le righe duplicate.


3
+1 funziona bene per i duplicati multi-colonna (ad esempio quando si desidera aggiungere un vincolo UNIQUE su più colonne), ho trovato questo approccio meno "rigido" rispetto a GROUP BY uno per elencare i valori dei campi duplicati + altri campi, se necessario.
Frosty Z,

3
Solo per chiarire, (questo non era ovvio per me all'inizio) questa query restituisce solo i duplicati, non restituisce la prima voce originale, motivo per cui funziona bene per l'eliminazione dei duplicati, in base a un vincolo univoco tra più di 1 colonna. È possibile selezionare gli ID duplicati con questa query e quindi utilizzarli per eliminare i duplicati.
Matteo,

1
se cambi <in! = otterrai tutti i record duplicati. non solo il 2o o 3o disco
moore1emu il

33

Il più semplice che mi viene in mente:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

1
Come posso ottenere tutte le colonne?
Asif Mushtaq,

2
seleziona * dai lavori in cui job_number (seleziona job_number dal gruppo di lavori per job_number con conteggio (*)> 1)
JosephStyons,

17

Non è necessario nemmeno avere il conteggio nelle colonne restituite se non è necessario conoscere il numero effettivo di duplicati. per esempio

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

7

Che ne dite di:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Per rispondere all'esempio sopra, sembrerebbe che:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

5

Nel caso in cui più colonne identifichino una riga univoca (ad es. Tabella delle relazioni), è possibile utilizzare quanto segue

Usa id riga, ad esempio emp_dept (empid, deptid, startdate, enddate) supponiamo che empid e deptid siano univoci e identifichi la riga in quel caso

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

e se tale tabella ha una chiave primaria, allora usa la chiave primaria invece di rowid, ad esempio id è pk allora

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

4

fare

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

ti darà gli ID delle righe duplicate.


4
SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 

2

Di solito utilizzo la funzione Oracle Analytic ROW_NUMBER () .

Dire che si desidera controllare i duplicati avete per quanto riguarda un indice univoco o una chiave primaria costruita su colonne ( c1, c2, c3). Quindi andrai in questo modo, portando in primo piano ROWIDs di righe in cui il numero di righe portato ROW_NUMBER()è >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

1

Ecco una richiesta SQL per farlo:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;

1

So che è un vecchio thread, ma questo può aiutare qualcuno.

Se è necessario stampare altre colonne della tabella durante il controllo per un uso duplicato di seguito:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

può anche aggiungere alcuni filtri aggiuntivi nella clausola where, se necessario.


0

1. soluzione

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

Questo poster originale non ha mai menzionato l'eliminazione, contando solo
Jeff

-1

Inoltre puoi provare qualcosa del genere per elencare tutti i valori duplicati in una tabella dire reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.