Ecco come risolvere il tuo problema.
select
regexp_replace(
'2,2,2.1,3,3,3,3,4,4'
,'([^,]+)(,\1)*(,|$)', '\1\3')
from dual
ritorna
2,2.1,3,4
È costruito nell'oracolo del XIX sec., Vedi qui
Dal XVIII secolo in poi, prova all'interno del gruppo vedi qui
Altrimenti usa espressioni regolari
RISPOSTA di seguito:
select col1,
regexp_replace(
listagg(
col2 , ',') within group (order by col2) -- sorted
,'([^,]+)(,\1)*(,|$)', '\1\3') )
from tableX
where rn = 1
group by col1;
Nota: quanto sopra funzionerà nella maggior parte dei casi: l'elenco dovrebbe essere ordinato, potrebbe essere necessario tagliare tutto lo spazio iniziale e finale a seconda dei dati.
Se hai molti elementi in un gruppo> 20 o stringhe di grandi dimensioni, potresti incappare nel limite di dimensione della stringa Oracle "il risultato della concatenazione di stringhe è troppo lungo".
Da Oracle 12cR2 puoi sopprimere questo errore vedi qui . In alternativa, inserisci un numero massimo di membri in ogni gruppo. Funzionerà solo se è consentito elencare solo i primi membri. Se hai stringhe variabili molto lunghe, questo potrebbe non funzionare. dovrai sperimentare.
select col1,
case
when count(col2) < 100 then
regexp_replace(
listagg(col2, ',') within group (order by col2)
,'([^,]+)(,\1)*(,|$)', '\1\3')
else
'Too many entries to list...'
end
from sometable
where rn = 1
group by col1;
Un'altra soluzione (non così semplice) per evitare, si spera, il limite di dimensione della stringa Oracle: la dimensione della stringa è limitata a 4000. Grazie a questo post qui di user3465996
select col1 ,
dbms_xmlgen.convert( -- HTML decode
dbms_lob.substr( -- limit size to 4000 chars
ltrim( -- remove leading commas
REGEXP_REPLACE(REPLACE(
REPLACE(
XMLAGG(
XMLELEMENT("A",col2 )
ORDER BY col2).getClobVal(),
'<A>',','),
'</A>',''),'([^,]+)(,\1)*(,|$)', '\1\3'),
','), -- remove leading XML commas ltrim
4000,1) -- limit to 4000 string size
, 1) -- HTML.decode
as col2
from sometable
where rn = 1
group by col1;
V1 - alcuni casi di test - FYI
regexp_replace('2,2,2.1,3,3,4,4','([^,]+)(,\1)+', '\1')
-> 2.1,3,4 Fail
regexp_replace('2 ,2 ,2.1,3 ,3 ,4 ,4 ','([^,]+)(,\1)+', '\1')
-> 2 ,2.1,3,4 Success - fixed length items
V2 -items contenuti all'interno di elementi es. 2,21
regexp_replace('2.1,1','([^,]+)(,\1)+', '\1')
-> 2.1 Fail
regexp_replace('2 ,2 ,2.1,1 ,3 ,4 ,4 ','(^|,)(.+)(,\2)+', '\1\2')
-> 2 ,2.1,1 ,3 ,4 -- success - NEW regex
regexp_replace('a,b,b,b,b,c','(^|,)(.+)(,\2)+', '\1\2')
-> a,b,b,c fail!
v3 - regex grazie Igor! funziona in tutti i casi.
select
regexp_replace('2,2,2.1,3,3,4,4','([^,]+)(,\1)*(,|$)', '\1\3') ,
---> 2,2.1,3,4 works
regexp_replace('2.1,1','([^,]+)(,\1)*(,|$)', '\1\3'),
--> 2.1,1 works
regexp_replace('a,b,b,b,b,c','([^,]+)(,\1)*(,|$)', '\1\3')
---> a,b,c works
from dual