PostgreSQL unest () con numero di elemento


90

Quando ho una colonna con valori separati, posso usare la unnest()funzione:

myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id, unnest(string_to_array(elements, ',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

Come posso includere i numeri degli elementi? Cioè:

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

Voglio la posizione originale di ogni elemento nella stringa di origine. Ho provato con le funzioni della finestra ( row_number(), rank()ecc.) Ma ottengo sempre 1. Forse perché sono nella stessa riga della tabella di origine?

So che è un cattivo design del tavolo. Non è mio, sto solo cercando di aggiustarlo.

Risposte:


184

Postgres 9.4 o successivo

Utilizzare WITH ORDINALITYper funzioni di restituzione di set:

Quando una funzione nella FROMclausola ha il suffisso da WITH ORDINALITY, bigintviene aggiunta una colonna all'output che inizia da 1 e aumenta di 1 per ogni riga dell'output della funzione. Ciò è particolarmente utile nel caso di funzioni di restituzione di set come unnest().

In combinazione con la LATERALfunzionalità in pg 9.3+ e secondo questo thread su pgsql-hackers , la query sopra può ora essere scritta come:

SELECT t.id, a.elem, a.nr
FROM   tbl AS t
LEFT   JOIN LATERAL unnest(string_to_array(t.elements, ','))
                    WITH ORDINALITY AS a(elem, nr) ON TRUE;

LEFT JOIN ... ON TRUEconserva tutte le righe nella tabella di sinistra, anche se l'espressione di tabella a destra non restituisce alcuna riga. Se questo non ti preoccupa, puoi usare questa forma altrimenti equivalente, meno prolissa con un implicito CROSS JOIN LATERAL:

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);

O più semplice se basato su un array effettivo ( arressendo una colonna di array):

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);

O anche, con una sintassi minima:

SELECT id, a, ordinality
FROM   tbl, unnest(arr) WITH ORDINALITY a;

aè automaticamente un alias di tabella e colonna. Il nome predefinito della colonna di ordinalità aggiunta è ordinality. Ma è meglio (più sicuro, più pulito) aggiungere alias di colonna espliciti e colonne qualificate per tabella.

Postgres 8.4 - 9.3

Con row_number() OVER (PARTITION BY id ORDER BY elem)si ottengono i numeri in base all'ordinamento, non il numero ordinale della posizione ordinale originale nella stringa.

Puoi semplicemente omettere ORDER BY:

SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;

Anche se normalmente funziona e non l'ho mai visto fallire in query semplici, PostgreSQL non afferma nulla riguardo all'ordine delle righe senza ORDER BY. Capita di funzionare a causa di un dettaglio di implementazione.

Per garantire numeri ordinali di elementi nella stringa separata da spazi :

SELECT id, arr[nr] AS elem, nr
FROM  (
   SELECT *, generate_subscripts(arr, 1) AS nr
   FROM  (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
   ) sub;

O più semplice se basato su un array reale :

SELECT id, arr[nr] AS elem, nr
FROM  (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;

Risposta correlata su dba.SE:

Postgres 8.1 - 8.4

Nessuna di queste funzioni sono disponibili, tuttavia: RETURNS TABLE, generate_subscripts(), unnest(), array_length(). Ma funziona:

CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

Si noti in particolare che l'indice dell'array può differire dalle posizioni ordinali degli elementi. Considera questa demo con una funzione estesa :

CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

SELECT id, arr, (rec).*
FROM  (
   SELECT *, f_unnest_ord_idx(arr) AS rec
   FROM  (VALUES (1, '{a,b,c}'::text[])  --  short for: '[1:3]={a,b,c}'
               , (2, '[5:7]={a,b,c}')
               , (3, '[-9:-7]={a,b,c}')
      ) t(id, arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,b,c}         | a   |          1 |   1
  1 | {a,b,c}         | b   |          2 |   2
  1 | {a,b,c}         | c   |          3 |   3
  2 | [5:7]={a,b,c}   | a   |          1 |   5
  2 | [5:7]={a,b,c}   | b   |          2 |   6
  2 | [5:7]={a,b,c}   | c   |          3 |   7
  3 | [-9:-7]={a,b,c} | a   |          1 |  -9
  3 | [-9:-7]={a,b,c} | b   |          2 |  -8
  3 | [-9:-7]={a,b,c} | c   |          3 |  -7

Confrontare:


10
Questa risposta è una delle risposte più complete in SO, riguardo a PostgreSQL. Grazie Erwin.
Alexandros

Possiamo adattare la funzione Unest2 di seguito a un ritorno di tabella reale (non righe false), nelle nuove versioni di pg?
Peter Krauss

@ erwin-brandstetter, potresti spiegare perché / se WITH ORDINALITYè preferibile generate_subscripts()? Mi sembra che generate_subscripts()sia migliore in quanto mostra l'effettiva posizione dell'elemento nell'array. Questo è utile, ad esempio, quando aggiorno l'array ... dovrei usare WITH ORDINALITYinvece?
losthorse

1
@losthorse: lo descriverei in questo modo: WITH ORDINALITYè la soluzione generale per ottenere i numeri di riga per qualsiasi funzione di restituzione di un set in una query SQL. È il modo più veloce e affidabile e funziona perfettamente anche per array monodimensionali basati su 1 (il valore predefinito per gli array Postgres, considera questo ). Se lavori con qualsiasi altro tipo di array (la maggior parte delle persone non lo fa) e hai effettivamente bisogno di preservare / lavorare con i pedici originali, allora generate_subscripts()è la strada da percorrere. Ma si unnest()appiattisce tutto per cominciare ...
Erwin Brandstetter

1
@ z0r_ Il manuale: Table functions appearing in FROM can also be preceded by the key word LATERAL, but for functions the key word is optional; the function's arguments can contain references to columns provided by preceding FROM items in any case.
Erwin Brandstetter

9

Provare:

select v.*, row_number() over (partition by id order by elem) rn from
(select
    id,
    unnest(string_to_array(elements, ',')) AS elem
 from myTable) v

6

Usa funzioni di generazione di pedici .
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS

Per esempio:

SELECT 
  id
  , elements[i] AS elem
  , i AS nr
FROM
  ( SELECT 
      id
      , elements
      , generate_subscripts(elements, 1) AS i
    FROM
      ( SELECT
          id
          , string_to_array(elements, ',') AS elements
        FROM
          myTable
      ) AS foo
  ) bar
;

Più semplicemente:

SELECT
  id
  , unnest(elements) AS elem
  , generate_subscripts(elements, 1) AS nr
FROM
  ( SELECT
      id
      , string_to_array(elements, ',') AS elements
    FROM
      myTable
  ) AS foo
;

3

Se l'ordine degli elementi non è importante, puoi farlo

select 
  id, elem, row_number() over (partition by id) as nr
from (
  select
      id,
      unnest(string_to_array(elements, ',')) AS elem
  from myTable
) a

0

unnest2() come esercizio

Le versioni precedenti prima di pg v8.4 necessitano di un file definito dall'utente unnest(). Possiamo adattare questa vecchia funzione per restituire elementi con un indice:

CREATE FUNCTION unnest2(anyarray)
  RETURNS setof record  AS
$BODY$
  SELECT $1[i], i
  FROM   generate_series(array_lower($1,1),
                         array_upper($1,1)) i;
$BODY$ LANGUAGE sql IMMUTABLE;

2
Questo non funzionerebbe prima di pg v8.4, perché non esiste RETURNS TABLEancora. Ho aggiunto un capitolo alla mia risposta discutendo una soluzione.
Erwin Brandstetter

1
@ErwinBrandstetter, le tue risposte sono molto didattiche e stai lucidando un testo di 4 anni fa (!) ... Stai scrivendo un libro PostgreSQL usando i tuoi testi SO? :-)
Peter Krauss

Ciao a tutti, è un Wiki, puoi modificare (!) ... Ma ok, ho corretto setof record.
Peter Krauss
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.