Simulazione della funzione MySQL di group_concat in Microsoft SQL Server 2005?


347

Sto cercando di migrare un'app basata su MySQL su Microsoft SQL Server 2005 (non per scelta, ma è la vita).

Nell'app originale, abbiamo usato quasi interamente le dichiarazioni conformi ANSI-SQL, con un'eccezione significativa: abbiamo usato la group_concatfunzione di MySQL abbastanza frequentemente.

group_concat, a proposito, lo fa: data una tabella di, diciamo, nomi e progetti dei dipendenti ...

SELECT empName, projID FROM project_members;

ritorna:

ANDY   |  A100
ANDY   |  B391
ANDY   |  X010
TOM    |  A100
TOM    |  A510

... ed ecco cosa ottieni con group_concat:

SELECT 
    empName, group_concat(projID SEPARATOR ' / ') 
FROM 
    project_members 
GROUP BY 
    empName;

ritorna:

ANDY   |  A100 / B391 / X010
TOM    |  A100 / A510

Quindi quello che vorrei sapere è: è possibile scrivere, per esempio, una funzione definita dall'utente in SQL Server che emula la funzionalità di group_concat?

Non ho quasi esperienza con UDF, stored procedure o cose del genere, solo SQL diretto, quindi per favore sbagli sul lato di troppe spiegazioni :)



Questa è una vecchia domanda, ma mi piace la soluzione CLR qui fornita .
Diego,

possibile duplicato di Come posso creare un elenco separato da virgole usando una query SQL? - quel post è più ampio, quindi sceglierei quello come canonico
TMS


Come fai a sapere in quale ordine deve essere creato l'elenco, ad esempio se mostri A100 / B391 / X010 ma dato che non esiste un ordine implicito in un database relazionale, potrebbe essere altrettanto facilmente X010 / A100 / B391 o qualsiasi altra combinazione.
Steve Ford,

Risposte:


174

Nessun vero modo semplice per farlo. Molte idee là fuori, però.

Il migliore che ho trovato :

SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
    SELECT column_name + ','
    FROM information_schema.columns AS intern
    WHERE extern.table_name = intern.table_name
    FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;

O una versione che funziona correttamente se i dati potrebbero contenere caratteri come <

WITH extern
     AS (SELECT DISTINCT table_name
         FROM   INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
       LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM   extern
       CROSS APPLY (SELECT column_name + ','
                    FROM   INFORMATION_SCHEMA.COLUMNS AS intern
                    WHERE  extern.table_name = intern.table_name
                    FOR XML PATH(''), TYPE) x (column_names)
       CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names) 

1
Questo esempio ha funzionato per me, ma ho provato a fare un'altra aggregazione e non ha funzionato, mi ha dato un errore: "il nome di correlazione 'pre_trimmed' è specificato più volte in una clausola FROM".
PhilChuang,

7
'pre_trimmed' è solo un alias per la subquery. Gli alias sono richiesti per le subquery e devono essere univoci, quindi per un'altra subquery cambiarlo in qualcosa di unico ...
Koen

2
puoi mostrare un esempio senza table_name come il nome di una colonna è confuso.
S.Mason,

169

Potrei essere un po 'in ritardo alla festa, ma questo metodo funziona per me ed è più facile del metodo COALESCE.

SELECT STUFF(
             (SELECT ',' + Column_Name 
              FROM Table_Name
              FOR XML PATH (''))
             , 1, 1, '')

1
Questo mostra solo come concatenare i valori: group_concat li concatena per gruppo, il che è più impegnativo (e ciò che l'OP sembra richiedere). Vedi la risposta accettata a SO 15154644 per come fare - la clausola WHERE è l'aggiunta critica
DJDave


51

Forse troppo tardi per essere di beneficio ora, ma non è questo il modo più semplice per fare le cose?

SELECT     empName, projIDs = replace
                          ((SELECT Surname AS [data()]
                              FROM project_members
                              WHERE  empName = a.empName
                              ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM         project_members a
WHERE     empName IS NOT NULL
GROUP BY empName

Interessante. Ho già finito il progetto a portata di mano, ma proverò questo metodo. Grazie!
DanM,

7
Bel trucco - l'unico problema è che per i cognomi con spazi sostituirà lo spazio con il separatore.
Mark Elliot,

Ho riscontrato un problema del genere, Mark. Sfortunatamente, fino a quando MSSQL non si adegua ai tempi e introduce GROUP_CONCAT, questo è l'ultimo dei metodi ad alta intensità di risorse che sono stato in grado di elaborare per ciò che è necessario qui.
J Hardiman,

Grazie per questo! Ecco un SQL Fiddle che mostra che funziona: sqlfiddle.com/#!6/c5d56/3
fuggì il

42

SQL Server 2017 introduce una nuova funzione aggregata

STRING_AGG ( expression, separator).

Concatena i valori delle espressioni di stringa e posiziona tra loro i valori di separazione. Il separatore non viene aggiunto alla fine della stringa.

Gli elementi concatenati possono essere ordinati aggiungendo WITHIN GROUP (ORDER BY some_expression)

Per le versioni 2005-2016 di solito utilizzo il metodo XML nella risposta accettata.

Questo può fallire in alcune circostanze comunque. ad es. se i dati da concatenare contengono CHAR(29), vedi

FOR XML non ha potuto serializzare i dati ... perché contiene un carattere (0x001D) che non è consentito in XML.

Un metodo più efficace in grado di gestire tutti i caratteri sarebbe quello di utilizzare un aggregato CLR. Tuttavia, applicare questo ordinamento agli elementi concatenati è più difficile con questo approccio.

Il metodo di assegnazione a una variabile non è garantito e dovrebbe essere evitato nel codice di produzione.


Questo è disponibile anche ora in Azure SQL: azure.microsoft.com/en-us/roadmap/…
Simon_Weaver

34

Dai un'occhiata al progetto GROUP_CONCAT su Github, penso di fare esattamente quello che stai cercando:

Questo progetto contiene una serie di funzioni aggregate definite dall'utente SQLCLR (SQLCLR UDA) che offrono collettivamente funzionalità simili alla funzione MySQL GROUP_CONCAT. Esistono più funzioni per garantire le migliori prestazioni in base alla funzionalità richiesta ...


2
@MaxiWheat: molti ragazzi non leggono le domande o rispondono con attenzione prima di fare clic per votare. Colpisce direttamente i post dei proprietari a causa del loro errore.
Steve Lam,

Funziona alla grande. L'unica caratteristica che mi manca è la possibilità di ordinare una colonna che MySQL group_concat () può piacere:GROUP_CONCAT(klascode,'(',name,')' ORDER BY klascode ASC SEPARATOR ', ')
gen

10

Per concatenare tutti i nomi dei project manager dai progetti che hanno più project manager scrivere:

SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v 
where a.project_id=project_id
 FOR
 XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name

9

Con il codice seguente devi impostare PermissionLevel = External sulle proprietà del tuo progetto prima di distribuirlo e modificare il database in modo da considerare attendibile il codice esterno (assicurati di leggere altrove sui rischi per la sicurezza e le alternative [come i certificati]) eseguendo "ALTER DATABASE database_name SET TRUSTWORTHY ON ".

using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
    public struct CommaDelimit : IBinarySerialize
{


[Serializable]
 private class StringList : List<string>
 { }

 private StringList List;

 public void Init()
 {
  this.List = new StringList();
 }

 public void Accumulate(SqlString value)
 {
  if (!value.IsNull)
   this.Add(value.Value);
 }

 private void Add(string value)
 {
  if (!this.List.Contains(value))
   this.List.Add(value);
 }

 public void Merge(CommaDelimit group)
 {
  foreach (string s in group.List)
  {
   this.Add(s);
  }
 }

 void IBinarySerialize.Read(BinaryReader reader)
 {
    IFormatter formatter = new BinaryFormatter();
    this.List = (StringList)formatter.Deserialize(reader.BaseStream);
 }

 public SqlString Terminate()
 {
  if (this.List.Count == 0)
   return SqlString.Null;

  const string Separator = ", ";

  this.List.Sort();

  return new SqlString(String.Join(Separator, this.List.ToArray()));
 }

 void IBinarySerialize.Write(BinaryWriter writer)
 {
  IFormatter formatter = new BinaryFormatter();
  formatter.Serialize(writer.BaseStream, this.List);
 }
    }

Ho provato questo usando una query che assomiglia a:

SELECT 
 dbo.CommaDelimit(X.value) [delimited] 
FROM 
 (
  SELECT 'D' [value] 
  UNION ALL SELECT 'B' [value] 
  UNION ALL SELECT 'B' [value] -- intentional duplicate
  UNION ALL SELECT 'A' [value] 
  UNION ALL SELECT 'C' [value] 
 ) X 

E rese: A, B, C, D


9

Ho provato questi, ma per i miei scopi in MS SQL Server 2005 è stato molto utile quanto segue, che ho trovato su xaprb

declare @result varchar(8000);

set @result = '';

select @result = @result + name + ' '

from master.dbo.systypes;

select rtrim(@result);

@Mark come hai detto è stato il personaggio spaziale a causare problemi per me.


Penso che il motore non garantisca realmente alcun ordine con questo metodo, perché le variabili vengono calcolate come flussi di dati a seconda del piano exec. Tuttavia sembra funzionare quasi sempre.
phil_w,

6

Sulla risposta di J Hardiman, che ne dici di:

SELECT empName, projIDs=
  REPLACE(
    REPLACE(
      (SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')), 
      ' ', 
      ' / '), 
    '-somebody-puts-microsoft-out-of-his-misery-please-',
    ' ') 
  FROM project_members a WHERE empName IS NOT NULL GROUP BY empName

A proposito, l'uso del "cognome" è un refuso o non sto capendo un concetto qui?

Comunque, grazie ragazzi perché mi ha fatto risparmiare un bel po 'di tempo :)


1
Piuttosto una risposta ostile se me lo chiedi e per niente utile come risposta.
Tim Meers,

1
vedendolo solo ora ... Non intendevo in senso cattivo, all'epoca ero molto frustrato dal server sql (lo sono ancora). le risposte a questo post sono state davvero utili; EDIT: perché non è stato utile tra l'altro? ha fatto il trucco per me
user422190

1

Per i miei compagni Googler, ecco una soluzione plug-and-play molto semplice che ha funzionato per me dopo aver lottato con le soluzioni più complesse per un po ':

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID ) 
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Si noti che ho dovuto convertire l'ID in un VARCHAR per concatenarlo come una stringa. Se non devi farlo, ecco una versione ancora più semplice:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Tutto il merito per questo va a qui: https://social.msdn.microsoft.com/Forums/sqlserver/en-US/9508abc2-46e7-4186-b57f-7f368374e084/replicating-groupconcat-function-of-mysql-in- sql-server? forum Transact-SQL =

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.