Credo che questo sia un problema di codifica tra la shell e bcp / SQL Server. SQL Server prevede UTF-16 Little Endian, ma Linux non lo utilizza. L'impostazione predefinita per la mia macchina virtuale Linux è UTF-8 via en_GB.UTF-8
.
<TL; DR> Utilizzare il comando bcp "queryout" e specificare "SELECT * FROM ..."
invece di utilizzare il comando "out" e fornire semplicemente un nome di tabella.
Quello che segue è il mio test ...
Ho ottenuto l'elenco delle localizzazioni / codifiche disponibili usando:
$ locale -a
tornato:
C
C.UTF-8
en_AG
en_AG.utf8
en_AU.utf8
en_BW.utf8
en_CA.utf8
en_DK.utf8
en_GB.utf8
en_HK.utf8
en_IE.utf8
en_IN
en_IN.utf8
en_NG
en_NG.utf8
en_NZ.utf8
en_PH.utf8
en_SG.utf8
en_US.utf8
en_ZA.utf8
en_ZM
en_ZM.utf8
en_ZW.utf8
POSIX
Ho provato diverse di queste opzioni impostando:
$ export LC_CTYPE=C.UTF-8
e quindi riprovare utilizzando:
$ export LC_ALL=C.UTF-8
Niente sembrava fare la differenza. E ogni volta che ho provato con varie combinazioni di parentesi quadre senza -q
e poi con -q
, e quindi senza parentesi quadre sia con che senza -q
.
Ho anche provato a iniettare i byte che equivarrebbero al carattere UTF-16 LE di ä
via $'\xe4\x00'
e anche $'\xe4'$'\x00'
, ma nessun miglioramento.
TUTTAVIA,
quello che ha funzionato è stato cambiare il comando bcp da out
invece essere queryout
, e quindi cambiare il nome della tabella per far parte di SELECT
un'istruzione (ho rimosso l' -r ~
opzione solo qui per fare in modo che la riga di comando non scorresse orizzontalmente, ma era nei miei test). Ho creato la tabella [tempdb]
ed eseguito il seguente:
bcp "SELECT * FROM tempdb.dbo.[Täble_Name]" queryout tab -c -k -S127.0.0.1 -Usa -Ppass
Nessun problema lì. Ma abbastanza interessante, ho cambiato l'accento ä
in un non accentato a
:
bcp "SELECT * FROM tempdb.dbo.[Table_Name]" queryout tab -c -k -S127.0.0.1 -Usa -Ppass
e ricevuto il seguente errore:
SQLState = S1000, NativeError = 0
Errore = [Microsoft] [Driver ODBC 13 per SQL Server] Impossibile risolvere le regole di confronto a livello di colonna
Questo è un errore di bcp e deve fare riferimento ai metadati di tempdb
poiché l'unica colonna nella mia tabella di test utilizza il INT
tipo di dati.
Ora, le mie regole di confronto a livello di istanza sono sensibili all'accento, quindi non mi aspettavo davvero che il non accentato a
funzionasse (anche se mi aspettavo un errore "oggetto non valido"). Quindi, al fine di verificare l'insensibilità all'accento, ho creato un nuovo database con un fascicolo di confronto, ho creato la Latin1_General_100_CI_AI_KS_WS_CS
stessa tabella nel nuovo DB e ho aggiunto alcune righe. Ho quindi eseguito i seguenti due test:
bcp "SELECT * FROM ImportTest.dbo.[Täble_Name]" queryout tab -c -k -S127.0.0.1 -Usa -Ppass
bcp "SELECT * FROM ImportTest.dbo.[Table_Name]" queryout tab -c -k -S127.0.0.1 -Usa -Ppass
ed entrambi hanno funzionato!
Tornando al comando bcp iniziale di specificare semplicemente il nome della tabella anziché una query, sono stato in grado di ottenere ImportTest.dbo.[Table_Name]
e ImportTest.dbo.Table_Name
lavorare. Tuttavia, non ero ancora in grado di ottenere alcuna combinazione di ImportTest.dbo.[Täble_Name]
lavoro; tutte le varianti hanno avuto gli stessi errori di prima.