TypeError: "str" non supporta l'interfaccia del buffer

Question 1

plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wb") as outfile:
    outfile.write(plaintext)

Il codice Python sopra mi sta dando il seguente errore:

Traceback (most recent call last):
  File "C:/Users/Ankur Gupta/Desktop/Python_works/gzip_work1.py", line 33, in <module>
    compress_string()
  File "C:/Users/Ankur Gupta/Desktop/Python_works/gzip_work1.py", line 15, in compress_string
    outfile.write(plaintext)
  File "C:\Python32\lib\gzip.py", line 312, in write
    self.crc = zlib.crc32(data, self.crc) & 0xffffffff
TypeError: 'str' does not support the buffer interface

Question 2

Se usi Python3x, allora stringnon è lo stesso tipo di Python 2.x, devi lanciarlo in byte (codificarlo).

plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wb") as outfile:
    outfile.write(bytes(plaintext, 'UTF-8'))

Inoltre, non utilizzare nomi di variabili come stringo filementre questi sono nomi di modulo o funzione.

EDIT @Tom

Sì, anche il testo non ASCII viene compresso / decompresso. Uso lettere polacche con codifica UTF-8:

plaintext = 'Polish text: ąćęłńóśźżĄĆĘŁŃÓŚŹŻ'
filename = 'foo.gz'
with gzip.open(filename, 'wb') as outfile:
    outfile.write(bytes(plaintext, 'UTF-8'))
with gzip.open(filename, 'r') as infile:
    outfile_content = infile.read().decode('UTF-8')
print(outfile_content)

Question 3

C'è una soluzione più semplice a questo problema.

Hai solo bisogno di aggiungere un talla modalità in modo che diventi wt. Ciò fa sì che Python apra il file come file di testo e non binario. Allora tutto funzionerà.

Il programma completo diventa questo:

plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wt") as outfile:
    outfile.write(plaintext)

Question 4

Non è possibile serializzare una "stringa" di Python 3 in byte senza la conversione esplicita in qualche codifica.

outfile.write(plaintext.encode('utf-8'))

è forse quello che vuoi. Anche questo funziona sia per python 2.x che per 3.x.

Question 5

Per Python 3.x puoi convertire il tuo testo in byte grezzi tramite:

bytes("my data", "encoding")

Per esempio:

bytes("attack at dawn", "utf-8")

L'oggetto restituito funzionerà con outfile.write.

Question 6

Questo problema si verifica comunemente quando si passa da py2 a py3. In py2 plaintextè sia una stringa che un tipo di array di byte . In py3 plaintextè solo una stringa e il metodo in outfile.write()realtà accetta un array di byte quando outfileviene aperto in modalità binaria, quindi viene sollevata un'eccezione. Modificare l'input in plaintext.encode('utf-8')per risolvere il problema. Continua a leggere se questo ti dà fastidio.

Nel PY2, la dichiarazione per file.write sembrava che avete passato in una stringa: file.write(str). In realtà si passavano in un array di byte, si avrebbe dovuto essere la lettura della dichiarazione in questo modo: file.write(bytes). Se lo leggi in questo modo il problema è semplice, ha file.write(bytes)bisogno di un tipo di byte e in py3 per ottenere byte da una str lo converti:

py3>> outfile.write(plaintext.encode('utf-8'))

Perché la dichiarazione dei documenti py2 ha file.writepreso una stringa? Ebbene in py2 la distinzione della dichiarazione non aveva importanza perché:

py2>> str==bytes         #str and bytes aliased a single hybrid class in py2
True

La classe str-bytes di py2 ha metodi / costruttori che la fanno comportare come una classe stringa in alcuni modi e come una classe array di byte in altri. Comodo perché file.writenon è vero ?:

py2>> plaintext='my string literal'
py2>> type(plaintext)
str                              #is it a string or is it a byte array? it's both!

py2>> outfile.write(plaintext)   #can use plaintext as a byte array

Perché py3 ha rotto questo bel sistema? Bene, perché in py2 le funzioni di base delle stringhe non funzionavano per il resto del mondo. Misurare la lunghezza di una parola con un carattere non ASCII?

py2>> len('¡no')        #length of string=3, length of UTF-8 byte array=4, since with variable len encoding the non-ASCII chars = 2-6 bytes
4                       #always gives bytes.len not str.len

Per tutto questo tempo hai pensato di chiedere la lunghezza di una stringa in py2, stavi ottenendo la lunghezza dell'array di byte dalla codifica. Quell'ambiguità è il problema fondamentale con le classi a doppio dovere. Quale versione di qualsiasi chiamata di metodo implementate?

La buona notizia quindi è che py3 risolve questo problema. Districa le classi str e bytes . La classe str ha metodi simili a stringhe, la classe byte separata ha metodi array di byte:

py3>> len('¡ok')       #string
3
py3>> len('¡ok'.encode('utf-8'))     #bytes
4

Si spera che questa conoscenza aiuti a demistificare il problema e renda il problema della migrazione un po 'più facile da sopportare.

Question 7

>>> s = bytes("s","utf-8")
>>> print(s)
b's'
>>> s = s.decode("utf-8")
>>> print(s)
s

Bene, se ti è utile nel caso in cui rimuovi il fastidioso carattere `` b ''. Se qualcuno ha un'idea migliore per favore suggeriscimi o sentiti libero di modificarmi in qualsiasi momento qui. Sono solo un principiante

Question 8

Per Djangoin django.test.TestCaseunit test, ho cambiato la mia sintassi Python2 :

def test_view(self):
    response = self.client.get(reverse('myview'))
    self.assertIn(str(self.obj.id), response.content)
    ...

Per usare la sintassi Python3 .decode('utf8') :

def test_view(self):
    response = self.client.get(reverse('myview'))
    self.assertIn(str(self.obj.id), response.content.decode('utf8'))
    ...

TypeError: "str" ​​non supporta l'interfaccia del buffer

TypeError: "str" non supporta l'interfaccia del buffer