È accettabile caricare contenuti offensivi su GitHub? [chiuso]


12

Ho sviluppato un correttore di contenuti offensivo per il mio sito Web e voglio pubblicarlo su GitHub . Tuttavia, il codice sorgente contiene molti contenuti offensivi, razzisti e altrimenti sgradevoli.

La fonte è completamente documentata, ma volevo la tua opinione sull'accettabilità di pubblicare tale lavoro su GitHub o se lasciare la matrice di stringhe fino all'immaginazione del lettore ?!


11
La domanda chiave è probabilmente "è davvero offensivo? O è solo un" dittonario "?" che entra nel github TOS - §7 suggerisce che possono (ma non hanno l'obbligo di) rimuoverlo. Potresti voler estrarre le stringhe in un altro file, che viene quindi crittografato con rot13 o qualcosa del genere per evitare di offendere il browser causale.

1
Immagino sia ok, avverti solo i possibili lettori di Readme, ci sono molte parole offensive in altri GitHub Repos. Inoltre, il tuo caso è di buona fede.
jacktrades,

5
Perché non mettere tutte le parole in un file di testo o database e caricarle in fase di esecuzione. Quindi metti un bel disclaimer all'inizio del file che il testo qui sotto non è per i deboli di cuore. Il tuo codice è pulito e puoi utilizzare file di testo diversi per situazioni diverse?
Appunto

@Sparticus grazie per il tuo commento. Sono d'accordo e penso che sia probabilmente l'approccio migliore per me.
SimonGoldstone.com,

5
Una parola da sola non è offensiva. L'intenzione dietro lo rende offensivo.
kaptan,

Risposte:


45

Non sono d'accordo con la soluzione ROT-13. Offuscando le tue parole vietate semplicemente perché la vista di loro potrebbe offendere qualcuno è una perdita di tempo.

Il dizionario di parolacce / di parolacce dovrebbe comunque provenire da un file separato (che potrebbe essere caricato in fase di esecuzione o incorporato come risorsa) . Offuscare questo file rende semplicemente più difficile per te / altri sviluppatori / i tuoi utenti modificarlo o risolvere eventuali problemi. Inoltre, se vedessi un file chiamato "banned_words.txt" sul mio disco rigido, mi aspetterei che contenga un elenco di parole offensive.


Sono d'accordo. Non voglio offuscare le parole.
SimonGoldstone.com,

5
+1 @simon Tali elenchi sono già visualizzati: github.com/snipe/banbuilder
dcaswell

2
@simon Non intendevo dire che il tuo progetto non valeva la pena, solo che github consente alle persone di memorizzare elenchi come desideri. L'altra risposta non ha un sì o un no, volevo solo confermarti che la risposta era effettivamente sì.
dcaswell,

1
"reinventare la ruota" fa parte dell'apprendimento ... è la maggior parte di ciò che viene insegnato al college.
WernerCD,

2
A volte ti imbatti in persone con ... come possiamo dire ... sensibilità delicate che possono avere una certa influenza se la distribuzione del programma rimane o va. Se ruotare il file significa che rimane, ciò aiuta l'OP a raggiungere il suo obiettivo di avere il suo codice attivo e di rimanere su GitHub. Non è una perdita di tempo nel mio libro.
Blrfl

16

"Tutti i problemi di informatica possono essere risolti da un altro livello di riferimento indiretto." ( di David Wheeler ).

Le opzioni non si limitano al caricamento o meno, se si tiene conto del fatto che è possibile codificare i contenuti in modo da non disturbare i lettori.

  • Ad esempio, passare semplicemente alla lettera successiva (da A a B, da B a C, ecc., Con Z che si sposta su A per completare la codifica) può trasformare le famose parole di quattro lettere in Gvdl totalmente innocuo . Tutto ciò di cui hai bisogno per usarlo nella tua applicazione sarebbe di spostarlo indietro nella direzione opposta, alle lettere precedenti , con A che si sposta su Z.

Come sottolineato nei commenti , un approccio come quello sopra è usato nel codice di sostituzione delle lettere ROT13 , noto per il suo uso "come mezzo per nascondere ... materiali offensivi dallo sguardo casuale ..."

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


Per completezza, considera inoltre di eseguire il tuo correttore su un dizionario codificato , al fine di garantire che la codifica scelta non abbia accidentalmente trasformato una parola offensiva in un'altra.

Quando si codificano cose del genere, ha senso ricontrollare, perché non è possibile prevedere le cose in modo affidabile. In uno dei miei progetti passati, abbiamo avuto un'interruzione della posta piuttosto grave quando un correttore non configurato ha iniziato a scoprire contenuti offensivi in ​​sequenze casuali di caratteri (nel contenuto codificato degli archivi ZIP).


Rispetto al passaggio del testo in chiaro, Gvdl , la codifica ha un sostanziale vantaggio di evitare completamente le questioni legali e tutti i rischi e le dipendenze .

Basta pensarci. Supponiamo che particolari termini di servizio in un determinato repository consentano il mio contenuto, va bene.

Ma cosa succede se decidono di cambiare i TOS ? Oppure, se decidessi di passare a un altro repository, con termini incompatibili. Ciò che mi accingo a fare?

Si noti che anche essere in un repository "amichevole", qui e ora, non è ancora del tutto sicuro.

Che cosa succede se qualcuno non sarà in grado di scaricare i miei contenuti a causa del filtro web strano ? Sono disposto a rispondere ai reclami degli utenti e spiegare come risolvere il filtro? Il loro filtro ...

... Vedi, preferirei pensarci due volte prima di decidere di non codificare. E anche se decidessi, mi assicurerei di avere una ragione molto, molto buona per questo.


6
Rot13 è una sorta di standard di fatto per questo. Il doppio rot13 è ancora meglio. :-)
Blrfl,

5
@Blrfl come triplo DES è meglio di DES, triple rot13 è la strada da percorrere.

1
Penso che ci siano plugin per molti editor che rendono la modifica dei file rot13 non più difficile della modifica di qualsiasi altro file in un formato specializzato
JoelFan,

2
@Simon non è così tanto che rot13 è oscurità - ma piuttosto solo un modo standard per nascondere banalmente il testo. Tieni presente che alcuni firewall possono essere configurati per bloccare determinati schemi di caratteri rendendo difficile ottenere il testo per la funzionalità del programma. Non è l'offensività che è il problema probabile, ma gli altri ostacoli tecnologici che potrebbero non comprendere la differenza tra "qualcosa che si desidera scaricare" e "qualcosa che si desidera bloccare". Sì, possono ottenere la zip, ma non saranno in grado di clonare, fork o push.

2
@ThomasEding Caesar sposta il codice di una lettera. Il primo personaggio è originariamente una "F".
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.