Modifica: la domanda ora dice "milioni di nuovi personaggi". Ciò semplifica la risposta:
No . Utf-8 è una codifica Unicode. Unicode ha uno spazio codici che consente 1.114.112 punti di codice distinti e meno di un milione è attualmente non assegnato. Quindi non è possibile supportare milioni di nuovi personaggi in Unicode. Per definizione nessuna codifica Unicode può supportare più caratteri di quanto definito da Unicode. (Ovviamente puoi imbrogliare codificando ulteriormente un livello - dopotutto ogni tipo di dati può essere rappresentato da solo due caratteri.)
Per rispondere alla domanda originale:
Unicode non supporta le lingue in quanto tali, supporta i caratteri - simboli utilizzati per rappresentare la lingua in forma scritta.
Non tutte le lingue umane hanno una rappresentazione scritta, quindi non tutte le lingue umane possono essere supportate da Unicode. Inoltre molti animali comunicano ma non hanno una lingua scritta. Le balene, ad esempio, hanno una forma di comunicazione che è abbastanza complessa da chiamare una lingua, ma non ha alcuna forma scritta (e non può essere catturata nemmeno dalla notazione fonetica esistente). Quindi, nemmeno tutte le lingue sulla terra possono essere supportate da Unicode.
Ancora peggio è qualcosa di simile al linguaggio delle api. Non solo non ha una forma scritta, non può essere significativamente rappresentato in forma scritta. La lingua è un tipo di danza che punta sostanzialmente in una direzione ma si basa sulla posizione attuale del sole. Pertanto la danza ha valore informativo solo nel luogo e nel momento in cui viene eseguita. Una rappresentazione simbolica o testuale dovrebbe includere informazioni (posizione, posizione del sole) che la lingua delle api non può attualmente esprimere.
Anche una forma di comunicazione scritta o simbolica potrebbe non essere possibile rappresentare in Unicode. Ad esempio, le illustrazioni o i fumetti senza parole non possono essere supportati da Unicode poiché l'insieme di glifi non è finito. Noterai molte comunicazioni pittoriche in contesti internazionali come un aeroporto, quindi non è inconcepibile che una razza di alieni che viaggiano nello spazio si sia evoluta per usare un linguaggio pittorico.
Anche se una razza aliena avesse una lingua con un sistema di scrittura con un insieme finito di simboli, questo sistema potrebbe non essere supportato in Unicode. Unicode prevede che la scrittura sia una sequenza lineare di simboli. La notazione musicale è un esempio di un sistema di scrittura che non può essere completamente rappresentato in Unicode, poiché il significato è codificato sia nella scelta dei simboli che nel posizionamento verticale e orizzontale. (Unicode supporta singoli simboli musicali, ma non può codificare una partitura.) Una razza aliena che comunicava usando musica polifonica (non insolita) o un canale di comunicazione di simile complessità, potrebbe benissimo avere un sistema di scrittura che assomiglia a una partitura orchestrale, e Unicode non può supportarlo.
Ma per amor di discussione supponiamo che tutte le lingue, anche le lingue aliene, possano essere espresse come una sequenza lineare di simboli selezionati da un insieme finito. Unicode è abbastanza grande per un'invasione aliena? Unicode ha attualmente meno di un milione di punti di codice non assegnati. La lingua cinese contiene centinaia di migliaia di caratteri secondo il dizionario cinese più completo (al momento non tutti sono supportati da Unicode come caratteri distinti). Quindi solo dieci lingue con la complessità del cinese consumerebbero tutto Unicode. Sulla terra abbiamo centinaia di sistemi di scrittura distinti, ma per fortuna la maggior parte sono alfabetici piuttosto che ideografici e quindi contengono un piccolo numero di caratteri. Se tutte le lingue scritte usassero ideogrammi come il cinese, Unicode non sarebbe nemmeno abbastanza grande per la terra. L'uso degli alfabeti deriva dal linguaggio che utilizza solo un numero limitato di fonemi, ma questo è particolare per la fisiologia umana. Quindi anche un singolo pianeta alieno con solo una dozzina di sistemi di scrittura ideografica potrebbe superare ciò che Unicode può supportare. Ora considera se questo alieno ha già invaso altri pianeti prima della Terra e incluso i loro sistemi di scrittura nell'insieme di personaggi che devono essere supportati.
L'espansione o la modifica delle codifiche correnti o l'introduzione di nuove codifiche non risolverà questo problema, poiché la limitazione è nel numero di punti di codice supportati da Unicode.
Quindi la risposta è molto probabilmente no.