Convertire l'inglese in un numero [chiuso]


27

Breve e dolce descrizione della sfida:

Sulla base delle idee di molte altre domande su questo sito, la tua sfida è quella di scrivere il codice più creativo in qualsiasi programma che prende come input un numero scritto in inglese e lo converte in un numero intero.

Specifiche davvero asciutte, lunghe e approfondite:

  • Il tuo programma riceverà come input un numero intero in inglese minuscolo tra zeroe nine hundred ninety-nine thousand nine hundred ninety-ninecompreso.
  • Deve produrre solo la forma intera del numero tra 0e 999999e nient'altro (nessuno spazio).
  • L'input NON conterrà ,o and, come in one thousand, two hundredo five hundred and thirty-two.
  • Quando le posizioni delle decine e quelle sono entrambe diverse da zero e la posizione delle decine è maggiore di 1, saranno separate da un carattere HYPHEN-MINUS -anziché da uno spazio. Idem per i diecimila e mille posti. Ad esempio six hundred fifty-four thousand three hundred twenty-one,.
  • Il programma potrebbe avere un comportamento indefinito per qualsiasi altro input.

Alcuni esempi di un programma ben educato:

zero-> 0
fifteen-> 15
ninety-> 90
seven hundred four-> 704
sixty-nine thousand four hundred eleven-> 69411
five hundred twenty thousand two->520002


Questo non è particolarmente creativo, né corrisponde esattamente alle specifiche qui, ma potrebbe essere utile come punto di partenza: github.com/ghewgill/text2num/blob/master/text2num.py
Greg Hewgill

Potrei quasi pubblicare la mia risposta a questa domanda .
grc,

Perché l'analisi delle stringhe complicata? pastebin.com/WyXevnxb
blutorange

1
A proposito, ho visto una voce IOCCC che è la risposta a questa domanda.
Fai uno spuntino il

2
Che dire cose come "quattro e venti?"
soffice

Risposte:


93

Applescript

Un mash-up sciocco e caotico che potrebbe sconvolgere alcune persone di Cupertino / Mountain View, ma penso che sia un mash-up sciocco e creativo creativo.

set myNumber to text returned of (display dialog ¬
    "Enter number as text:" buttons {"Continue…"} ¬
    default answer "" default button 1)
tell application "Google Chrome"
    activate
    open location "https://www.google.com"
end tell
delay 5
say "ok google. " & myNumber
delay 2
tell application "System Events"
    tell application process "Google Chrome"
        set fullURL to value of text field 1 of toolbar 1 of window 1
    end tell
end tell
set AppleScript's text item delimiters to "="
display alert item 2 of text items of fullURL

Utilizza la sintesi vocale OSX per pronunciare il numero di testo e ricerca audio google per ascoltarlo e convertirlo in un numero intero.

Requisiti

  • OSX
  • Google Chrome
  • riconoscimento vocale abilitato nel tuo account google
  • volume alzato a un livello ragionevole

Potrebbe essere necessario regolare i tempi di ritardo in base al tempo di caricamento di Chrome e al tempo di ricerca di Google.

Esempio di input:

inserisci qui la descrizione dell'immagine

Esempio di output:

inserisci qui la descrizione dell'immagine


13
Io penso che potrebbe essere solo un po ' creativo ...;)
Abraham

5
Lol, è fantastico
solo il

2
Forse troppo creativo.
Cheezey,

Dopo una settimana, la tua risposta è chiaramente in testa con 74 voti, quindi penso che questo significhi che ... hai vinto! A proposito, ti dispiace se uso questo codice? Sarebbe davvero utile per molti progetti del mondo reale a cui sto lavorando proprio ora! ;)
Abraham

3
@Abraham Grazie! Stai scherzando sull'uso di questo nel codice di produzione, giusto?
Trauma digitale

34

Bash, 93 64 55 caratteri *

Nel fantastico bsd-gamespacchetto disponibile sulla maggior parte dei sistemi operativi Linux, c'è un piccolo giocattolo da riga di comando chiamato number. Trasforma i numeri in testo inglese, ovvero fa esattamente l'opposto di questa domanda. È esattamente il contrario: tutte le regole della domanda sono seguite da number. È quasi troppo bello per essere una coincidenza.

$ number 42
forty-two.

Ovviamente, number non risponde alla domanda. Lo vogliamo al contrario. Ci ho pensato per un po ', ho provato ad analizzare le stringhe e tutto il resto, poi mi sono reso conto che posso semplicemente chiamare numbertutti i 999.999 numeri e vedere se qualcosa corrisponde all'input. In tal caso, la prima riga in cui corrisponde ha il doppio del numero di riga che sto cercando ( numberstampa una riga di punti dopo ogni numero). Semplice come quella. Quindi, senza ulteriori indugi, ecco il codice completo per la mia voce:

seq 0 999999|number -l|awk "/$1/{print (NR-1)/2;exit}"

Ha anche cortocircuiti, quindi la conversione di "due" è abbastanza veloce, e numeri ancora più alti vengono solitamente decodificati in meno di un secondo sulla mia scatola. Ecco un esempio:

wn@box /tmp> bash unnumber.sh "zero"
0
wn@box /tmp> bash unnumber.sh "fifteen"
15
wn@box /tmp> bash unnumber.sh "ninety" 
90
wn@box /tmp> bash unnumber.sh "seven hundred four"
704
wn@box /tmp> bash unnumber.sh "sixty-nine thousand four hundred eleven"
69411
wn@box /tmp> bash unnumber.sh "five hundred twenty thousand two"    
520002

Certo, dovrai averlo number installato perché funzioni.


*: Sì, lo so, questa non è una code-golfsfida, ma la brevità è praticamente l'unica qualità esigente della mia voce, quindi ... :)


8
+1. Per me, usare numberal contrario è la cosa più creativa di questa risposta. Anche il golfiness è buono :)
Digital Trauma

1
Questo è in realtà abbastanza creativo! Mi piace!
sokie

13

Javascript

(function parse(input) {
  var pat = "ze/on/tw/th.?r/fo/fi/ix/se/ei/ni/ten/ele".split("/");
  var num = "", last = 0, token = input.replace(/-/g, " ").split(" ");
  for(var i in token) {
    var t = token[i];
    for(var p in pat) if(t.match(RegExp(pat[p])) !== null) num += "+" + p;
    if(t.indexOf("een") >= 0) num += "+10";
    if(t.indexOf("lve") >= 0) num += "+10";
    if(t.indexOf("ty") >= 0) num += "*10";
    if(t.indexOf("dr") >= 0) { last = 100; num += "*100"; }
    if(t.indexOf("us") >= 0) {
      if(last < 1000) num = "(" + num + ")"; last = 0;
      num += "*1000";
    }
  }
  alert(eval(num));
})(prompt());

Ti piacciono alcuni eval() ?

Esegui questo script sulla console del tuo browser.

Modifica: grazie per il feedback. Bug corretti (di nuovo).


codice davvero bello ^^
zsitro

2
Quando digiti qualcosa del tipo "centosedici", otterrai 126.
scrblnrd3

Questo programma fallisce per alcuni numeri a partire da twelvequando ritorna 23.
Abraham,

Non funziona "twenty".
200_successo

seven thousand three hundred thirty fivedammi10335
Baby,

7

Pitone

Solo per far rotolare la palla.

import re
table = {'zero':0,'one':1,'two':2,'three':3,'four':4,'five':5,'six':6,'seven':7,'eight':8,'nine':9,
         'ten':10,'eleven':11,'twelve':12,'thirteen':13,'fourteen':14,'fifteen':15,'sixteen':16,'seventeen':17,'eighteen':18,'nineteen':19,
         'twenty':20,'thirty':30,'forty':40,'fifty':50,'sixty':60,'ninety':90}
modifier = {'hundred':100,'thousand':1000}

while True:
    text = raw_input()
    result = 0
    tmp = 0
    last_multiplier = 1
    for word in re.split('[- ]', text):
        multiplier = modifier.get(word, 1)
        if multiplier > last_multiplier:
            result = (result+tmp)*multiplier
            tmp = 0
        else:
            tmp *= multiplier
        if multiplier != 1:
            last_multiplier = multiplier
        tmp += table.get(word,0)
    print result+tmp

5

Perl + CPAN

Perché reinventare la ruota, quando è già stata fatta?

use feature 'say';
use Lingua::EN::Words2Nums;

say words2nums $_ while <>;

Questo programma legge stringhe inglesi dall'input standard (o da uno o più file specificati come argomenti della riga di comando), uno per riga e stampa i numeri corrispondenti sull'output standard.

Ho testato questo codice utilizzando sia gli input di esempio della sfida, sia una suite di test esaustiva composta dai numeri da 0 a 999999 convertiti in testo utilizzando l' numberutilità bsd-games (grazie, Wander Nauta!), E analizza correttamente tutti loro. Come bonus, comprende anche input come ad esempio minus seven(−7), four and twenty(24), four score and seven(87), one gross(144), a baker's dozen(13), eleventy-one(111) e googol(10 100 ).

( Nota: Oltre all'interprete Perl stesso, questo programma richiede anche il modulo CPAN Lingua :: EN :: Words2Nums . Ecco alcune istruzioni per l'installazione dei moduli CPAN . Gli utenti Debian / Ubuntu Linux possono anche installare questo modulo tramite il gestore di pacchetti APT come liblingua-en-words2nums-perl .)


4

Pitone

Una soluzione ricorsiva generale, con controllo di validità. Potrebbe essere semplificato per l'intervallo di numeri richiesto, ma ecco per mettersi in mostra suppongo:

terms = 'zero one two three four five six seven eight nine ten eleven twelve thirteen fourteen fifteen sixteen seventeen eighteen nineteen'.split()
tee  = 'twenty thirty forty fifty sixty seventy eighty ninety'.split()
for t in tee:
    terms.append(t)
    for s in terms[1:10]:
        terms.append(t+'-'+s)

terms = dict(zip(terms, range(100)))

modifiers = [('hundred', 100), ('thousand', 1000), ('million', 10**6), ('billion', 10**9)]

def read_num(words):
    if len(words) == 0: return 0
    elif len(words) == 1:
        if words[0] in terms:
            return terms[words[0]]
        else:
            raise ValueError(words[0]+' is not a valid english number.')
    else:
        for word, value in reversed(modifiers):
            if word in words:
                i = words.index(word)
                return read_num(words[:i])*value+read_num(words[i+1:])

    raise ValueError(' '.join(words)+' is not a valid english number.')

while True:
    try:
        print(read_num(input().split()))
    except ValueError as e:
        print(e)

2

VBScript 474

Questa è una risposta abbastanza ordinaria ... sfortunatamente, così normale che @Snack ha praticamente pubblicato lo stesso processo, ma prima di me.

i=split(REPLACE(REPLACE(inputbox(""),"lve","een"),"tho","k"))
o=split("z on tw th fo fi si se ei ni ten ele")
y=split("red *100) k )*1000 ty *10) een +10)")
z=""
p=0
for t=0 to UBOUND(i)
    s=split(i(t),"-")
    u=ubound(s)
    r=s(0)
    for x=0 to UBOUND(o)    
        IF INSTR(r,o(x)) THEN
            z=z+"+"+CSTR(x)
        END IF
        IF u Then
            IF INSTR(s(1),o(x)) THEN
                z=z+CSTR(x)
            END IF
        END IF
    next
    for m=0 to UBOUND(y)
        IF INSTR(r,y(m))AND u=0 THEN
            z=z+y(m+1)
            p=p+1
        END IF
    next
next
Execute("MSGBOX "+String(p,"(")+z)

1

Haskell

Simile ad altre soluzioni ricorsive immagino, ma mi sono preso il tempo per renderlo pulito.

Ecco la fonte completa con tutte le spiegazioni: http://ideone.com/fc8zcB

-- Define a type for a parser from a list of tokens to the value they represent.
type NParse = [Token] -> Int    

-- Map of literal tokens (0-9, 11-19 and tens) to their names.
literals = [
        ("zero", 0), ("one", 1), ("two", 2), ("three", 3), ("four", 4), ("five", 5), ("six", 6), ("seven", 7), ("eight", 8), ("nine", 9),
        ("eleven", 11), ("twelve", 12), ("thirteen", 13), ("fourteen", 14), ("fifteen", 15), ("sixteen", 16), ("seventeen", 17), ("eighteen", 18), ("nineteen", 19),
        ("ten", 10), ("twenty", 20), ("thirty", 30), ("fourty", 40), ("fifty", 50), ("sixty", 60), ("seventy", 70), ("eighty", 80), ("ninety", 90)
    ]

-- Splits the input string into tokens.
-- We do one special transformation: replace dshes by a new token. Such that "fifty-three" becomes "fifty tens three". 
prepare :: String -> [Token]

-- Let's do the easy stuff and just parse literals first. We just have to look them up in the literals map.
-- This is our base parser.
parseL :: NParse
parseL [tok] = case lookup tok literals of 
    Just x -> x

-- We're going to exploit the fact that the input strings have a tree-like structure like so
--                    thousand
--          hundred             hundred
--      ten       ten       ten         ten
--    lit   lit lit  lit   lit  lit    lit  lit
-- And recursively parse that tree until we only have literal values.
--
-- When parsing the tree
--       thousand
--     h1       h2
-- The resulting value is 1000 * h1 + h2.
-- And this works similarly for all levels of the tree.
-- So instead of writing specific parsers for all levels, let's just write a generic one :

{- genParse :: 
    NParse      : the sub parser
    -> Int      : the left part multiplier
    -> Token    : the boundary token 
    -> NParse   : returns a new parser -}   
genParse :: NParse -> Int -> Token -> NParse    
genParse delegate mul tok = newParser where
    newParser [] = 0
    newParser str = case splitAround str tok of
        -- Split around the boundary token, sub-parse the left and right parts, and combine them
        (l,r) -> (delegate l) * mul + (delegate r)  

-- And so here's the result: 
parseNumber :: String -> Int
parseNumber = parseM . prepare
    where   -- Here are all intermediary parsers for each level
    parseT = genParse   parseL  1       "tens"       -- multiplier is irregular, because the fifty in fifty-three is already multiplied by 10
    parseH = genParse   parseT  100     "hundred"
    parseK = genParse   parseH  1000    "thousand"
    parseM = genParse   parseK  1000000 "million" -- For fun :D

test = (parseNumber "five hundred twenty-three thousand six hundred twelve million two thousand one") == 523612002001

0

Lisp comune, 94

(write(cdr(assoc(read-line)(loop for i to 999999 collect(cons(format()"~r"i)i)):test #'equalp)))

La conversione da numero a testo è integrata in CL, ma non viceversa. Crea una mappatura inversa per i numeri e controlla l'input su di esso.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.