Rileva domande duplicate
C'era una volta un campo da golf. Aveva un problema: le persone avrebbero posto domande simili o identiche ancora e ancora. Tu sei statoscelto selezionato arruolato forzatamente ricattato ha chiesto di automatizzare il processo di decisione se una domanda è un duplicato di una esistente, con qualsiasi mezzo necessario (vedi Regole).
Ingresso
Il tuo programma deve accettare un singolo URL come input. Si può presumere che ciò porti a una domanda su codegolf.stackexchange.com .
Produzione
Cerca nel sito domande simili. Se ritieni che la domanda di input sia un duplicato di una domanda esistente (o viceversa), genera l'URL dell'altra domanda. È possibile generare più URL, separati da nuove righe. Alla fine dell'output, output end
(su una riga separata).
punteggio
- Se una domanda che hai emesso è stata effettivamente contrassegnata come duplicata della domanda di input (o viceversa), ottieni 4 punti. Questa è una "ipotesi corretta".
- Per ogni falso positivo (noto anche come "ipotesi errata"), perdi 2 punti.
- Per ogni domanda che era in realtà un duplicato ma non appare nel tuo output (aka "ipotesi mancante"), perdi 1 punto.
Vince il punteggio più alto dopo aver gestito 32 domande di input. Queste 32 domande sono un "round". All'inizio di ogni round, i punteggi verranno reimpostati su 0. Verrà eseguito un round ogni pochi giorni e la classifica verrà aggiornata dopo ogni round.
Regole
- Se le domande A e C sono entrambe chiuse come duplicati di B, A verrà conteggiato come duplicato di C e viceversa.
- All'inizio di ogni round, il tuo programma potrebbe non essere in possesso di dati relativi a domande (ad es. Nessuna codifica hardware ), ad eccezione di come analizzare il sito Web.
- Tuttavia, è possibile conservare i dati in file esterni durante un round.
- Nessun dato può essere conservato tra i round.
- L'output deve avere una nuova riga finale.
- Non è possibile utilizzare alcun dato dal sito Web tranne i risultati della ricerca e l'URL, il titolo, i tag e il testo di una domanda , con o senza formattazione. Ad esempio, non è possibile utilizzare il testo "contrassegnato come duplicato da pippo, barra ..." che appare su domande duplicate.
- È possibile recuperare questi dati direttamente dal sito, tramite data.SE o tramite l'API.
- Ogni invio deve avere un nome.
- Ogni invio deve avere una numerazione delle versioni chiara.
- Se un invio non produce risultati dopo un limite di tempo (da stabilire; si prega di indicare quanto tempo impiega l'invio) verrà ucciso e perderà 8 punti.