Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo

1
Che cos'è un punteggio LB nell'apprendimento automatico?
Stavo leggendo un articolo sui blog di Kaggle. Ripetutamente, l'autore menziona "punteggio LB" e "adattamento LB" come metrica per l'efficacia dell'apprendimento automatico (insieme al punteggio di convalida incrociata (CV)). Con una ricerca sul significato di "LB" ho trascorso un bel po 'di tempo, mi sono reso conto che generalmente le …



2
PNL - Gazetteer è un imbroglione?
Nella PNL esiste il concetto Gazetteerche può essere molto utile per la creazione di annotazioni. Per quanto ho capito: Un dizionario geografico è costituito da una serie di elenchi contenenti nomi di entità come città, organizzazioni, giorni della settimana, ecc. Questi elenchi vengono utilizzati per trovare occorrenze di questi nomi …

3
Come autoapprendimento della scienza dei dati? [chiuso]
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 4 anni fa . Sono uno sviluppatore web autodidatta e sono interessato a insegnare a …


6
Podcast di Data Science?
Quali sono alcuni podcast relativi alla scienza dei dati? Questa è una domanda simile alla domanda di riferimento su CrossValidated . Dettagli / regole: I podcast (il tema e gli episodi) dovrebbero essere correlati alla scienza dei dati. (Ad esempio: un podcast che riguarda un altro dominio, con un episodio …

2
Estrai la maggior parte delle parti informative del testo dai documenti
Ci sono articoli o discussioni sull'estrazione di parte del testo che contiene la maggior parte delle informazioni sul documento corrente. Ad esempio, ho un ampio corpus di documenti dello stesso dominio. Ci sono parti di testo che contengono le informazioni chiave di cui parla un singolo documento. Voglio estrarre alcune …
16 nlp  text-mining 







3
Classificazione discriminatoria di una classe con background negativo squilibrato, eterogeneo?
Sto lavorando per migliorare un classificatore supervisionato esistente, per classificare le sequenze di {proteine} come appartenenti a una classe specifica (precursori dell'ormone neuropeptide) o no. Esistono circa 1.150 "positivi" noti, su uno sfondo di circa 13 milioni di sequenze di proteine ​​("Sfondo sconosciuto / scarsamente annotato"), o circa 100.000 proteine …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.