Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo

4
Quale modello statistico dovrei usare per analizzare la probabilità che un singolo evento abbia influenzato i dati longitudinali
Sto cercando di trovare una formula, un metodo o un modello da utilizzare per analizzare la probabilità che un evento specifico abbia influenzato alcuni dati longitudinali. Sto avendo difficoltà a capire cosa cercare su Google. Ecco uno scenario di esempio: Immagina di possedere un'azienda che ha una media di 100 …





1
Come decidere l'architettura della rete neurale?
Mi chiedevo come dobbiamo decidere quanti nodi nei layer nascosti e quanti layer nascosti mettere quando costruiamo un'architettura di rete neurale. Comprendo che il livello di input e output dipende dal set di formazione che abbiamo ma come possiamo decidere il livello nascosto e l'architettura generale in generale?

3
Set di dati per il riconoscimento di entità nominate su testo informale
Attualmente sto cercando set di dati etichettati per addestrare un modello per estrarre entità nominate dal testo informale (qualcosa di simile ai tweet). Poiché i documenti nel mio set di dati mancano spesso di lettere maiuscole e grammaticali, sto cercando dati di dominio un po 'più "informali" rispetto all'articolo di …
18 dataset  nlp 

3
Come aumentare lo sviluppo dell'algoritmo?
Nel lavorare sull'analisi dei dati esplorativi e nello sviluppo di algoritmi, trovo che la maggior parte del mio tempo è trascorso in un ciclo di visualizzazione, scrittura di codice, esecuzione su piccoli set di dati, ripetizione. I dati che ho tendono ad essere roba di tipo computer vision / sensor …
18 algorithms 

4
Come annotare documenti di testo con metadati?
Avendo molti documenti di testo (in linguaggio naturale, non strutturato), quali sono i modi possibili per annotarli con alcuni metadati semantici? Ad esempio, considera un breve documento: I saw the company's manager last day. Per poter estrarre informazioni da esso, devono essere annotate con dati aggiuntivi per essere meno ambigue. …


1
Come gestire le etichette di stringa nella classificazione multi-classe con keras?
Sono alle prime armi con l'apprendimento automatico e le macchine fotografiche e ora sto lavorando a un problema di classificazione delle immagini multi-classe usando le macchine fotografiche. L'input è immagine taggata. Dopo alcune preelaborazioni, i dati di allenamento sono rappresentati nell'elenco Python come: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] "cane", "gatto" …


1
Le dimensioni di t-sne sono significative?
Ci sono significati per le dimensioni di un inclusione t-sne? Come con PCA, abbiamo questo senso di massimizzazioni della varianza linearmente trasformate, ma per t-sne esiste un'intuizione oltre allo spazio che definiamo per la mappatura e la minimizzazione della distanza KL?

3
Implementazione Python della funzione di costo nella regressione logistica: perché la moltiplicazione dei punti in un'espressione ma la moltiplicazione degli elementi in un'altra
Ho una domanda di base che riguarda Python, intorpidimento e moltiplicazione delle matrici nel contesto della regressione logistica. Prima di tutto, vorrei scusarmi per non aver usato la notazione matematica. Sono confuso sull'uso della moltiplicazione dei punti matrice rispetto alla moltiplicazione saggia degli elementi. La funzione di costo è data …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.