Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo





3
Che cosa significa la notazione mAP @ [. 5: .95]?
Per il rilevamento, un modo comune per determinare se una proposta di oggetto era corretta è Intersection over Union (IoU, IU). Questo prende l'insieme UNUNA dei pixel dell'oggetto proposti e l'insieme dei pixel dell'oggetto reale e calcola:BBB ioo U( A , B ) = A ∩ BA ∪ BiooU(UN,B)=UN∩BUN∪BIoU(A, B) …


1
Algoritmi per il clustering di testo
Ho un problema nel raggruppare una grande quantità di frasi in gruppi in base al loro significato. Questo è simile a un problema quando hai molte frasi e vuoi raggrupparle in base al loro significato. Quali algoritmi sono suggeriti per fare questo? Non conosco il numero di cluster in anticipo …




6
Cosa usi per generare una dashboard in R?
Devo generare rapporti periodici (giornalieri, mensili) sul dashboard di analisi web. Saranno statici e non richiedono interazione, quindi immagina un file PDF come output di destinazione. I report mescoleranno tabelle e grafici (principalmente grafici sparkline e bullet creati con ggplot2). Pensa a dashboard stile Stephen Few / Perceptual Edge, come: …
17 r  visualization 

7
Visualizzazione di un grafico con un milione di vertici
Qual è lo strumento migliore da utilizzare per visualizzare (disegnare vertici e bordi) un grafico con 1000000 vertici? Ci sono circa 50000 spigoli nel grafico. E posso calcolare la posizione dei singoli vertici e bordi. Sto pensando di scrivere un programma per generare un svg. Altri suggerimenti?

5
Rilevamento visivo dei gatti mediante rilevazione di anomalie
Ho un progetto di hobby che sto pensando di impegnarmi come un modo per aumentare la mia esperienza finora limitata di apprendimento automatico. Ho preso e completato il MOOC di Coursera sull'argomento. La mia domanda riguarda la fattibilità del progetto. L'attività è la seguente: Di tanto in tanto i gatti …

2
Usa liblinear su big data per analisi semantiche
Uso Libsvm per addestrare i dati e prevedere la classificazione sul problema dell'analisi semantica . Ma ha un problema di prestazioni su dati su larga scala, perché l'analisi semantica riguarda il problema della dimensione n . L'anno scorso è stato rilasciato Liblinear e può risolvere il collo di bottiglia delle …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.