Domande taggate «statistics»

La statistica è un approccio scientifico all'inferenza induttiva e alla previsione basata su modelli probabilistici dei dati. Per estensione, copre la progettazione di esperimenti e sondaggi per raccogliere dati a tale scopo.

1
Come ottenere la correlazione tra due variabili categoriali e una variabile categoriale e una variabile continua?
Sto costruendo un modello di regressione e devo calcolare il seguito per verificare le correlazioni Correlazione tra 2 variabili categoriali multilivello Correlazione tra una variabile categoriale multilivello e una variabile continua VIF (fattore di inflazione di varianza) per variabili categoriali multilivello Credo che sia sbagliato usare il coefficiente di correlazione …


11
Data Science in C (o C ++)
Sono un Rprogrammatore di lingue. Sono anche nel gruppo di persone che sono considerate Data Scientist ma che provengono da discipline accademiche diverse dalla CS. Questo funziona bene nel mio ruolo di Data Scientist, tuttavia, iniziando la mia carriera Re avendo solo una conoscenza di base di altri linguaggi di …


4
Libri sulla "Scienza" in Data Science? [chiuso]
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 5 anni fa . Quali sono i libri sulla scienza e la matematica dietro la …

9
Qualche console R online?
Sto cercando una console online per la lingua R. Come scrivo il codice e il server dovrebbe eseguire e fornirmi l'output. Simile al sito Web Datacamp.
24 r  statistics 

4
Quale modello statistico dovrei usare per analizzare la probabilità che un singolo evento abbia influenzato i dati longitudinali
Sto cercando di trovare una formula, un metodo o un modello da utilizzare per analizzare la probabilità che un evento specifico abbia influenzato alcuni dati longitudinali. Sto avendo difficoltà a capire cosa cercare su Google. Ecco uno scenario di esempio: Immagina di possedere un'azienda che ha una media di 100 …




3
Quando i valori di p sono ingannevoli?
Quali sono le condizioni dei dati a cui dovremmo prestare attenzione, in cui i valori p potrebbero non essere il modo migliore per decidere la significatività statistica? Esistono tipi di problemi specifici che rientrano in questa categoria?

1
Quante funzioni da campionare usando le foreste casuali
La pagina di Wikipedia che cita "Gli elementi dell'apprendimento statistico" dice: In genere, per un problema di classificazione con funzionalità ppp , le funzioni vengono utilizzate in ogni divisione.⌊ p-√⌋⌊p⌋\lfloor \sqrt{p}\rfloor Capisco che si tratta di una supposizione abbastanza istruita e probabilmente è stata confermata da prove empiriche, ma ci …


6
Set di dati che comprendono le migliori pratiche
Sono uno studente master CS nel data mining. Il mio supervisore una volta mi disse che prima di eseguire qualsiasi classificatore o fare qualsiasi cosa con un set di dati, devo comprendere appieno i dati e assicurarmi che siano puliti e corretti. Le mie domande: Quali sono le migliori pratiche …

3
Esistono buoni modelli linguistici predefiniti per Python?
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.