Domande taggate «dataset»

Le richieste di set di dati sono fuori tema su questo sito. Utilizzare questo tag per domande relative alla creazione, all'elaborazione o alla manutenzione di set di dati.

3
L'idea di rendere i dati ha una media zero
Vedo spesso che le persone che fanno una dimensione / caratteristica di un set di dati hanno una media zero rimuovendo la media da tutti gli elementi. Ma non ho mai capito perché farlo? Qual è l'effetto di farlo come una fase di preelaborazione? Migliora le prestazioni di classificazione? Aiuta …



1
Differenze tra PROC Mixed e lme / lmer in R - gradi di libertà
Nota: questa domanda è una risposta, poiché la mia domanda precedente doveva essere cancellata per motivi legali. Confrontando PROC MIXED da SAS con la funzione lmedel nlmepacchetto in R, mi sono imbattuto in alcune differenze piuttosto confuse. Più specificamente, i gradi di libertà nei diversi test differiscono tra PROC MIXEDe …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 


2
Best practice per la creazione di "dati ordinati"
Hadley Wickham ha scritto un articolo stellare chiamato "Tidy Data" ( link ) in JSS lo scorso anno sulla manipolazione dei dati e riportando i dati in una condizione "ottimale" per eseguire analisi. Tuttavia, mi chiedevo quali fossero le migliori pratiche in termini di presentazione di dati tabulari in un …
12 dataset  tables 

2
La suddivisione dei dati in set di test e training è puramente una cosa "statistica"?
Sono uno studente di fisica che studia apprendimento automatico / scienza dei dati, quindi non intendo per questa domanda iniziare alcun conflitto :) Tuttavia, gran parte di qualsiasi programma di laurea in fisica è fare laboratori / esperimenti, il che significa molti dati elaborazione e analisi statistica. Tuttavia, noto una …


3
Esercitazione PCA pratica con dati
La ricerca in Internet del tutorial PCA offre migliaia di risultati (anche video). Molti tutorial sono molto buoni. Ma non sono in grado di trovare alcun esempio pratico in cui viene spiegato PCA utilizzando alcuni set di dati che posso usare per la dimostrazione. Ho bisogno di un tutorial che …

14
Quante informazioni puoi estrarre da un nome?
Un nome: primo, possibilmente un mezzo, e cognome. Sono curioso di sapere quante informazioni è possibile estrarre da un nome, utilizzando set di dati disponibili pubblicamente. So che puoi ottenere quanto segue ovunque tra una probabilità bassa-alta (a seconda dell'input) usando i dati del censimento degli Stati Uniti: 1) Genere. …






Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.