Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sono nuovo di R e dell'analisi delle serie storiche. Sto cercando di trovare la tendenza di lunghe (40 anni) serie temporali giornaliere di temperatura e ho cercato di approssimazioni diverse. Il primo è solo una semplice regressione lineare e il secondo è la decomposizione stagionale delle serie temporali di Loess. …
Domanda: Dal punto di vista dello statistico (o di un professionista), si può inferire la causalità usando i punteggi di propensione con uno studio osservazionale ( non un esperimento )? Per favore, non vuoi iniziare una guerra alla fiamma o un dibattito fanatico. Contesto: all'interno del nostro programma di dottorato …
Sono più un programmatore che uno statistico, quindi spero che questa domanda non sia troppo ingenua. Succede nell'esecuzione del programma di campionamento in momenti casuali. Se prendo N = 10 campioni a tempo casuale dello stato del programma, potrei vedere la funzione Foo in esecuzione su, ad esempio, I = …
Attualmente devo analizzare circa 20 milioni di record e costruire modelli di previsione. Finora ho provato Statistica, SPSS, RapidMiner e R. Tra questi Statistica sembra essere il più adatto per gestire il data mining e l'interfaccia utente di RapidMiner è anche molto utile ma sembra che Statistica, RapidMiner e SPSS …
Nel contesto dell'apprendimento automatico, qual è la differenza tra apprendimento senza supervisione apprendimento supervisionato e apprendimento semi-supervisionato? E quali sono alcuni dei principali approcci algoritmici da considerare?
La Meccanica Quantistica ha generalizzato la teoria della probabilità a numeri negativi / immaginari, principalmente per spiegare schemi di interferenza, dualità onda / particella e cose generalmente strane come quella. Può essere visto in modo più astratto, tuttavia, come una generalizzazione non commutativa della probabilità bayesiana (citazione da Terrence Tao). …
Supponi di avere una borsa con nnn tessere, ognuna con una lettera. Ci sono nAnAn_A tessere A con la lettera 'A', con 'B', e così via, e tessere 'jolly' (abbiamo ). Supponiamo di avere un dizionario con un numero finito di parole. Scegli piastrelle dalla borsa senza sostituzione. Come calcoleresti …
Sto lavorando sull'apprendimento automatico teorico - sull'apprendimento di trasferimento, per essere precisi - per il mio dottorato di ricerca. Per curiosità, perché dovrei seguire un corso sull'ottimizzazione convessa? Quali sono i vantaggi dell'ottimizzazione convessa che posso utilizzare nella mia ricerca sull'apprendimento automatico teorico?
La precisione media (AP) è l'area sotto la curva di richiamo di precisione (AUC della curva PR)? MODIFICARE: ecco alcuni commenti sulla differenza tra PR AUC e AP. L'AUC è ottenuto per interpolazione trapezoidale della precisione. Una metrica alternativa e di solito quasi equivalente è la precisione media (AP), restituita …
Ho letto in numerosi riferimenti che la stima del lazo per il vettore di parametro di regressione è equivalente al modo posteriore di in cui la distribuzione precedente per ciascun è una doppia distribuzione esponenziale (nota anche come distribuzione di Laplace).BBBBBBBiBiB_i Ho cercato di dimostrarlo, qualcuno può approfondire i dettagli?
Ho completato il corso di Machine Learning di Andrew Ng circa un anno fa e sto scrivendo la mia esplorazione di matematica al liceo sul funzionamento della regressione logistica e sulle tecniche per ottimizzare le prestazioni. Una di queste tecniche è, ovviamente, la regolarizzazione. Lo scopo della regolarizzazione è prevenire …
Supponiamo di avere uno scenario di confronti multipli come l' inferenza post hoc su statistiche a coppie o come una regressione multipla, in cui stiamo facendo un totale di mmm confronti. Supponiamo anche che vorremmo sostenere l'inferenza in questi multipli usando intervalli di confidenza. 1. Applichiamo più aggiustamenti di confronto …
Sto cercando di risolvere l'attività di regressione. Ho scoperto che 3 modelli funzionano bene per diversi sottoinsiemi di dati: LassoLARS, SVR e Gradient Tree Boosting. Ho notato che quando faccio previsioni usando tutti questi 3 modelli e poi faccio una tabella di "output reale" e output dei miei 3 modelli, …
Devo usare variabili binarie (valori 0 e 1) in k-medie. Ma k-mean funziona solo con variabili continue. So che alcune persone usano ancora queste variabili binarie in k-means ignorando il fatto che k-mean è progettato solo per variabili continue. Questo è inaccettabile per me. Domande: Quindi qual è il modo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.