La statistica è un approccio scientifico all'inferenza induttiva e alla previsione basata su modelli probabilistici dei dati. Per estensione, copre la progettazione di esperimenti e sondaggi per raccogliere dati a tale scopo.
Sto costruendo un modello di regressione e devo calcolare il seguito per verificare le correlazioni Correlazione tra 2 variabili categoriali multilivello Correlazione tra una variabile categoriale multilivello e una variabile continua VIF (fattore di inflazione di varianza) per variabili categoriali multilivello Credo che sia sbagliato usare il coefficiente di correlazione …
Sto usando TensorFlow per esperimenti principalmente con reti neurali. Anche se ho fatto alcuni esperimenti (XOR-Problem, MNIST, alcune cose di regressione, ...) ora, faccio fatica a scegliere la funzione di costo "corretta" per problemi specifici perché nel complesso potrei essere considerato un principiante. Prima di arrivare a TensorFlow ho codificato …
Sono un Rprogrammatore di lingue. Sono anche nel gruppo di persone che sono considerate Data Scientist ma che provengono da discipline accademiche diverse dalla CS. Questo funziona bene nel mio ruolo di Data Scientist, tuttavia, iniziando la mia carriera Re avendo solo una conoscenza di base di altri linguaggi di …
Ho un frame di dati Panda con diverse voci e voglio calcolare la correlazione tra le entrate di un tipo di negozi. Esistono numerosi negozi con dati sul reddito, classificazione dell'area di attività (teatro, negozi di vestiti, cibo ...) e altri dati. Ho provato a creare un nuovo frame di …
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 5 anni fa . Quali sono i libri sulla scienza e la matematica dietro la …
Sto cercando di trovare una formula, un metodo o un modello da utilizzare per analizzare la probabilità che un evento specifico abbia influenzato alcuni dati longitudinali. Sto avendo difficoltà a capire cosa cercare su Google. Ecco uno scenario di esempio: Immagina di possedere un'azienda che ha una media di 100 …
Supponiamo un insieme di dati vagamente strutturati (ad es. Tabelle Web / dati aperti collegati), composto da molte origini dati. Non esiste uno schema comune seguito dai dati e ogni fonte può usare attributi sinonimo per descrivere i valori (ad es. "Nazionalità" vs "bornIn"). Il mio obiettivo è trovare alcuni …
Sono un ingegnere informatico senza esperienza in statistica o matematica avanzata. Sto studiando il libro Python Machine Learning di Raschka e Mirjalili, ma quando ho cercato di capire la matematica del Machine Learning, non sono riuscito a capire il grande libro che un amico mi suggerisce Gli elementi dell'apprendimento statistico …
A causa di varie maledizioni di dimensionalità , l'accuratezza e la velocità di molte delle comuni tecniche predittive si riducono su dati ad alta dimensione. Quali sono alcune delle tecniche / trucchi / euristiche più utili che aiutano a gestire efficacemente i dati ad alta dimensione? Per esempio, Alcuni metodi …
Quali sono le condizioni dei dati a cui dovremmo prestare attenzione, in cui i valori p potrebbero non essere il modo migliore per decidere la significatività statistica? Esistono tipi di problemi specifici che rientrano in questa categoria?
La pagina di Wikipedia che cita "Gli elementi dell'apprendimento statistico" dice: In genere, per un problema di classificazione con funzionalità ppp , le funzioni vengono utilizzate in ogni divisione.⌊ p-√⌋⌊p⌋\lfloor \sqrt{p}\rfloor Capisco che si tratta di una supposizione abbastanza istruita e probabilmente è stata confermata da prove empiriche, ma ci …
Ho una serie di risultati da un test A / B (un gruppo di controllo, un gruppo di funzioni) che non rientrano in una distribuzione normale. In effetti la distribuzione ricorda più da vicino la distribuzione di Landau. Credo che il test t indipendente richieda che i campioni siano almeno …
Sono uno studente master CS nel data mining. Il mio supervisore una volta mi disse che prima di eseguire qualsiasi classificatore o fare qualsiasi cosa con un set di dati, devo comprendere appieno i dati e assicurarmi che siano puliti e corretti. Le mie domande: Quali sono le migliori pratiche …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.