Domande taggate «python»

Python è un linguaggio di programmazione comunemente usato per l'apprendimento automatico. Usa questo tag per qualsiasi domanda * sull'argomento * che (a) coinvolga `Python` sia come parte critica della domanda o risposta prevista, e (b) non sia * solo * su come usare` Python`.

2
Selezione delle funzioni con foreste casuali
Ho un set di dati con principalmente variabili finanziarie (120 caratteristiche, esempi 4k) che sono per lo più altamente correlate e molto rumorose (indicatori tecnici, ad esempio), quindi vorrei selezionare circa 20-30 max per un uso successivo con la formazione dei modelli (classificazione binaria - aumento diminuzione). Stavo pensando di …



3
Regressione logistica: Scikit Learn vs glmnet
Sto cercando di duplicare i risultati dalla sklearnlibreria di regressione logistica usando il glmnetpacchetto in R. Dalla documentazione sullasklearn regressione logistica , sta cercando di minimizzare la funzione di costo sotto penalità l2 minw,c12wTw+C∑i=1Nlog(exp(−yi(XTiw+c))+1)minw,c12wTw+C∑i=1Nlog⁡(exp⁡(−yi(XiTw+c))+1)\min_{w,c} \frac12 w^Tw + C\sum_{i=1}^N \log(\exp(-y_i(X_i^Tw+c)) + 1) Dalle vignette di glmnet, la sua implementazione riduce al …


3
Come tracciare l'output dei dati del clustering?
Ho provato a raggruppare un insieme di dati (un insieme di segni) e ho ottenuto 2 cluster. Vorrei rappresentarlo graficamente. Un po 'confuso sulla rappresentazione, dal momento che non ho le coordinate (x, y). Inoltre, cerco la funzione MATLAB / Python per farlo. MODIFICARE Penso che pubblicare i dati renda …

1
Quale metodo di confronto multiplo utilizzare per un modello lmer: lsmeans o glht?
Sto analizzando un set di dati usando un modello di effetti misti con un effetto fisso (condizione) e due effetti casuali (partecipante a causa del disegno e della coppia all'interno del soggetto). Il modello è stato generato conlme4 pacchetto: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Successivamente, ho eseguito un test del rapporto di verosimiglianza di …


2
Differenza tra la selezione di funzioni in base a "regressione F" e in base ai valori di
Il confronto delle funzionalità utilizza F-regressionle stesse funzionalità correlate con l'etichetta individualmente e l'osservazione del valore ?R2R2R^2 Ho visto spesso i miei colleghi utilizzare una F regressionselezione di funzionalità nella loro pipeline di machine learning da sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Alcuni, per favore, mi dicono: perché fornisce gli stessi risultati della semplice …


1
Raccordo di distribuzione beta in Scipy
Secondo Wikipedia, la distribuzione della probabilità beta ha due parametri di forma: e β .αα\alphaββ\beta Quando chiamo scipy.stats.beta.fit(x)Python, dove si xtrova un gruppo di numeri nell'intervallo , vengono restituiti 4 valori. Questo mi sembra strano.[0,1][0,1][0,1] Dopo aver cercato su google ho scoperto che uno dei valori di ritorno deve essere …



1
Utilizzo di iloc per impostare i valori [chiuso]
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Questa riga restituisce le prime 4 righe nel dataframe combinedperfeature_a combined.iloc[0:4]["feature_a"] Come previsto, questa riga successiva restituisce …
13 python  pandas 

2
Quando registrare / espandere le variabili quando si utilizzano modelli a foresta casuale?
Sto facendo regressione utilizzando le foreste casuali per prevedere i prezzi in base a diversi attributi. Il codice è scritto in Python usando Scikit-learn. Come decidete se trasformare le variabili usando exp/ logprima di usarle per adattarsi al modello di regressione? È necessario quando si utilizza un approccio Ensemble come …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.