Pratica di ricerca per rendere disponibili pubblicamente la descrizione completa dell'esperimento, tutti i dati raccolti e tutti gli script di analisi dei dati, in modo che i risultati pubblicati possano essere riprodotti altrove.
La frase p -hacking (anche: "dragaggio dei dati" , "snooping" o "pesca") si riferisce a vari tipi di negligenza statistica in cui i risultati diventano artificialmente statisticamente significativi. Esistono molti modi per ottenere un risultato "più significativo", incluso ma non si limita affatto a: analizzando solo un sottoinsieme "interessante" dei …
La domanda: ci sono buoni esempi di ricerca riproducibile usando R che sono liberamente disponibili online? Esempio ideale: in particolare, esempi ideali fornirebbero: I dati grezzi (e idealmente i metadati che spiegano i dati), Tutto il codice R incluso l'importazione, l'elaborazione, l'analisi e la generazione dei dati, Sweave o qualche …
Per uno studio di simulazione devo generare variabili casuali che mostrano una correlazione (popolazione) predefinita a una variabile esistente .YYY Ho esaminato i Rpacchetti copulae CDVineche possono produrre distribuzioni multivariate casuali con una determinata struttura di dipendenza. Tuttavia, non è possibile fissare una delle variabili risultanti su una variabile esistente. …
Questo è emerso in alcune domande ora, e mi chiedevo qualcosa. Il campo nel suo insieme si è spostato verso la "riproducibilità" concentrandosi sulla disponibilità dei dati originali e sul codice in questione? Mi è stato sempre insegnato che il nucleo della riproducibilità non era necessariamente, come ho fatto riferimento …
Il mio posto di lavoro ha dipendenti provenienti da una vasta gamma di discipline, quindi generiamo dati in molte forme diverse. Di conseguenza, ogni squadra ha sviluppato il proprio sistema per l'archiviazione dei dati. Alcuni usano database Access o SQL; alcuni team (con mio orrore) fanno affidamento quasi interamente su …
Questo articolo " The Odds, continuamente aggiornato" dal NY Times è successo per attirare la mia attenzione. Per essere brevi, afferma che [Le statistiche bayesiane] si stanno rivelando particolarmente utili per affrontare problemi complessi, comprese ricerche come quella che la Guardia Costiera ha usato nel 2013 per trovare il pescatore …
Contesto: in risposta a una domanda precedente sulla ricerca riproducibile, ha scritto Jake Un problema che abbiamo scoperto durante la creazione del nostro archivio JASA è stato il cambiamento delle versioni e dei valori predefiniti dei pacchetti CRAN. Quindi, in quell'archivio, includiamo anche le versioni dei pacchetti che abbiamo usato. …
È utile studiare il codice di analisi dei dati degli esperti. Recentemente ho esaminato github e ci sono un certo numero di persone che condividono il codice di analisi dei dati lì. Ciò include alcuni pacchetti R (che ovviamente sono disponibili direttamente da CRAN), ma anche diversi esempi di ricerca …
Come contesto: quando si lavora con un set di dati molto grande, a volte mi viene chiesto se è possibile creare un set di dati sintetico in cui "conosciamo" la relazione tra predittori e la variabile di risposta o le relazioni tra predittori. Nel corso degli anni, mi sono imbattuto …
Poiché la scienza deve essere riproducibile, per definizione, vi è un crescente riconoscimento del fatto che dati e codice sono una componente essenziale della riproducibilità, come discusso dalla tavola rotonda di Yale per la condivisione di dati e codice . Nel riesaminare un manoscritto per un giornale che non richiede …
Sono rimasto impressionato dai risultati del documento ICML 2014 " Rappresentazioni distribuite di frasi e documenti " di Le e Mikolov. La tecnica che descrivono, chiamata "vettori di paragrafo", apprende rappresentazioni senza supervisione di paragrafi / documenti arbitrariamente lunghi, basati su un'estensione del modello word2vec. Il documento riporta prestazioni all'avanguardia …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Sto usando Sweave e xtable per generare un rapporto. Vorrei aggiungere un po 'di colorante su un …
Ho una domanda specifica sulla convalida nella ricerca sull'apprendimento automatico. Come sappiamo, il regime di apprendimento automatico chiede ai ricercatori di addestrare i loro modelli sui dati di addestramento, scegliere tra i modelli candidati per set di validazione e riportare l'accuratezza sul set di test. In uno studio molto rigoroso, …
Quindi hai deciso di supportare l'idea della ricerca riproducibile e vuoi rendere i tuoi dati disponibili online affinché le persone possano vederli e utilizzarli. La domanda è: dove lo si ospita? La mia prima inclinazione è ovviamente lo spazio web privato che ho su un server universitario, ma queste cose …
Negli ultimi anni, diversi studiosi hanno sollevato un problema dannoso nel test delle ipotesi scientifiche, soprannominato "grado di libertà dei ricercatori", il che significa che gli scienziati hanno numerose scelte da fare durante la loro analisi che tendono a trovare con un valore p <5%. Queste scelte ambigue sono, ad …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.