Statistiche e Big Data bioinformatics

11

Risorse per l'apprendimento della catena Markov e dei modelli Markov nascosti

Sto cercando risorse (tutorial, libri di testo, webcast, ecc.) Per conoscere Markov Chain e HMM. Il mio background è di biologo e attualmente sono coinvolto in un progetto relativo alla bioinformatica. Inoltre, quali sono le basi matematiche necessarie di cui ho bisogno per avere una comprensione sufficiente dei modelli e …

57 references markov-process hidden-markov-model bioinformatics

3

Interpretazione del predittore e / o della risposta trasformati in tronchi

Mi chiedo se fa differenza nell'interpretazione se solo le variabili dipendenti, dipendenti e indipendenti, o solo le variabili indipendenti, vengono trasformate in log. Considera il caso di log(DV) = Intercept + B1*IV + Error Posso interpretare il IV come l'aumento percentuale, ma come cambia quando lo faccio log(DV) = Intercept …

46 regression data-transformation interpretation regression-coefficients logarithm r dataset stata hypothesis-testing contingency-tables hypothesis-testing statistical-significance standard-deviation unbiased-estimator t-distribution r functional-data-analysis maximum-likelihood bootstrap regression change-point regression sas hypothesis-testing bayesian randomness predictive-models nonparametric terminology parametric correlation effect-size loess mean pdf quantile-function bioinformatics regression terminology r-squared pdf maximum multivariate-analysis references data-visualization r pca r mixed-model lme4-nlme distributions probability bayesian prior anova chi-squared binomial generalized-linear-model anova repeated-measures t-test post-hoc clustering variance probability hypothesis-testing references binomial profile-likelihood self-study excel data-transformation skewness distributions statistical-significance econometrics spatial r regression anova spss linear-model

2

Generalizzazione continua della distribuzione binomiale negativa

La distribuzione binomiale negativa (NB) è definita su numeri interi non negativi e ha la funzione di massa di probabilitàHa senso considerare una distribuzione continua su reali non negativi definiti dalla stessa formula (sostituendo con x \ in \ mathbb R _ {\ ge 0} )? Il coefficiente binomiale può …

24 distributions negative-binomial count-data continuous-data bioinformatics

4

Cosa possiamo imparare sul cervello umano dalle reti neurali artificiali?

So che la mia domanda / titolo non è molto specifica, quindi cercherò di chiarirla: Le reti neurali artificiali hanno progetti relativamente rigidi. Naturalmente, generalmente, sono influenzati dalla biologia e cercano di costruire un modello matematico di reti neurali reali, ma la nostra comprensione delle reti neurali reali non è …

24 machine-learning neural-networks bioinformatics artificial-intelligence neuroscience

3

L'algoritmo MIC per rilevare correlazioni non lineari può essere spiegato in modo intuitivo?

Più recentemente, ho letto due articoli. Il primo riguarda la storia della correlazione e il secondo riguarda il nuovo metodo chiamato Maximal Information Coefficient (MIC). Ho bisogno del tuo aiuto per capire il metodo MIC per stimare le correlazioni non lineari tra le variabili. Inoltre, le istruzioni per l'uso in …

20 correlation nonparametric bioinformatics information-theory mutual-information

2

approcci di formazione per set di dati altamente squilibrati

Ho un set di dati di test altamente squilibrato. Il set positivo è composto da 100 casi mentre il set negativo è composto da 1500 casi. Per quanto riguarda la formazione, ho un pool di candidati più ampio: il set di formazione positivo ha 1200 casi e il set di …

16 machine-learning classification data-mining svm bioinformatics

4

Inquadratura della distribuzione binomiale negativa per il sequenziamento del DNA

La distribuzione binomiale negativa è diventata un modello popolare per i dati di conteggio (in particolare il numero previsto di letture di sequenziamento all'interno di una determinata regione del genoma da un determinato esperimento) in bioinformatica. Le spiegazioni variano: Alcuni lo spiegano come qualcosa che funziona come la distribuzione di …

16 poisson-distribution negative-binomial bioinformatics sequence-analysis

8

Quali sono gli "algoritmi caldi" per l'apprendimento automatico?

Questa è una domanda ingenua da parte di qualcuno che inizia a imparare l'apprendimento automatico. In questi giorni sto leggendo il libro "Apprendimento automatico: una prospettiva algoritmica" di Marsland. Lo trovo utile come libro introduttivo, ma ora vorrei passare ad algoritmi avanzati, quelli che attualmente stanno dando i migliori risultati. …

14 machine-learning clustering bioinformatics

7

Dare un senso alla teoria e alle applicazioni statistiche

Mi sono recentemente laureato con un master in modellistica medica e biologica, accompagnato da ingegneria matematica come sfondo. Anche se il mio programma educativo includeva una quantità significativa di corsi di statistica matematica (vedi sotto per un elenco), che ho gestito con voti piuttosto alti, finisco spesso per perdere completamente …

13 mathematical-statistics bioinformatics computational-statistics

2

Calcolo della probabilità di sovrapposizione dell'elenco genico tra un set di dati RNA seq e un chip ChIP

Spero che qualcuno su questi forum possa aiutarmi con questo problema di base negli studi sull'espressione genica. Ho fatto il sequenziamento profondo di un tessuto sperimentale e di controllo. Ho quindi ottenuto valori di arricchimento di piega dei geni nel controllo sperimentale del campione. Il genoma di riferimento ha ~ …

13 r genetics bioinformatics microarray biostatistics

2

Analisi di arricchimento per livello di duplicazione genica

Sfondo biologico Nel tempo, alcune specie di piante tendono a duplicare i loro interi genomi, ottenendo una copia aggiuntiva di ciascun gene. A causa dell'instabilità di questa configurazione, molti di questi geni vengono quindi eliminati e il genoma si riorganizza e si stabilizza, pronto per duplicare nuovamente. Questi eventi di …

11 generalized-linear-model contingency-tables fishers-exact genetics bioinformatics

3

Perché uno dovrebbe usare il quadrato d'età come covariata in uno studio di associazione genetica?

Perché uno dovrebbe usare l'età e il quadrato come covariate in uno studio di associazione genetica? Riesco a capire l'uso dell'età se è stato identificato come una covariata significativa, ma sono perplesso riguardo all'uso dell'età al quadrato.

11 multiple-regression polynomial predictor bioinformatics genetics

1

Perché Anova () e drop1 () hanno fornito risposte diverse per i GLMM?

Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

3

Qual è la differenza tra statistica e informatica?

Diciamo sempre che le statistiche riguardano solo i dati. Sappiamo anche che anche l'informatica sta acquisendo conoscenza dall'analisi dei dati. Ad esempio, le persone bioinformatiche possono andare completamente senza biostatistica. Voglio sapere qual è la differenza essenziale tra statistica e informatica.

10 bioinformatics

1

Quale modello di apprendimento profondo può classificare categorie che non si escludono a vicenda

Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …

9 machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

Domande taggate «bioinformatics»