La disciplina all'incrocio tra informatica e scienze biologiche, che coinvolge l'organizzazione, il mantenimento e l'analisi dei dati provenienti da campi come la biologia molecolare, la genetica e la genomica
Sto cercando risorse (tutorial, libri di testo, webcast, ecc.) Per conoscere Markov Chain e HMM. Il mio background è di biologo e attualmente sono coinvolto in un progetto relativo alla bioinformatica. Inoltre, quali sono le basi matematiche necessarie di cui ho bisogno per avere una comprensione sufficiente dei modelli e …
Mi chiedo se fa differenza nell'interpretazione se solo le variabili dipendenti, dipendenti e indipendenti, o solo le variabili indipendenti, vengono trasformate in log. Considera il caso di log(DV) = Intercept + B1*IV + Error Posso interpretare il IV come l'aumento percentuale, ma come cambia quando lo faccio log(DV) = Intercept …
La distribuzione binomiale negativa (NB) è definita su numeri interi non negativi e ha la funzione di massa di probabilitàHa senso considerare una distribuzione continua su reali non negativi definiti dalla stessa formula (sostituendo con x \ in \ mathbb R _ {\ ge 0} )? Il coefficiente binomiale può …
So che la mia domanda / titolo non è molto specifica, quindi cercherò di chiarirla: Le reti neurali artificiali hanno progetti relativamente rigidi. Naturalmente, generalmente, sono influenzati dalla biologia e cercano di costruire un modello matematico di reti neurali reali, ma la nostra comprensione delle reti neurali reali non è …
Più recentemente, ho letto due articoli. Il primo riguarda la storia della correlazione e il secondo riguarda il nuovo metodo chiamato Maximal Information Coefficient (MIC). Ho bisogno del tuo aiuto per capire il metodo MIC per stimare le correlazioni non lineari tra le variabili. Inoltre, le istruzioni per l'uso in …
Ho un set di dati di test altamente squilibrato. Il set positivo è composto da 100 casi mentre il set negativo è composto da 1500 casi. Per quanto riguarda la formazione, ho un pool di candidati più ampio: il set di formazione positivo ha 1200 casi e il set di …
La distribuzione binomiale negativa è diventata un modello popolare per i dati di conteggio (in particolare il numero previsto di letture di sequenziamento all'interno di una determinata regione del genoma da un determinato esperimento) in bioinformatica. Le spiegazioni variano: Alcuni lo spiegano come qualcosa che funziona come la distribuzione di …
Questa è una domanda ingenua da parte di qualcuno che inizia a imparare l'apprendimento automatico. In questi giorni sto leggendo il libro "Apprendimento automatico: una prospettiva algoritmica" di Marsland. Lo trovo utile come libro introduttivo, ma ora vorrei passare ad algoritmi avanzati, quelli che attualmente stanno dando i migliori risultati. …
Mi sono recentemente laureato con un master in modellistica medica e biologica, accompagnato da ingegneria matematica come sfondo. Anche se il mio programma educativo includeva una quantità significativa di corsi di statistica matematica (vedi sotto per un elenco), che ho gestito con voti piuttosto alti, finisco spesso per perdere completamente …
Spero che qualcuno su questi forum possa aiutarmi con questo problema di base negli studi sull'espressione genica. Ho fatto il sequenziamento profondo di un tessuto sperimentale e di controllo. Ho quindi ottenuto valori di arricchimento di piega dei geni nel controllo sperimentale del campione. Il genoma di riferimento ha ~ …
Sfondo biologico Nel tempo, alcune specie di piante tendono a duplicare i loro interi genomi, ottenendo una copia aggiuntiva di ciascun gene. A causa dell'instabilità di questa configurazione, molti di questi geni vengono quindi eliminati e il genoma si riorganizza e si stabilizza, pronto per duplicare nuovamente. Questi eventi di …
Perché uno dovrebbe usare l'età e il quadrato come covariate in uno studio di associazione genetica? Riesco a capire l'uso dell'età se è stato identificato come una covariata significativa, ma sono perplesso riguardo all'uso dell'età al quadrato.
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
Diciamo sempre che le statistiche riguardano solo i dati. Sappiamo anche che anche l'informatica sta acquisendo conoscenza dall'analisi dei dati. Ad esempio, le persone bioinformatiche possono andare completamente senza biostatistica. Voglio sapere qual è la differenza essenziale tra statistica e informatica.
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.