I risultati di adattamento alla curva in un documento scientifico


11

(Spero che questa domanda si adatti a questo sito; in caso contrario, accetta le mie scuse).

Ho eseguito una certa simulazione e ho ottenuto una serie temporale y (t), t = 0, 1, ... 20. Dopo aver provato alcune funzioni, ho scoperto che:

y(t) =~ 1 / (A t + B)

Dove A e B sono coefficienti che ho calcolato usando la regressione lineare, con R ^ 2> 0,99.

Qual è il modo standard per riportare tali risultati in un articolo scientifico? In particolare:

R. Non ho una spiegazione teorica, perché l'output assomigli a questo (so che dovrebbe diminuire e che è limitato dal basso, ma non molto di più). Era solo un'ipotesi di successo. Devo descrivere tutte le altre ipotesi fallite che ho provato?

B. Ogni volta che eseguo la simulazione, ottengo valori leggermente diversi di A e B. Devo solo segnalare una corsa casuale o devo eseguire la simulazione più volte e calcolare la media dei risultati? In tal caso, quante volte è sufficiente?


Che cosa vuoi trasmettere? Cosa rappresenta ogni singola simulazione?
Bill Barth,

È una simulazione della proprietà fondiaria. Ci sono N cittadini e N terreni. Inizialmente, ogni appezzamento di terreno viene dato a un cittadino casuale. Quindi, ogni anno, ogni terra viene venduta con una certa probabilità p, e se viene effettivamente venduta, l'acquirente viene selezionato a caso. Dopo 50 anni, eseguo una procedura "Giubileo" in cui alcune terre vengono restituite ai proprietari originali, se questi proprietari attualmente non hanno terra. Misuro il numero di cittadini senza terra (y) dopo ogni Giubileo (t). Certamente y (t) non è in aumento. Voglio dimostrare che sta diminuendo in modo prevedibile e che converge a 0.
Erel Segal-Halevi,

Mi sembra che dovresti sviluppare una rappresentazione statistica di e , quindi (media, mediana, ecc.). BAB
Bill Barth,

2
Considera un modello con N + 1 specie diverse dove , che indica la concentrazione di proprietari terrieri con appezzamenti di terra. Ora puoi applicare la teoria della cinetica chimica al tuo problema. n = 0 N nxnn=0Nn
Deathbreath,

Bill: vuoi dire che dovrei calcolare A e B molte volte, quindi riportare la media e lo std? Penso che un approccio migliore sia fare una singola regressione lineare con tutti i campioni di tutte le simulazioni. Ma quante volte dovrei eseguire la simulazione?
Erel Segal-Halevi,

Risposte:


5

Stai cercando di adattare una legge di potere alla tua distribuzione. Molto interessante. Questi mostrano tutto il tempo in teoria dei grafi , social network , e un gran numero di altri posti.

Ci sono alcuni tutorial su come adattare i tuoi dati qui e qui .

Inoltre, in riferimento alla domanda A., in che modo la probabilità che una persona acquisti un terreno dipende da quanta terra possiede già? Potresti essere in grado di utilizzare il modello di Barbasi per spiegare perché una legge sul potere è una misura ragionevole per i tuoi dati.

aggiornamento: l' ho usato e funziona benissimo: https://pypi.python.org/pypi/powerlaw


+1 per tutti i link! Ho anche pensato alla legge del potere, ma la sua forma semplice (y = A t ^ k) non implica la forma che ho trovato, a causa della costante B (y = (A t + B) ^ - 1). Esiste una forma più generale?
Erel Segal-Halevi,

Se sei interessato a descrivere la forma della curva, dovresti fattorizzare e spostare prima di adattare una legge di potenza. Il fatto che tu abbia una B non è rilevante per la forma della curva.
dranxo,

Scusa, non ti ho capito, cosa intendi con "allora dovresti fattorizzare e spostare"?
Erel Segal-Halevi,

Impostare x = t + B / A. Quindi (At + B) ^ {- 1} = (A * x) ^ {- 1} che è il modulo nei collegamenti.
dranxo,

1
tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf
dranxo

7

Alcuni pensieri sulla tua domanda:

  • Il modo in cui riferisci che il tuo modello si adatta dipende molto dal tuo pubblico e dal tuo campo. Ad esempio, nel mio campo, le statistiche di adattamento del modello come R ^ 2 sono riportate molto raramente, considerate non impressionanti né particolarmente utili. Invece, alcuni criteri per il modo in cui sei arrivato al modello in cui sei arrivato tende a essere descritti, e quindi riferisci i risultati del tuo modello - tutti supponiamo che tu effettivamente si adatti al modello correttamente.
  • "Mi sono imbattuto in questo modulo" è una cattiva spiegazione. Davvero male. Nonostante la passione per le storie di genio accidentale, come la scoperta della penicillina o del chinino, la "fortuna cieca e stupida" non è un processo scientifico affidabile. Ad esempio, hai dimostrato che quel modulo è adatto per adattare i tuoi dati, ma non hai ancora dimostrato che è meglio per adattare i tuoi dati. R ^ 2 da solo non è una metrica sufficiente per valutare in che misura il modello si adatta ai dati. Vedi il quartetto di Anscombe .
  • Come accennato da @rcompton, sembra che tu stia cercando di adattare una distribuzione della legge del potere senza saperlo, ma anche se riesci ad adattare una legge del potere, è davvero meglio se trovi qualche motivo per cui pensi che sia una legge del potere . Potrebbe essere sufficiente tracciare Y nel tempo, andare su CrossValidated (o un college / dipartimento più a suo agio con le statistiche) e passare sistematicamente a distribuzioni che potrebbero darti più o meno quell'aspetto . Ce ne sono altri oltre alla distribuzione della legge del potere che potrebbero darti una risposta migliore.

+1 per gli approfondimenti. "ripassa sistematicamente le distribuzioni che potrebbero darti più o meno quell'aspetto". - dove posso trovarli?
Erel Segal-Halevi,

@ErelSegalHalevi Potresti iniziare da CrossValidated, questo sito gemello che riguarda le statistiche e l'analisi dei dati.
Fomite
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.