Teorema limite centrale per mediane campione


55

Se calcolo la mediana di un numero sufficientemente ampio di osservazioni tratte dalla stessa distribuzione, il teorema del limite centrale afferma che la distribuzione delle mediane si avvicinerà a una distribuzione normale? La mia comprensione è che questo è vero con i mezzi di un gran numero di campioni, ma lo è anche con le mediane?

In caso contrario, qual è la distribuzione di base delle mediane campione?


9
Hai bisogno di alcune condizioni di regolarità in modo che la mediana abbia una distribuzione normale sotto riscalaggio nel limite. Per vedere cosa può andare storto, considera qualsiasi distribuzione su un numero finito di punti, diciamo, X uniforme su {1,0,1} .
cardinale il

5
Per quanto riguarda le condizioni di regolarità: se la distribuzione sottostante ha una densità che è differenziabile nella mediana (vera), la mediana del campione avrà una distribuzione normale asintotica con una varianza che dipende da detto derivato. Questo vale più in generale per quantili arbitrari.
cardinale il

6
@cardinale Credo che occorrano ulteriori condizioni: quando la densità è seconda differenziabile, è uguale a zero alla mediana e ha zero prima derivata lì, la distribuzione asintotica della mediana del campione sarà bimodale.
whuber

4
@whuber: Sì, poiché la densità (non la sua derivata come ho inavvertitamente affermato in precedenza) entra nella varianza come reciproca, il valore della densità in quel punto non deve essere zero. Ci scusiamo per aver abbandonato quella condizione!
cardinale il

4
Controesempi elementari possono essere realizzate con qualsiasi distribuzione che assegna probabilità di 1/2 per un intervallo (,μ] e probabilità 1/2 a [μ+δ,) dove δ>0, come ad esempio un Bernoulli (1/2) ( μ=0,δ=1 ). Le mediane del campione saranno inferiori o uguali a μtutte le volte che sono maggiori o uguali a μ+δ . La possibilità che la mediana non sia in (μ,μ+δ) avvicina a 0 per campioni di grandi dimensioni, lasciando effettivamente un "gap" in (μ,μ+δ) nella distribuzione limitante, che ovviamente non sarà normale, non importa come sia standardizzato.
whuber

Risposte:


39

Se lavori in termini di variabili indicatore (cioè Zi=1 se Xix e 0 altrimenti), puoi applicare direttamente il teorema del limite centrale a una media di Z e, usando il metodo Delta , trasformalo in una distribuzione normale asintotica per FX1(Z¯) , che a sua volta significa che si ottiene la normalità asintotica per quantili fissi di X .

Quindi non solo la mediana, ma i quartili, il 90 ° percentile, ... ecc.

Liberamente, se stiamo parlando del q quantile di campione in campioni sufficientemente grandi, otteniamo che avrà approssimativamente una distribuzione normale con la media del q quantile di popolazione xq e la varianza q(1q)/(nfX(xq)2) .

Quindi, per la mediana ( q=1/2 ), la varianza sufficientemente grandi campioni sarà circa 1/(4nfX(μ~)2) .

Ovviamente, hai bisogno di tutte le condizioni per mantenere, quindi non funziona in tutte le situazioni, ma per distribuzioni continue in cui la densità nel quantile della popolazione è positiva e differenziabile, ecc., ...

Inoltre, non vale per quantili estremi, perché il CLT non entra in gioco (la media delle Z non sarà asintoticamente normale). Hai bisogno di una teoria diversa per valori estremi.


Modifica: la critica di Whuber è corretta; questo funzionerebbe se x fosse una mediana della popolazione piuttosto che una mediana del campione. L'argomento deve essere modificato per funzionare davvero correttamente.


5
Penso che manchi un pezzo logico di questa spiegazione: come si usano esattamente gli indicatori per ottenere mediane campione ? Vedo come quando è la mediana sottostante , l'indicatore X ix funzionerà: ma questo indicatore non coincide con la mediana del campione o con qualsiasi sua funzione. xXix
whuber

Come si passa dalle distribuzioni normali asintotiche per per ottenere la normalità asintotica per i quantili fissi di X? Modifica: ho capito che ¯ Z diventa un valore percentuale tra 0 e 100%, quindi i valori quantici sono asintoticamente normaliFX1(Z¯)Z¯
adamo,

49

L'idea chiave è che la distribuzione campionaria della mediana è semplice da esprimere in termini di funzione di distribuzione ma più complicata da esprimere in termini di valore mediano. Una volta compreso come la funzione di distribuzione può riesprimere i valori come probabilità e viceversa, è facile ricavare l' esatta distribuzione campionaria della mediana. È necessaria una piccola analisi del comportamento della funzione di distribuzione vicino alla sua mediana per dimostrare che questo è asintoticamente normale.

(La stessa analisi funziona per la distribuzione campionaria di qualsiasi quantile, non solo della mediana.)

Non cercherò di essere rigoroso in questa esposizione, ma lo realizzo in passaggi che sono prontamente giustificati in modo rigoroso se hai una mente per farlo.


Intuizione

Queste sono istantanee di una scatola contenente 70 atomi di un gas atomico caldo:

Figura 1

In ogni immagine ho trovato una posizione, mostrata come una linea verticale rossa, che divide gli atomi in due gruppi uguali tra sinistra (disegnata come punti neri) e destra (punti bianchi). Questa è una mediana delle posizioni: 35 degli atomi si trovano alla sua sinistra e 35 alla sua destra. Le mediane cambiano perché gli atomi si muovono casualmente attorno alla scatola.

Siamo interessati alla distribuzione di questa posizione intermedia. A tale domanda si risponde invertendo la mia procedura: prima disegniamo una linea verticale da qualche parte, diciamo nella posizione . Qual è la probabilità che metà degli atomi sia a sinistra di xe metà a destra? Gli atomi a sinistra avevano singolarmente la possibilità di essere x a sinistra. Gli atomi a destra individualmente avevano probabilità di 1 - x di essere a destra. Supponendo che le loro posizioni siano statisticamente indipendenti, le probabilità si moltiplicano, dando x 35 ( 1 - x ) 35xxx1xx35(1x)35per la possibilità di questa particolare configurazione. Una configurazione equivalente potrebbe essere raggiunta per una diversa divisione dei atomi in due pezzi da 35 elementi. L'aggiunta di questi numeri per tutte le possibili suddette divisioni dà una possibilità7035

Pr(x is a median)=Cxn/2(1x)n/2

dove è il numero totale di atomi e è proporzionale al numero di divisioni di atomi in due sottogruppi uguali.C nnCn

Questa formula identifica la distribuzione della mediana come Beta di distribuzione(n/2+1,n/2+1) .

Ora considera una scatola con una forma più complicata:

figura 2

Ancora una volta le mediane variano. Poiché la scatola è bassa vicino al centro, non c'è molto del suo volume lì: un piccolo cambiamento nel volume occupato dalla metà sinistra degli atomi (ancora una volta quelli neri) - o, potremmo anche ammettere, l' area a sinistra, come mostrato in queste figure, corrisponde a un cambiamento relativamente grande nella posizione orizzontale della mediana. Infatti, poiché l'area sottostata da una piccola sezione orizzontale della scatola è proporzionale all'altezza lì, i cambiamenti nelle mediane sono divisi per l'altezza della scatola. Questo fa sì che la mediana sia più variabile per questa casella che per la casella quadrata, perché questa è molto più bassa nel mezzo.

In breve, quando misuriamo la posizione della mediana in termini di area (a sinistra ea destra), l'analisi originale (per una casella quadrata) rimane invariata. La forma della scatola complica la distribuzione solo se insistiamo nel misurare la mediana in termini di posizione orizzontale. Quando lo facciamo, la relazione tra l'area e la rappresentazione della posizione è inversamente proporzionale all'altezza del riquadro.

C'è altro da imparare da queste immagini. È chiaro che quando pochi atomi si trovano nella (una) casella, vi è una maggiore possibilità che metà di essi possa finire accidentalmente raggruppata su entrambi i lati. Con l'aumentare del numero di atomi, il potenziale per uno squilibrio così estremo diminuisce. Per tracciare questo, ho preso "film" - una lunga serie di 5000 fotogrammi - per la scatola curva riempita con , quindi con , quindi e infine con atomi, e ho notato le mediane. Ecco gli istogrammi delle posizioni mediane:15 75 37531575375

Figura 3

Chiaramente, per un numero sufficientemente ampio di atomi, la distribuzione della loro posizione mediana inizia ad apparire a forma di campana e si restringe: sembra un risultato del Teorema del limite centrale, no?


Risultati quantitativi

Il "riquadro", ovviamente, raffigura la densità di probabilità di una certa distribuzione: la parte superiore è il grafico della funzione di densità (PDF). Pertanto le aree rappresentano le probabilità. Posizionare punti casualmente e indipendentemente all'interno di una scatola e osservare le loro posizioni orizzontali è un modo per estrarre un campione dalla distribuzione. (Questa è l'idea alla base del campionamento del rifiuto. )n

La figura successiva collega queste idee.

Figura 4

Sembra complicato, ma è davvero abbastanza semplice. Ci sono quattro grafici correlati qui:

  1. La trama in alto mostra il PDF di una distribuzione insieme a un campione casuale di dimensione . I valori maggiori della mediana sono mostrati come punti bianchi; valori inferiori alla mediana come punti neri. Non ha bisogno di una scala verticale perché sappiamo che l'area totale è l'unità.n

  2. Il diagramma centrale è la funzione di distribuzione cumulativa per la stessa distribuzione: utilizza l' altezza per indicare la probabilità. Condivide il suo asse orizzontale con il primo diagramma. Il suo asse verticale deve andare da a perché rappresenta le probabilità.101

  3. La trama di sinistra deve essere letta lateralmente: è il PDF della distribuzione Beta . Mostra come varierà la mediana nel riquadro, quando la mediana viene misurata in termini di aree a sinistra e a destra del centro (anziché misurata dalla sua posizione orizzontale). Ho disegnato punti casuali da questo PDF, come mostrato, e li ho collegati con linee tratteggiate orizzontali alle posizioni corrispondenti sul CDF originale: ecco come i volumi (misurati a sinistra) vengono convertiti in posizioni (misurati in alto, al centro e grafica in basso). Uno di questi punti corrisponde effettivamente alla mediana mostrata nella trama in alto; Ho disegnato una solida linea verticale per dimostrarlo.16(n/2+1,n/2+1)16

  4. Il grafico inferiore è la densità di campionamento della mediana, misurata dalla sua posizione orizzontale. Si ottiene convertendo l'area (nel grafico a sinistra) in posizione. La formula di conversione è data dall'inverso del CDF originale: questa è semplicemente la definizione del CDF inverso! (In altre parole, il CDF converte la posizione in area a sinistra; il CDF inverso converte indietro da un'area in posizione.) Ho tracciato delle linee tratteggiate verticali che mostrano come i punti casuali dal diagramma sinistro vengono convertiti in punti casuali all'interno del diagramma inferiore . Questo processo di lettura attraverso e poi giù ci dice come andare da un'area alla posizione.

Sia il CDF della distribuzione originale (diagramma centrale) e il CDF della distribuzione Beta. Per trovare la possibilità che la mediana si trovi a sinistra di una posizione , per prima cosa usa per ottenere l' area a sinistra di nella casella: questa è stessa. La distribuzione Beta a sinistra ci dice la possibilità che metà degli atomi si trovino all'interno di questo volume, dando : questo è il CDF della posizione mediana . Per trovare il suo PDF (come mostrato nella trama in basso), prendi la derivata:FGxFxF(x)G(F(x))

ddxG(F(x))=G(F(x))F(x)=g(F(x))f(x)

dove è il PDF (trama in alto) e è il PDF beta (trama a sinistra).fg

Questa è una formula esatta per la distribuzione della mediana per qualsiasi distribuzione continua. (Con una certa cura nell'interpretazione può essere applicato a qualsiasi distribuzione, sia continua che no.)


Risultati asintotici

Quando è molto grande e non ha un salto alla sua mediana, la mediana del campione deve variare da vicino attorno alla vera mediana della distribuzione. Supponendo anche che il PDF sia continuo vicino a , nella formula precedente non cambierà molto dal suo valore in dato da Inoltre, anche non cambierà molto dal suo valore: al primo ordine,nFμfμ f(x)μ,f(μ).F

F(x)=F(μ+(xμ))F(μ)+F(μ)(xμ)=1/2+f(μ)(xμ).

Pertanto, con un'approssimazione in costante miglioramento man mano che cresce,n

g(F(x))f(x)g(1/2+f(μ)(xμ))f(μ).

Questo è semplicemente uno spostamento della posizione e della scala della distribuzione Beta. Il riscalamento di dividerà la sua varianza per (che sarebbe meglio essere diverso da zero!). Per inciso, la varianza di Beta è molto vicina a .f(μ)f(μ)2(n/2+1,n/2+1)n/4

Questa analisi può essere vista come un'applicazione del Metodo Delta .

Infine, Beta è approssimativamente normale per grande . Ci sono molti modi per vederlo; forse il più semplice è guardare il logaritmo del suo PDF vicino a :(n/2+1,n/2+1)n1/2

log(C(1/2+x)n/2(1/2x)n/2)=n2log(14x2)+C=C2nx2+O(x4).

(Le costanti e limitano a normalizzare l'area totale in unità.) Attraverso il terzo ordine in quindi, questo è lo stesso del registro del PDF normale con varianza (Questo argomento è reso rigoroso utilizzando funzioni di generazione caratteristiche o cumulative anziché il registro del PDF.)CCx,1/(4n).

Mettendo tutto questo, lo concludiamo

  • La distribuzione della mediana del campione ha una varianza di circa ,1/(4nf(μ)2)

  • ed è approssimativamente normale per grande ,n

  • tutto a condizione che il PDF sia continuo e diverso da zero alla medianafμ.


Mi piace quella quarta figura. L'hai fatto usando R?
EngrStudent - Ripristina Monica

@Engr Probabilmente avrei potuto farne uno simile R, forse usando layout, ma in realtà è stato fatto con Mathematica 9.
whuber

1
È una cosa di bellezza.
EngrStudent - Ripristina Monica

@whuber non è Beta (n / 2 + 1, n / 2 + 1) in Beta (1,1) prima? Vedi ad es. Ine.pt/revstat/pdf/rs080204.pdf
Tim

1
@Tim Non capisco la rilevanza del riferimento a un precedente, ma apprezzo il fatto che tu abbia sottolineato che il nome corretto della distribuzione Beta identificata nella sezione "Intuition" è Beta . Lo riparerò ovunque si verifichi (che si trova in diversi punti della discussione). (n/2+1,n/2+1)
whuber

18

La risposta illuminante di @EngrStudent ci dice che dovremmo aspettarci risultati diversi quando la distribuzione è continua e quando è discreta (i grafici "rossi", in cui la distribuzione asintotica della mediana del campione non riesce in modo spettacolare a sembrare normale, corrispondono alle distribuzioni binomiali (3), Geometrico (11), Ipergeometrico (12), Binomiale negativo (14), Poisson (18), Uniforme discreta (22).

E davvero questo è il caso. Quando la distribuzione è discreta, le cose si complicano. Fornirò la prova per il caso assolutamente continuo, essenzialmente facendo altro che dettagliare la risposta già fornita da @Glen_b, e poi discuterò un po 'cosa succede quando la distribuzione è discreta, fornendo anche un riferimento recente per chiunque sia interessato all'immersione nel.

DISTRIBUZIONE ASSOLUTAMENTE CONTINUA
Considera una raccolta di variabili casuali assolutamente continue con funzione di distribuzione (cdf) e funzione di densità . Definire dove è la funzione indicatore. Pertanto è un Bernoulli rv, con {X1,...Xn}FX(x)=P(Xix)FX(x)=fX(x)ZiI{Xix}I{}Zi

E(Zi)=E(I{Xix})=P(Xix)=FX(x),Var(Zi)=FX(x)[1FX(x)],i

Sia la media di esempio di questi iid Bernoullis, definito per fisso come che significa che Si applica il teorema del limite centrale e abbiamoYn(x)x

Yn(x)=1ni=1nZi
E[Yn(x)]=FX(x),Var(Yn(x))=(1/n)FX(x)[1FX(x)]

n(Yn(x)FX(x))dN(0,FX(x)[1FX(x)])

Si noti che cioè non diverso dalla funzione di distribuzione empirica. Applicando il "Metodo Delta" abbiamo che per una funzione continua e differenziabile con derivata diversa da zero nel punto di interesse, otteniamoYn(x)=F^n(x)g(t)g(t)

n(g[F^n(x)]g[FX(x)])dN(0,FX(x)[1FX(x)](g[FX(x)])2)

Ora, scegli dove indica la funzione inversa. Questa è una funzione continua e differenziabile (poiché è), e dal Teorema della funzione inversa abbiamog(t)FX1(t),t(0,1)1FX(x)

g(t)=ddtFX1(t)=1fx(FX1(t))

Inserendo questi risultati su nel risultato asintotico derivato dal metodo delta che abbiamog

n(FX1(F^n(x))FX1(FX(x)))dN(0,FX(x)[1FX(x)][fx(FX1(FX(x)))]2)

e semplificando,

n(FX1(F^n(x))x)dN(0,FX(x)[1FX(x)][fx(x)]2)

.. per qualsiasi fisso . Ora imposta , la (vera) mediana della popolazione. Quindi abbiamo e il risultato generale sopra diventa, per il nostro caso di interesse,xx=mFX(m)=1/2

n(FX1(F^n(m))m)dN(0,1[2fx(m)]2)

Ma converge alla mediana di esempio . Questo è perchéFX1(F^n(m))m^

FX1(F^n(m))=inf{x:FX(x)F^n(m)}=inf{x:FX(x)1ni=1nI{Xim}}

Il lato destro della disuguaglianza converge in e la più piccola per la quale alla fine è la mediana del campione.1/2xFX1/2

Quindi otteniamo

n(m^m)dN(0,1[2fx(m)]2)
che è la centrale Teorema limite per la mediana del campione per distribuzioni assolutamente continue.

DISTRIBUZIONI DISCRETE
Quando la distribuzione è discreta (o quando il campione contiene legami) è stato sostenuto che la definizione "classica" dei quantili del campione, e quindi anche della mediana, può essere fuorviante in primo luogo , poiché il concetto teorico deve essere usato per misurare ciò che si tenta di misurare con i quantili.
In ogni caso è stato simulato che secondo questa definizione classica (quella che tutti conosciamo), la distribuzione asintotica della mediana del campione è non normale e una distribuzione discreta.

Una definizione alternativa di quantili campione è usando il concetto della funzione "distribuzione media", che è definita come

Fmid(x)=P(Xx)12P(X=x)

La definizione di quantili campione attraverso il concetto di funzione di distribuzione media può essere vista come una generalizzazione che può coprire come casi speciali le distribuzioni continue, ma anche quelle non così continue.

Nel caso delle distribuzioni discrete, tra gli altri risultati, è stato riscontrato che la mediana del campione definita attraverso questo concetto ha una distribuzione asintoticamente normale con una varianza dall'aspetto elaborato.

La maggior parte di questi sono risultati recenti. Il riferimento è Ma, Y., Genton, MG e Parzen, E. (2011). Proprietà asintotiche dei quantili campione di distribuzioni discrete. Annali dell'Istituto di matematica statistica, 63 (2), 227-243. , dove è possibile trovare una discussione e collegamenti alla letteratura pertinente precedente.


2
(+1) Per l'articolo. Questa è una risposta eccellente
Alex Williams,

Puoi spiegare perché converge alla mediana di esempio ? FX1(F^n(m))m^
Kasa,

So che nella distribuzione, ma non riesco a vedere come la mediana di esempio è uguale aF^n(m)FX(m)m^FX1(F^n(m))
kasa

1
@kasa Ho approfondito un po 'la questione.
Alecos Papadopoulos,

Mi dispiace continuare a sollevare di nuovo questo punto: ma la più piccola per la quale alla fine , è la mediana della popolazione, non la mediana del campione, non è vero? xFX(x)1/2
Kasa,

10

Sì, lo è, non solo per la mediana, ma per qualsiasi quantile di esempio. Copiando da questo articolo , scritto da TS Ferguson, un professore dell'UCLA (la sua pagina è qui ), che si occupa in modo interessante della distribuzione congiunta della media campionaria e dei quantili campione, abbiamo:

Lascia che essere iid con funzione di distribuzione , densità , media e varianza finita . Lasciare e lasciare indicare la quantile -esimo , in modo che . Supponiamo che la densità sia continua e positiva su . Sia denota il campione -esimo quantile. Poi F (X1,...,XnF(x)f(x)μσ20<p<1xppFF(xp)=pf(x)xpYn=X(n:np)p

n(Ynxp)dN(0,p(1p)/(f(xp))2)

Per (mediana) e hai il CLT per mediane,p=1/2xp=m

n(Ynm)dN(0,[2f(m)]2)

1
Bello. Vale la pena ricordare che la varianza della mediana del campione non è così facile da stimare come quella per la media del campione.
Michael M,

@Alecos - come hai ottenuto due risposte a questa domanda?
EngrStudent - Ripristina Monica il

1
@EngrStudent Il sistema lo consente, ti chiede solo di verificare che desideri effettivamente aggiungere una seconda risposta.
Alecos Papadopoulos,

8

Mi piace la risposta analitica fornita da Glen_b. È una buona risposta

Ha bisogno di una foto. Mi piacciono le foto.

Ecco alcune aree di elasticità in una risposta alla domanda:

  • Ci sono molte distribuzioni nel mondo. Il chilometraggio può variare.
  • Sufficiente ha significati diversi. Per un contro-esempio di una teoria, a volte è necessario un singolo contro-esempio per soddisfare "sufficiente". Per la dimostrazione di basse percentuali di difetto usando incertezza binomiale potrebbero essere necessarie centinaia o migliaia di campioni.

Per un normale standard ho usato il seguente codice MatLab:

mysamples=1000;

loops=10000;

y1=median(normrnd(0,1,mysamples,loops));

cdfplot(y1)

e ho ottenuto la seguente trama come output:

inserisci qui la descrizione dell'immagine

Quindi, perché non farlo per le altre 22 distribuzioni "incorporate", ad eccezione dell'uso di prob-plot (dove la linea retta significa molto normale)?

inserisci qui la descrizione dell'immagine

Ed ecco il codice sorgente per questo:

mysamples=1000;

loops=600;

y=zeros(loops,23);

y(:,1)=median(random('Normal', 0,1,mysamples,loops));

y(:,2)=median(random('beta', 5,0.2,mysamples,loops));
y(:,3)=median(random('bino', 10,0.5,mysamples,loops));
y(:,4)=median(random('chi2', 10,mysamples,loops));
y(:,5)=median(random('exp', 700,mysamples,loops));

y(:,6)=median(random('ev', 700,mysamples,loops));
y(:,7)=median(random('f', 5,3,mysamples,loops));
y(:,8)=median(random('gam', 10,5,mysamples,loops));
y(:,9)=median(random('gev', 0.24, 1.17, 5.8,mysamples,loops));
y(:,10)=median(random('gp', 0.12, 0.81,mysamples,loops));

y(:,11)=median(random('geo', 0.03,mysamples,loops));
y(:,12)=median(random('hyge', 1000,50,20,mysamples,loops));
y(:,13)=median(random('logn', log(20000),1.0,mysamples,loops));
y(:,14)=median(random('nbin', 2,0.11,mysamples,loops));
y(:,15)=median(random('ncf', 5,20,10,mysamples,loops));

y(:,16)=median(random('nct', 10,1,mysamples,loops));
y(:,17)=median(random('ncx2', 4,2,mysamples,loops));
y(:,18)=median(random('poiss', 5,mysamples,loops));
y(:,19)=median(random('rayl', 0.5,mysamples,loops));
y(:,20)=median(random('t', 5,mysamples,loops));

y(:,21)=median(random('unif',0,1,mysamples,loops));
y(:,22)=median(random('unid', 5,mysamples,loops));
y(:,23)=median(random('wbl', 0.5,2,mysamples,loops));


figure(1); clf
hold on

for i=2:23
    subplot(4,6,i-1)

    probplot(y(:,i))
    title(['Probplot of ' num2str(i)])
    axis tight

    if not(isempty(find(i==[3,11,12,14,18,22])))
        set(gca,'Color','r')
    end

end

Quando vedo la prova analitica potrei pensare "in teoria potrebbero andare bene tutti" ma quando lo provo posso temperare che con "ci sono un certo numero di modi in cui questo non funziona così bene, spesso implicando discreti o fortemente vincolati valori "e questo potrebbe farmi desiderare di stare più attento all'applicazione della teoria a tutto ciò che costa denaro.

In bocca al lupo.


Sbaglio o la distribuzione per la quale la mediana non è normalmente distribuita è discreta?
SeF
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.