Sono totalmente nuovo alle statistiche e al campo degli intervalli di confidenza. Quindi questo potrebbe essere molto banale o addirittura sembrare stupido. Gradirei se potessi aiutarmi a capire o indicarmi un po 'di letteratura / testo / blog che spiega meglio questo.
Vedo su vari siti di notizie come CNN, notizie Fox, Politico ecc. Circa i loro sondaggi riguardanti la corsa presidenziale degli Stati Uniti 2012. Ogni agenzia conduce alcuni sondaggi e riporta alcune statistiche del modulo:
CNN: la popolarità di Obama è dell'X% con margine di errore +/- x1%. Dimensione del campione 600. FOX: la popolarità di Obama è Y% con margine di errore +/- y1%. Dimensione del campione 800. XYZ: la popolarità di Obama è dello Z% con margine di errore +/- z1%. La modella indossa la taglia 300.
Ecco i miei dubbi:
Come faccio a decidere quale fidarmi? Dovrebbe essere basato sull'intervallo di confidenza, o dovrei supporre che dato che Fox ha una dimensione del campione maggiore, la sua stima è più affidabile? Esiste una relazione implicita tra i valori di confidenza e la dimensione del campione in modo tale che la specificazione di uno ovvia alla necessità di specificare l'altro?
Posso determinare la deviazione standard dagli intervalli di confidenza? In tal caso, è sempre valido o valido solo per determinate distribuzioni (come Gaussian)?
Esiste un modo per "unire" o "combinare" le tre stime precedenti e ottenere la mia stima con intervalli di confidenza? Quale dimensione del campione devo richiedere in quel caso?
Ho citato CNN / Fox solo per spiegare meglio il mio esempio. Non ho intenzione di iniziare un dibattito tra Democratici e Repubblicani qui.
Aiutatemi a capire i problemi che ho sollevato.