Quale software statistico è adatto per insegnare un corso introduttivo di statistica in scienze sociali?


11

Sto cercando un pacchetto software statistico che posso usare in un corso introduttivo di statistica per un programma di studio delle scienze sociali. Gli studenti non hanno alcuna conoscenza preliminare delle statistiche e nessuna esperienza con i linguaggi di programmazione. L'obiettivo è di introdurli a concetti statistici di base (come media, varianza, somma dei quadrati, valori p, ... e infine regressione lineare) e consentire loro di condurre da soli analisi di base usando set di dati di esempio. Il corso dovrebbe riguardare l'apprendimento dei concetti facendo statistiche piuttosto che memorizzare formule (anche se penso che le formule siano importanti).

Pertanto, sto cercando un'alternativa alla solita sintassi (come normale R) o software punta e clicca (come SPSS o Rcmdr). Il software dovrebbe essere facilmente apprendibile e dovrebbe avere un'interfaccia utente grafica chiara che visualizza i set di dati e offre i grafici e le tabelle standard. La cosa migliore sarebbe se visualizzasse tutti i diversi passaggi di un'analisi (ad esempio lettura e manipolazione dei dati, calcolo di misure descrittive, creazione di tabelle e grafici descrittivi, calcolo di misure inferenziali, stampa di grafici inferenziali, esportazione in un rapporto).

Hai suggerimenti di software statistico (open source o gratuito) adatto all'apprendimento e alla prima pratica statistica?

MODIFICA
Grazie per i tuoi suggerimenti. Ho esaminato gretl e altri due programmi che ho trovato durante la mia indagine online: RapidMiner e Statistical Lab . [1]
Ho scoperto che gretll'interfaccia e l'output sono più chiari e focalizzati rispetto ad esempio a Rcmdr, SPSS o Stata. Pertanto, è uno strumento ben qualificato per iniziare a insegnare le statistiche dal mio punto di vista.
Tuttavia, la GUI del diagramma di flusso di RapidMinereStatistical Labmi ha impressionato mentre visualizzavano i singoli passaggi di un'analisi statistica (a partire dal caricamento dei dati). Penso che questo potrebbe essere utile a molti studenti che lottano con la solita attenzione alle spiegazioni matematiche. Naturalmente, RapidMiner mi sembra troppo sovraccarico di funzioni, menu e pulsanti per i principianti, mentre il laboratorio statistico è molto più focalizzato. Il grande vantaggio di Statistical Lab è il "R-Calculator" simile a una console con una "procedura guidata R-code" che aiuta a produrre la sintassi R reale come il laboratorio statistico fa affidamento Rper i suoi calcoli.
Alla fine, ho deciso di iniziare con il Statistical Lab nel primo semestre introducendo i concetti di base e passare a RStudio (e Rcmdr) nel secondo semestre.

[1]: Gnumeric, SciPy, Scilab, GNU Octave e simili mi sembrano meno diretti alle scienze sociali.


8
@Matthias: Penso che se i tuoi studenti provengono / mirano da / per un campo delle scienze sociali, insegnare loro R come primo passo in Statistica è eccessivo. La maggior parte di loro avrà problemi con il concetto di console, comandi, sintassi ecc. E passerai più tempo a passare attraverso i "concetti di programmazione" (che sono "funzione", "ciclo" ecc.) Che "statistiche". Baso questo sulla precedente esperienza, quando ho fatto tutorial per un 101 statistiche in un dipartimento Soc.Science; le persone hanno perso il punto delle lezioni perché si sono concentrate maggiormente nel far funzionare R per loro piuttosto che esplorare i loro dati.
usεr11852,

1
@ user11852: potresti avere ragione, ma è triste che le scuole superiori mandino gli studenti senza alcuna esposizione alla programmazione. O università che consentono questo divario. Non dovrebbe esserci uno studente che viene a una classe universitaria che non sa cosa sia un ciclo o una funzione. Ritardare l'esposizione espone il problema altrove.
curious_cat

2
@ user11852: L'altra opzione meno appetibile potrebbe essere che i dipartimenti di Satistics insistano sul fatto che le lezioni di "Statistiche 101 per le scienze sociali" hanno il prerequisito di alcune esperienze di programmazione o di una lezione correttiva sulla programmazione. In questi giorni in cui quasi tutte le materie sono così fortemente influenzate dal calcolo, non c'è davvero alcun motivo per cui Programming-101 non dovrebbe essere la prima classe che tutti prendono.
curious_cat l'

6
Per quello che vale, ho usato R con successo nel mio corso di statistica introduttiva per le scienze politiche. Ho usato RStudio . Ho anche avuto "laboratori" settimanali in cui avrei permesso agli studenti di lavorare insieme per piccoli compiti, mentre andavo in giro e rispondevo alle domande. Con un codice di esempio ben commentato, gli studenti hanno fatto bene e quasi non si sono lamentati affatto. In realtà si sono lamentati molto meno di R rispetto al semestre precedente quando ho usato Stata. Poiché Stata non è gratuita, gli studenti dovevano entrare per le ore di laboratorio per fare il loro lavoro - lo odiavano.
Jason Morgan,

6
Penso che R in combinazione con RStudio possa essere un approccio eccellente. Inoltre pone le basi per la pratica della ricerca riproducibile, a differenza dei sistemi di menu. Vorrei raccomandare di distribuire diversi modelli di codice che gli studenti possono caricare in RStudio dal Web (RStudio lo rende facile) e lasciare che gli studenti facciano il lavoro di modifica dei nomi delle variabili e dei modelli statistici per ciò che è necessario per il problema in questione.
Frank Harrell,

Risposte:


12

Forse Gretl? http://gretl.sourceforge.net/

È gratuito e utilizzato presso la nostra Università per le statistiche sugli studenti universitari.


9
+1. Suggerimento eccellente. Ho sempre trovato la GUI di Gretl intuitiva, al punto e il feedback che fornisce accurati e senza troppi fronzoli che rimanderebbero alcuni studenti meno "tecnologici". Inoltre è gratuito, ben documentato e ha una console R se qualcuno è incline a vedere qualcosa di un po '"più profondo".
usεr11852,

8

Eviterei la maggior parte delle cose "famose", MatLab , Maple , Mathematica , JMP , SAS o Minitab , perché quando i tuoi studenti si laureano devono pagare migliaia di dollari all'anno per usarle professionalmente. Ogni azienda tende ad avere il suo particolare strumento preferito e se insegni loro uno strumento per il quale la loro azienda non pagherà, il loro set di abilità viene sprecato. Inoltre, non mi piacciono le librerie proprietarie: addestrano gli utenti a premere pulsanti e se l'utente vuole andare altrove (JMP o altro), non c'è riporto di apprendimento.

Python include SciPy / NumPy è abbastanza buono. È open source e ben supportato. Ha una grammatica facile da imparare. Viene ancora interpretato, quindi non urla velocemente, ma se non conoscono script o fogli di calcolo, è molto più veloce di quanto avrebbero mai bisogno. PythonXY è una buona versione, ha buone librerie e supporto. Mi piace anche che la programmazione della GUI sia possibile attraverso di essa. La creazione di applicazioni standalone in Windows è un po 'impegnativa ma probabilmente superiore al livello dei tuoi studenti. (modifica) Sage and Cythonmigliorare sostanzialmente la proposta di valore di Python. L'interfaccia e l'usabilità sono notevolmente migliorate. Un codice compilato che è 1000 volte più veloce di un codice interpretato piuttosto buono suona alla grande (o sorprendente) per me. EDIT: Mi sono divertito un po 'ad usare le distribuzioni Anaconda (aka conda), e sono anche molto semplici da usare.

Non sono un grande fan di Perl . È un po 'datato. Si tratta di analizzare ed elaborare il testo più che di matematica / scienza. Non fraintendetemi, può fare matematica / scienza, ma se conosci VBA allora MSWord può fare matematica / scienza. Essere in grado di non essere lo stesso ha avere un lavoro particolare come obiettivo principale.

Mi piace R , anche se non lo fai, perché è sviluppato in modo aggressivo da dottorandi qualificati in matematica / statistiche. Ciò significa che anche se la grammatica potrebbe essere klugy, disporrà di librerie aggiornate e dimostrate prive di errori. (In generale)

Excel non è un brutto inizio. Una volta che conosci un foglio di calcolo, ne semplifichi l'utilizzo. In un contesto aziendale quasi ogni azienda ha un ufficio MicroSloth , quindi Excel non è una cattiva idea. Non mi piacciono i loro script, ma questa è solo una preferenza, posso ancora usarlo. Costa circa 150 dollari statunitensi rispetto a 5000 dollari statunitensi per alcuni degli altri software, quindi il suo costo d'ingresso per le persone normali è più ragionevole.

Il linguaggio di script JMP è alieno. Non si traduce in altri software (nonSAS). Stanne lontano. L'unica caratteristica riscattabile del linguaggio è che può (in qualche modo limitato) eseguire il codice "R". Se stai scrivendo un codice in "R", usa "R" e "RStudio".

Non ho usato MathCAD, quindi non posso parlare della sua rilevanza. Penso che sia più simbolico, meno sull'importazione di dati esterni. È più economico, finora. Non è gratuito e aperto. La struttura non si traduce in struttura in un'altra lingua. ( EDIT ) Anche in questa categoria è EES , che non mi piace allo stesso modo al di fuori di una finestra di utilizzo molto stretta.

EDIT : Sono stato un po 'colpito da LabVIEW . È abbastanza semplice da usare che poche ore possono rendere qualcuno capace. Funziona molto velocemente, come letteralmente 1000 volte più veloce di MatLab per lo stesso identico codice ( MathScript ). Se hai un po 'di lavoro pesante, vale una piccola considerazione. Costa denaro, ma qualcosa nel quartiere di 1/5 del tradizionale big-iron.

Buona fortuna

EDIT: Non userei Statistical LAboratory perché anche quando selezioni "inglese" per la lingua, viene visualizzato in tedesco e non viene disinstallato su Windows 7. Entrambe le debolezze amministrative lo rendono inutile. Non riesco a gestirlo e quando ho provato a rimuoverlo non è riuscito.

Per tentativi ed errori ho scoperto le impostazioni del menu per renderlo visualizzato in inglese. Sembra essere un'interfaccia relativamente semplice (e quindi utile e coerente) in alcune librerie R per l'elaborazione e la visualizzazione dei dati. Dovrò approfondire la questione, quindi a questo punto "la giuria è ancora fuori".

MODIFICA di più:

-> Qui <- è un collegamento divertente a un'intera altra discussione su strumenti e banchi da lavoro.


2
C'è anche RPy rpy.sourceforge.net , R come libreria per Python, in modo da ottenere gli aspetti aggiornati e comprovati senza errori di R con la semplicità sintattica di Python.
Ghillie Dhu

1
"addestrano gli utenti a premere pulsanti e se l'utente vuole andare altrove (JMP o altro) non c'è riporto di apprendimento". SAS, un programma proprietario, non si allena particolarmente per "spingere i pulsanti", e avere problemi di trasferimento tra lingue diverse non è certo una caratteristica del solo software proprietario. Cavolo, ero più a casa andando da SysStat a JMP che da Python a R.
Fomite,

@Epigrad - Lo guardo spegnere continuamente il cervello degli ingegneri. Dozzine e dozzine di persone. Sono lieto che tu abbia trovato utilità per questo, ma mi aspetto fortemente che tu sia un valore anomalo e la tendenza generale del danno non è sostanzialmente cambiata dalla tua esperienza.
EngrStudent,

@EngrStudent: grazie per il tuo impegno nel provare il laboratorio statistico! L'impostazione del menu per la lingua inglese è davvero non intuitiva, ma dopo averla impostata una volta non ho riscontrato più problemi con la lingua. Sfortunatamente, non riesco a far funzionare la "Procedura guidata R-Graph", sebbene il normale R-Graph funzioni bene se inserisco del codice R. Pertanto, darò ai miei studenti alcuni frammenti di codice di esempio per produrre grafica di base. Forse passerò prima a RStudio ...
non-numeric_argument

1

Puoi provare a usare Gnumeric, un foglio di calcolo molto apprezzato, c'è anche un foglio di calcolo di Open Office. A condizione che tu spieghi le insidie ​​dell'uso di fogli di calcolo, in particolare Excel, dopo il college nelle loro successive vite pratiche potrebbero non avere il lusso di qualcosa come SPSS, ma potrebbero comunque ottenere un servizio utile da questi prodotti gratuiti che non sono troppo esigenti in matematica e abilità di programmazione . Molti ambienti di ufficio contengono Excel per impostazione predefinita.

Dai un'occhiata a:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Statistics and Excel 2007

e cercare riferimenti simili come

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=it#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Uno studio comparativo sull'affidabilità di nove pacchetti software statistici. Statistiche computazionali e analisi dei dati, 51, 3811–3831.


1

Sono stato CalEst . La licenza è economica, come 10 dollari, e fornisce sia calcoli / grafici che ottime simulazioni / attività per gli studenti. Inoltre, nel loro sito Web, hanno alcuni strumenti, principalmente sulle distribuzioni che potresti trovare utili.


Questa risposta è un po 'breve. Potresti approfondire il motivo per cui proporrai questo software e quali vantaggi ha rispetto alla concorrenza?
kjetil b halvorsen,

1

Abbiamo iniziato a usare Rguroo. Questo software è stato recentemente rilasciato. È basato su R, ma non è richiesta alcuna conoscenza della codifica R. È anche un'applicazione Web, quindi è sufficiente accedere a un browser. I miei studenti possono salvare il loro lavoro in qualsiasi fase e tornare indietro per completare il loro lavoro. L'interfaccia utente grafica è molto intuitiva e le uscite sembrano grandi.


0

Abbiamo usato la versione beta di Rguroo nei nostri corsi di statistica introduttiva alla California State University, Fullerton negli ultimi tre anni. Ora (agosto 2019) hanno rilasciato una versione ufficiale, vedi https://Rguroo.com. Questo è un software statistico per applicazioni web che funziona con qualsiasi browser. Questo software è progettato per l'insegnamento e offrono dimostrazioni individuali e formazione per i docenti; basta inviare un'e-mail o chiamarli per organizzare una demo. Il software esegue R in background, ma non è necessario conoscere R, è tutto punta e clicca. Ha molte fantastiche funzioni, tra cui output dettagliati, ottimi strumenti grafici, calcolatrice di probabilità e strumenti di simulazione. Mi piacciono in particolare le funzionalità di riproducibilità in cui è possibile salvare il lavoro in qualsiasi momento e tornare e continuare da dove si era interrotto. Puoi anche condividere il tuo lavoro con gli studenti attraverso ciò che chiamano file RGR. In conclusione ... è fantastico e continuiamo a usarlo.


0

Uso personalmente il software DataMelt per insegnare le statistiche. È molto ben documentato, ha tutorial, libri e molti esempi da guardare. Ciò che è anche importante è che si può cercare qualsiasi esempio e si può ottenere una risposta ragionevole (in Javadoc e frammenti di codice). Gli studenti possono imparare non solo Python (che è il linguaggio di programmazione predefinito), ma anche come codificare i metodi statistici in Java. Dal mio punto di vista, questa è una forza significativa: gli studenti non hanno bisogno di imparare un linguaggio "statistico" molto specializzato, come R-stat. Possono anche imparare Java allo stesso tempo, il che può aprire molte opportunità se decidono di andare nel settore.


-1

Esiste un nuovo software chiamato Rguroo che è un'applicazione web. È molto comodo da usare, in quanto non richiede download o installazione. Rguroo ha un motore R, ma il suo utilizzo non richiede la codifica R in quanto consente di utilizzare la potenza di R utilizzando l'interfaccia grafica point-and-click. Ogni analisi è salvabile e riproducibile. Abbiamo utilizzato questo software per i nostri corsi di statistica introduttiva e intermedia negli ultimi tre anni. A questo punto è gratuito e puoi creare un account su www.Rguroo.com. In base alle informazioni in mio possesso, rimarrà gratuito per tutte le facoltà e avrà un costo di abbonamento annuale ragionevole, compreso tra 10 e 20 dollari, per gli studenti.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.