Quando insegnavo statistiche di livello universitario, dicevo ai miei studenti: "Non mi interessa quale pacchetto utilizzi e puoi usare qualsiasi cosa per i compiti, poiché mi aspetto che tu fornisca spiegazioni sostanziali e prenderò spunto se io vedere tr23y5m
nomi variabili nei tuoi invii. Posso supportare il tuo apprendimento molto bene in Stata, e ragionevolmente bene, in R. Con SAS, sei da solo, poiché affermi di aver seguito un corso. Con SPSS o Minitab, Dio ti benedica ". Immagino che i ragionevoli datori di lavoro la pensino allo stesso modo. Ciò che conta è la tua produttività in termini di risultati del progetto. Se riesci a raggiungere l'obiettivo in R con 40 ore di lavoro, bene; se puoi ottenerlo in C ++ in 40 ore di lavoro, bene; se sai come farlo in R in 40 ore, ma il tuo supervisore vuole che tu lo faccia in SAS e devi dedicare 60 ore solo per imparare alcune nozioni di base e dove vanno i punti e virgola, che può essere saggio solo nel contesto del quadro generale del resto del codice in SAS ... e quindi il gestore non era molto saggio nell'assumere un programmatore R.
Da questa prospettiva del costo totale, la "libera" R è un mito enormemente esagerato. Qualsiasi progetto serio richiede un codice personalizzato, anche solo per l'input dei dati e la formattazione dell'output, e questo è un costo diverso da zero del tempo professionale. Se questi dati di input e formattazione richiedono 10 ore di codice SAS e 20 ore di codice R, R è un software più costoso a margine , come direbbe un economista, vale a dire in termini di costi aggiuntivi per produrre una determinata funzionalità . Se un grande progetto richiede 200 ore di tempo del programmatore R e 100 ore di tempo del programmatore Stata per fornire funzionalità identiche, Stata è complessivamente più economica, anche tenendo conto della licenza ~ $ 1K che è necessario acquistare. Sarebbe interessante vedere simili confronti diretti; Sono stato coinvolto nella riscrittura di un enorme casino di 2 Mb di codice SPSS che si diceva fosse stato accumulato in circa 10 anni-persona in ~ 150K di codice Stata che correvano più velocemente, potrebbe essere un po 'più veloce; era un progetto di circa 1 persona all'anno. Non so se questo rapporto di efficienza 10: 1 sia tipico per SPSS: confronti tra stati, ma non mi sorprenderebbe. Per me, lavorare con R è sempre una grande spesa a causa dei costi di ricerca: devo determinare quale dei cinque pacchetti con nomi simili fa quello che devo fare, e valutare se lo fa in modo abbastanza affidabile da poterlo utilizzare in il mio lavoro. Spesso significa che per me è più economico scrivere il mio codice Stata in meno tempo che spenderei per capire come far funzionare R in un determinato compito. Dovrebbe essere chiaro che questa è la mia idiosincrasia personale; la maggior parte delle persone su questo sito è meglio usare di me.
Strano che il tuo prof preferisca Stata o GAUSS a R perché "R non è stato scritto da economisti". Né Stata né GAUSS; sono scritti da scienziati informatici che utilizzano gli strumenti di informatica. Se il tuo prof ottiene idee sulla programmazione da CodeAcademy.com, è meglio di niente, ma lo sviluppo di software di livello professionale è diverso dalla digitazione nella casella di testo CodeAcademy.com in quanto guidare un camion merci è diverso dalla bicicletta. (Tuttavia, Stata è stata avviata da un economista del lavoro convertito scienziato informatico, ma ormai non fa questa cosa di econometria del lavoro da circa 25 anni.)
Aggiornamento : Come ha commentato AndyW di seguito, puoi scrivere un codice terribile in qualsiasi lingua. La questione del costo diventa quindi quale lingua è più facile da eseguire il debug. A me sembra una combinazione di quanto sia preciso e informativo l'output e quanto sia semplice e trasparente la sintassi stessa, e ovviamente non ho una buona risposta per questo. Ad esempio, Python applica il rientro del codice, che è una buona idea. Gli stati e il codice R possono essere ripiegati tra parentesi e non funzionerà con SAS. L'uso di subroutine è un'arma a doppio taglio: l'uso di *apply()
con function
s ad hoc in R è ovviamente molto efficiente, ma più difficile da eseguire il debug. In modo analogo, gli Stata local
possono mascherare quasi tutto, e l'impostazione predefinita di una stringa vuota, sebbene utile, può anche portare a errori difficili da rilevare.