Libreria Java open source per statistiche a livello offerto da un corso di statistica per laureati


15

Sto seguendo un corso di laurea in Statistica applicata che utilizza il seguente libro di testo (per darti un'idea del livello del materiale trattato): Concetti e metodi statistici , di GK Bhattacharyya e RA Johnson.

Il professore ci impone di utilizzare SAS per i compiti a casa.

La mia domanda è questa: esiste una libreria (e) Java, che può essere usata al posto di SAS per problemi tipici di tali classi.

Attualmente sto cercando di accontentarmi di Apache Math Commons e anche se sono impressionato dalla libreria (è facilità d'uso e comprensibilità) sembra mancare anche cose semplici come la capacità di disegnare istogrammi (pensando di combinarlo con una libreria grafica ).

Ho esaminato Colt, ma il mio interesse iniziale è diminuito abbastanza rapidamente.

Gradirei qualsiasi input e ho analizzato domande simili su StackOverflow ma non ho trovato nulla di convincente.

NOTA: sono a conoscenza delle librerie R, SciPy e Octave e java che effettuano le chiamate: sto cercando una libreria nativa Java o un set di librerie che possano fornire insieme le funzionalità che sto cercando.

NOTA: gli argomenti trattati in tale classe comprendono in genere: test a un campione e due campioni e intervalli di confidenza per mezzi e mediane, statistiche descrittive, test di bontà di adattamento, ANOVA a una e due vie, inferenza simultanea, test varianze, analisi di regressione e analisi di dati categorici.


2
Hai considerato R ?
RioRaider,

Ciao, grazie per la nota, sto cercando una libreria che è quasi interamente in Java. Quindi sono a conoscenza delle librerie R, SciPy e Octave e java che le chiamano: modificherò la domanda per riflettere questo. Grazie.
user1172468

hai menzionato che "Sono a conoscenza delle librerie R, SciPy e Octave e Java che le chiamano". Potete per favore dirmi che come chiamerete il codice scritto in "software di statistica R" usando Java?
Aman Chawla,

5
Perché vuoi usare una libreria Java per test statistici di base?
Underminer

3
@Underminer fa la domanda giusta qui. Fare statistiche in Java è come usare un martello per le viti. Con sufficiente determinazione e forza bruta puoi sicuramente mettere la vite in posizione, ma non in un modo molto elegante o efficiente. Probabilmente finirai con una vite danneggiata e dita doloranti.
Marc Claesen,

Risposte:


10

Quando sono costretto a usare java per le statistiche di base, la matematica di Apache Commons è la strada da percorrere. Per le trame, uso e raccomando JFreeChart . Quest'ultimo è ampiamente diffuso, quindi stackoverflow ha anche un tag popolato per esso .

modificare

Se si cerca una suite, forse Deducer è un'opzione. La GUI si basa su JGR nel frattempo le parti statistiche sono chiamate in R. Sembra essere estendibile sia tramite R che Java . Si potrebbe ad esempio saltare le chiamate a Rengine ma chiamare invece le librerie Java a cui si fa riferimento. Ma lo ammetto, non l'ho ancora provato.

Per quanto ho capito l'OP, l'ottimale sarebbe qualcosa come Rapidminer per le statistiche , dal momento che Rapidminer è un framework Java puro che supporta l'accesso alla GUI (comprese le visualizzazioni), l'utilizzo come libreria e lo sviluppo di plugin personalizzati. Per quanto ne so, non esiste qualcosa del genere per le statistiche. Non consiglio Rapidminer per quel particolare compito , perché per quanto ne so include solo i test statistici di base. Le visualizzazioni sono state estese di recente, ma non posso stimare quanto siano personalizzabili ora.


Ciao, è un po 'quello che sto cercando di fare, vorrei che ci fosse una suite più completa.
user1172468

@ user1172468 Ho aggiornato la mia risposta
steffen,

4

Dai un'occhiata a Suan Shu: NumericalMethod.com . Non è gratuito in generale, ma è gratuito per uso accademico.


Questa non è in realtà una risposta alla domanda del PO. È più un commento. Ti dispiacerebbe espanderlo per renderlo più una risposta? In alternativa, possiamo convertirlo in un commento per te.
gung - Ripristina Monica

Forse potresti ampliare il motivo per cui non è una risposta. Sta cercando una libreria Java e gli ho indicato uno che ha la maggior parte delle funzionalità che sta cercando.
user765195,

Hai ragione, questa situazione è un po 'più ambigua della situazione standard. Tuttavia, questa è essenzialmente una risposta solo link. SE pensa a quelli come commenti piuttosto che come risposte. Hai abbastanza reputazione per averlo fornito come commento. Perché semplicemente un link è una specie di risposta qui e dato che aveva un voto, non l'ho contrassegnato per la conversione in un commento, ma potrebbe essere bello se tu potessi aggiungere un po 'ad esso. Se non puoi, e scegli di non fare un commento, rispetto la tua decisione, ecco perché ti ho semplicemente lasciato un appunto.
gung - Ripristina Monica

Non sembra gratuito per uso accademico.
Kosmos,

Sfortunatamente, non più apparentemente, ma una versione per studenti sembra ancora disponibile per $ 100.
user765195,

3

Simile al suggerimento di RapidMiner di Steffen, potresti prendere in considerazione Weka . Potrebbe essere orientato in modo più specifico all'apprendimento automatico di quanto tu speri. Ha molti algoritmi per attività come il clustering, la classificazione e la regressione. Weka ha una GUI, ma può anche essere usata come libreria software. Ho visto gli istogrammi nella GUI ma non sono sicuro che sia facile riutilizzarli attraverso la libreria o meno.


Ciao grazie per la risposta, stavo davvero pensando al materiale trattato in un corso di Statistica dei Grad: gli argomenti includono test a uno e due campioni e intervalli di confidenza per mezzi e mediane, statistiche descrittive, test di bontà di adattamento, uno e due ANOVA, inferenza simultanea, varianze di test, analisi di regressione e analisi di dati categorici.
user1172468


1

L' ambiente di elaborazione di DataMelt ha molte librerie statistiche Java quasi per qualsiasi argomento. Puoi usarlo usando Jython come raccomandato sul sito web, ma lo uso con Java e Groovy.

Posso aggiungere altro: il progetto DataMelt copre i seguenti argomenti statistici:

  • Numeri casuali
  • Le distribuzioni discrete e continue più popolari
  • Analisi statistica descrittiva
  • Data fit (lineare e non lineare)
  • Vari test statistici
  • Istogrammi in 2D e 3D

Ecco un esempio di regressione non lineare che utilizza l'approccio di verosimiglianza per adattare i dati agli errori:

inserisci qui la descrizione dell'immagine

Il pacchetto è gratuito


3
Benvenuti nel sito, @Remi. Questa non è in realtà una risposta alla domanda del PO. È più un commento. Utilizza solo il campo "La tua risposta" per fornire risposte. Riconosco che è frustrante, ma sarai in grado di commentare ovunque quando la tua reputazione> 50. In alternativa, potresti provare ad espanderlo per renderlo più una risposta. Dato che sei nuovo qui, potresti voler leggere la nostra pagina del tour , che contiene informazioni per i nuovi utenti.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.