@Ondrej e @Michelle hanno fornito alcune buone informazioni qui. Mi chiedo se posso contribuire affrontando alcuni punti non menzionati altrove. Non mi batterei per non essere in grado di ricavare molto dai dati in forma tabellare, le tabelle non sono generalmente un ottimo modo per presentare informazioni (cfr. Gelman et al., Trasformare le tabelle in grafici ). D'altra parte, chiedere uno strumento che genererà automaticamente tutti i grafici giusti per aiutarti a esplorare un nuovo set di dati è quasi come chiedere uno strumento che ti farà pensare. (Non prenderla nel modo sbagliato, riconosco che la tua domanda chiarisce che non stai andando così lontano; intendo solo che non ci sarà mai davvero uno strumento del genere.) Una bella discussione correlata a questo può essere trovata qUI .
Detto questo, volevo parlare un po 'dei tipi di grafici che potresti voler usare per esplorare i tuoi dati. Le trame elencate nella domanda sarebbero un buon inizio, ma potremmo essere in grado di ottimizzarlo un po '. Per cominciare, creare "un gran numero di grafici" che correlano coppie di variabili potrebbe non essere l'ideale. Un grafico a dispersione mostra solo la relazione marginale tra due variabili. Le relazioni importanti possono spesso essere nascoste in una combinazione di più variabili. Quindi il primo modo per rinforzare questo approccio è creare una matrice scatterplotche visualizza contemporaneamente tutti i grafici a dispersione a coppie. Le matrici di scatterplot possono essere migliorate in vari modi: ad esempio, possono essere combinate con grafici univariati di densità del kernel della distribuzione di ciascuna variabile, diversi marker / colori possono essere usati per tracciare gruppi diversi e possibili relazioni non lineari possono essere valutate sovrapponendo un adattamento loess. La scatterplot.matrix
funzione nel pacchetto auto in R può fare tutte queste cose bene (un esempio può essere visto a metà pagina in basso).
Tuttavia, mentre le matrici scatterplot sono un buon inizio, stanno ancora visualizzando solo le proiezioni marginali. Ci sono alcuni modi per provare ad andare oltre. Uno è esplorare i grafici tridimensionali usando il pacchetto rgl in R. Un altro approccio è usare i grafici condizionali; i coploti possono aiutare con le relazioni tra 3 o 4 variabili contemporaneamente. Un approccio particolarmente utile è l'uso interattivo di una matrice scatterplot(anche se ciò richiederà maggiori sforzi per apprendere), ad esempio "spazzolando". Il pennello consente di evidenziare un punto o punti in un fotogramma di una matrice e quei punti verranno contemporaneamente evidenziati in tutti gli altri fotogrammi. Spostando il pennello, puoi vedere come tutte le variabili cambiano insieme. AGGIORNAMENTO: Un'altra possibilità che avevo dimenticato di menzionare è quella di utilizzare un diagramma di coordinate parallele . Ciò ha uno svantaggio nel non rendere distinta la variabile di risposta, ma potrebbe essere utile, ad esempio, nell'esame delle correlazioni tra le variabili X.
Voglio anche lodarti per aver esaminato i tuoi dati ordinati per data di raccolta. Sebbene i dati siano sempre raccolti nel tempo, le persone non lo fanno sempre. Tracciare un grafico a linee è bello, ma ti suggerirei di completarlo con grafici di autocorrelazioni e autocorrelazioni parziali . In R, le funzioni per questi sono acf
e pacf
rispettivamente.
Riconosco che tutto ciò non risponde alla tua domanda nel senso di darti uno strumento che ti farà automaticamente tutte le trame, ma un'implicazione è che non dovresti davvero fare tutte le trame che temi , ad esempio, una matrice scatterplot è solo una riga di codice. Inoltre, in R, dovrebbe essere possibile scrivere una funzione / un codice riutilizzabile per te stesso che ne automatizzerebbe in parte parte (ad esempio, posso immaginare una funzione che comprende un elenco di variabili e un ordine di data, li ordina , apre una nuova finestra per ciascuno con grafici line, acf e pacf).