Avendo appena iniziato a insegnare a me stesso l'apprendimento automatico e l'analisi dei dati, mi ritrovo a colpire un muro di mattoni sulla necessità di creare e interrogare grandi serie di dati. Vorrei prendere i dati che ho aggregato nella mia vita professionale e personale e analizzarli, ma non sono sicuro del modo migliore per fare quanto segue:
Come devo conservare questi dati? Eccellere? SQL? ??
Qual è un buon modo per un principiante di iniziare a provare ad analizzare questi dati? Sono un programmatore di computer professionista, quindi la complessità non è nella scrittura di programmi ma più o meno specifica nel dominio dell'analisi dei dati.
EDIT: Scuse per la mia vaghezza, quando inizi a conoscere qualcosa è difficile sapere cosa non sai, lo sai? ;)
Detto questo, il mio obiettivo è quello di applicare questo a due argomenti principali:
Metriche del team del software (si pensi alla velocità Agile, alla quantificazione del rischio, alla probabilità di un'iterazione completata con successo dato x numero di punti della storia)
Apprendimento automatico (ad esempio si sono verificate eccezioni di sistema in un determinato set di moduli qual è la probabilità che un modulo lanci un'eccezione sul campo, quanto costerà, cosa possono dirmi i dati sui moduli chiave per migliorare che otterranno il miglior rapporto qualità-prezzo, prevedere quale parte del sistema l'utente dovrà utilizzare per iniziare a caricare i dati, ecc.).