Sto cercando informazioni su come dovrebbe essere organizzato un progetto Python Machine Learning. Per i soliti progetti Python c'è Cookiecutter e per R ProjectTemplate .
Questa è la mia attuale struttura di cartelle, ma sto mescolando i Notebook Jupyter con il vero codice Python e non sembra molto chiaro.
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
Lavoro nella cartella degli script e attualmente aggiungo tutte le funzioni nei file in my_module, ma questo porta a errori nel caricamento dei dati (percorsi relativi / assoluti) e ad altri problemi.
Non sono riuscito a trovare le migliori pratiche adeguate o buoni esempi su questo argomento, oltre ad alcune soluzioni di concorrenza Kaggle e ad alcuni Notebook che hanno tutte le funzioni condensate all'inizio di tale Notebook.