Sono un dottorando in Geofisica e lavoro con grandi quantità di dati di immagini (centinaia di GB, decine di migliaia di file). Lo so svne gitabbastanza bene e arriva a valorizzare la storia di un progetto, unita alla capacità di lavorare facilmente insieme e avere protezione contro la corruzione del …
Quali sono le migliori pratiche per salvare, archiviare e condividere modelli di apprendimento automatico? In Python, generalmente archiviamo la rappresentazione binaria del modello, usando pickle o joblib. I modelli, nel mio caso, possono essere ~ 100Mo più grandi. Inoltre, joblib può salvare un modello su più file se non impostato …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Sto lavorando a un progetto di scienza dei dati relativo al mining delle relazioni sociali e ho bisogno di archiviare i dati in alcuni database di grafi. Inizialmente ho scelto Neo4j come database. Ma sembra che Neo4j non si ridimensioni bene. L'alternativa che ho scoperto sono Titan e oriebtDB. Ho …
Quando un database relazionale, come MySQL, ha prestazioni migliori rispetto a un no relazionale, come MongoDB? Ho visto una domanda su Quora l'altro giorno, sul perché Quora utilizza ancora MySQL come backend e che le loro prestazioni sono ancora buone.
In Science Data, molti sembrano essere utilizzando panda dataframes come il datastore. Quali sono le caratteristiche dei panda che lo rendono un archivio dati superiore rispetto ai normali database relazionali come MySQL , che vengono utilizzati per archiviare i dati in molti altri campi della programmazione? Mentre Panda fornisce alcune …
Sto lavorando su un'applicazione che richiede la creazione di un database molto grande di n-grammi che esiste in un corpus di testo di grandi dimensioni. Ho bisogno di tre tipi di operazioni efficienti: ricerca e inserimento indicizzati dall'n-grammo stesso e interrogazione per tutti gli n-grammi che contengono un sotto-n-grammo. Mi …
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 5 anni fa . Sembra che la maggior parte delle lingue abbia un certo numero …
Ho un grande set di dati con oggetti JSON da 9m a ~ 300 byte ciascuno. Sono post da un aggregatore di link: sostanzialmente link (un URL, titolo e ID autore) e commenti (testo e ID autore) + metadati. Potrebbero benissimo essere record relazionali in una tabella, tranne per il …
Contesto: Di seguito è riportato il libro Graph D Database , che copre un test delle prestazioni menzionato nel libro Neo4j in azione : Le relazioni in un grafico formano naturalmente percorsi. Interrogazione o spostamento, il grafico prevede i seguenti percorsi. A causa della natura fondamentalmente orientata al percorso del …
Ho due tensori a:[batch_size, dim] b:[batch_size, dim]. Voglio fare un prodotto interno per ogni coppia nel lotto, generando c:[batch_size, 1], dove c[i,0]=a[i,:].T*b[i,:]. Come?
Sono nuovo di questa comunità e spero che la mia domanda si adatti bene qui. Come parte del mio corso di analisi dei dati universitari ho scelto di fare il progetto sul riconoscimento delle attività umane utilizzando set di dati per smartphone. Per quanto mi riguarda, questo argomento riguarda l'apprendimento …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.