Scienza dei dati python

3

Esistono buoni modelli linguistici predefiniti per Python?

Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …

11 python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

1

Come prevedere i valori futuri dell'orizzonte temporale con Keras?

Ho appena costruito questa rete neurale LSTM con Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile data_file_name …

11 machine-learning python keras prediction forecasting

3

Reti neurali: trova la maggior parte delle immagini simili

Sto lavorando con Python, scikit-learn e keras. Ho 3000 mila immagini di orologi frontali come i seguenti: Watch_1 , Watch_2 , Watch_3 . Voglio scrivere un programma che riceva come input una foto di un vero orologio che potrebbe essere scattata in condizioni meno ideali rispetto alle foto sopra (colore …

11 python neural-network keras

1

Rete neurale Tensorflow TypeError: l'argomento Fetch ha un tipo non valido

Sto creando una semplice rete neurale usando tensorflow, con i dati che ho raccolto da me stesso, tuttavia, non sta collaborando: PI ha riscontrato un errore che non posso risolvere o trovare la soluzione e mi piacerebbe il tuo aiuto. L'errore: TypeError: l'argomento Fetch 2861.6152 di 2861.6152 ha un tipo …

11 machine-learning python neural-network tensorflow

1

Allenati su lotti a Tensorflow

Attualmente sto provando ad addestrare un modello su un file CSV di grandi dimensioni (> 70 GB con oltre 60 milioni di righe). Per fare ciò sto usando tf.contrib.learn.read_batch_examples. Faccio fatica a capire come questa funzione legge effettivamente i dati. Se sto usando una dimensione batch di es. 50.000, legge …

11 python tensorflow

4

Estrai informazioni dalla frase

Sto creando un semplice chatbot. Voglio ottenere le informazioni dalla risposta dell'utente. Uno scenario di esempio: Bot : Hi, what is your name? User: My name is Edwin. Vorrei estrarre il nome Edwin dalla frase. Tuttavia, l'utente può rispondere in diversi modi come User: Edwin is my name. User: I …

11 python nlp

3

Come faccio a creare un grafico a dispersione interattivo PCA in Python?

La libreria matplotlib è molto capace ma manca di interattività, specialmente all'interno di Jupyter Notebook. Vorrei una buona linea strumento come tracciato plot.ly .

11 python visualization pca jupyter

3

Problema con IPython / Jupyter su Spark (alias non riconosciuto)

Sto lavorando alla configurazione di una serie di VM per sperimentare Spark prima di spendere e spendere soldi per costruire un cluster con dell'hardware. Nota veloce: sono un accademico con un background nell'apprendimento automatico applicato e lavoro un po 'abbandonato nella scienza dei dati. Uso gli strumenti per l'informatica, raramente …

11 python apache-spark pyspark ipython

2

Come convertire i dati categorici in dati numerici in Pyspark

Sto usando il notebook Ipython per lavorare con le applicazioni pyspark. Ho un file CSV con molte colonne categoriche per determinare se il reddito rientra o supera l'intervallo 50k. Vorrei eseguire un algoritmo di classificazione prendendo tutti gli input per determinare l'intervallo di reddito. Ho bisogno di costruire un dizionario …

11 python apache-spark categorical-data pyspark

3

Quale regressione utilizzare per calcolare il risultato delle elezioni in un sistema multipartitico?

Voglio fare una previsione per il risultato delle elezioni parlamentari. La mia produzione sarà la% che ciascuna parte riceve. Vi sono più di 2 parti, quindi la regressione logistica non è un'opzione praticabile. Potrei fare una regressione separata per ciascuna parte, ma in tal caso i risultati sarebbero in qualche …

11 classification r python regression predictive-modeling

1

Implementazione di t-SNE Python: divergenza di Kullback-Leibler

t-SNE, come in [1], agisce riducendo progressivamente la divergenza di Kullback-Leibler (KL), fino a quando non viene soddisfatta una certa condizione. I creatori di t-SNE suggeriscono di usare la divergenza di KL come criterio di prestazione per le visualizzazioni: puoi confrontare le divergenze di Kullback-Leibler riportate da t-SNE. Va benissimo …

11 machine-learning python

1

scikit-learn parametro n_jobs su utilizzo e memoria della CPU

Nella maggior parte degli stimatori su scikit-learn, c'è un n_jobsparametro in fit/ predictmetodi per creare lavori paralleli usando joblib. Ho notato che impostandolo su -1crea solo 1 processo Python e massimizza i core, facendo sì che l'utilizzo della CPU raggiunga il 2500% in cima. Questo è abbastanza diverso dall'impostarlo su …

11 python scikit-learn

2

Come posso adattare i tipi di dati categorici per la classificazione casuale delle foreste?

Devo trovare l'accuratezza di un set di dati di allenamento applicando l'algoritmo casuale della foresta. Ma i miei tipi di set di dati sono sia categorici che numerici. Quando ho provato ad adattare quei dati, ho ricevuto un errore. 'Input contiene NaN, infinito o un valore troppo grande per dtype …

11 python data-mining random-forest

1

Precisione del treno vs precisione del test e matrice di confusione

Dopo aver sviluppato il mio modello predittivo utilizzando Random Forest ottengo le seguenti metriche: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Questi sono i risultati di questo codice: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1), df['target'], test_size = .3, random_state=12) clf = …

11 python predictive-modeling accuracy confusion-matrix classifier

2

Che cos'è una codifica a caldo in tensorflow?

Attualmente sto facendo un corso in tensorflow in cui hanno usato tf.one_hot (indici, profondità). Ora non capisco come questi indici si trasformino in quella sequenza binaria. Qualcuno può spiegarmi il processo esatto per favore ???

10 machine-learning python neural-network deep-learning tensorflow

Domande taggate «python»