Utilizzare per domande sulla scienza dei dati relative al linguaggio di programmazione Python. Non destinato a domande di codifica generali (-> stackoverflow).
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ho appena costruito questa rete neurale LSTM con Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile data_file_name …
Sto lavorando con Python, scikit-learn e keras. Ho 3000 mila immagini di orologi frontali come i seguenti: Watch_1 , Watch_2 , Watch_3 . Voglio scrivere un programma che riceva come input una foto di un vero orologio che potrebbe essere scattata in condizioni meno ideali rispetto alle foto sopra (colore …
Sto creando una semplice rete neurale usando tensorflow, con i dati che ho raccolto da me stesso, tuttavia, non sta collaborando: PI ha riscontrato un errore che non posso risolvere o trovare la soluzione e mi piacerebbe il tuo aiuto. L'errore: TypeError: l'argomento Fetch 2861.6152 di 2861.6152 ha un tipo …
Attualmente sto provando ad addestrare un modello su un file CSV di grandi dimensioni (> 70 GB con oltre 60 milioni di righe). Per fare ciò sto usando tf.contrib.learn.read_batch_examples. Faccio fatica a capire come questa funzione legge effettivamente i dati. Se sto usando una dimensione batch di es. 50.000, legge …
Sto creando un semplice chatbot. Voglio ottenere le informazioni dalla risposta dell'utente. Uno scenario di esempio: Bot : Hi, what is your name? User: My name is Edwin. Vorrei estrarre il nome Edwin dalla frase. Tuttavia, l'utente può rispondere in diversi modi come User: Edwin is my name. User: I …
La libreria matplotlib è molto capace ma manca di interattività, specialmente all'interno di Jupyter Notebook. Vorrei una buona linea strumento come tracciato plot.ly .
Sto lavorando alla configurazione di una serie di VM per sperimentare Spark prima di spendere e spendere soldi per costruire un cluster con dell'hardware. Nota veloce: sono un accademico con un background nell'apprendimento automatico applicato e lavoro un po 'abbandonato nella scienza dei dati. Uso gli strumenti per l'informatica, raramente …
Sto usando il notebook Ipython per lavorare con le applicazioni pyspark. Ho un file CSV con molte colonne categoriche per determinare se il reddito rientra o supera l'intervallo 50k. Vorrei eseguire un algoritmo di classificazione prendendo tutti gli input per determinare l'intervallo di reddito. Ho bisogno di costruire un dizionario …
Voglio fare una previsione per il risultato delle elezioni parlamentari. La mia produzione sarà la% che ciascuna parte riceve. Vi sono più di 2 parti, quindi la regressione logistica non è un'opzione praticabile. Potrei fare una regressione separata per ciascuna parte, ma in tal caso i risultati sarebbero in qualche …
t-SNE, come in [1], agisce riducendo progressivamente la divergenza di Kullback-Leibler (KL), fino a quando non viene soddisfatta una certa condizione. I creatori di t-SNE suggeriscono di usare la divergenza di KL come criterio di prestazione per le visualizzazioni: puoi confrontare le divergenze di Kullback-Leibler riportate da t-SNE. Va benissimo …
Nella maggior parte degli stimatori su scikit-learn, c'è un n_jobsparametro in fit/ predictmetodi per creare lavori paralleli usando joblib. Ho notato che impostandolo su -1crea solo 1 processo Python e massimizza i core, facendo sì che l'utilizzo della CPU raggiunga il 2500% in cima. Questo è abbastanza diverso dall'impostarlo su …
Devo trovare l'accuratezza di un set di dati di allenamento applicando l'algoritmo casuale della foresta. Ma i miei tipi di set di dati sono sia categorici che numerici. Quando ho provato ad adattare quei dati, ho ricevuto un errore. 'Input contiene NaN, infinito o un valore troppo grande per dtype …
Dopo aver sviluppato il mio modello predittivo utilizzando Random Forest ottengo le seguenti metriche: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Questi sono i risultati di questo codice: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1), df['target'], test_size = .3, random_state=12) clf = …
Attualmente sto facendo un corso in tensorflow in cui hanno usato tf.one_hot (indici, profondità). Ora non capisco come questi indici si trasformino in quella sequenza binaria. Qualcuno può spiegarmi il processo esatto per favore ???
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.