Sto addestrando modelli forestali casuali in R usando randomForest()
con 1000 alberi e frame di dati con circa 20 predittori e 600K righe. Sul mio laptop tutto funziona bene, ma quando passo ad Amazon ec2, per eseguire la stessa cosa, ottengo l'errore:
Error: cannot allocate vector of size 5.4 Gb
Execution halted
Sto usando il c3.4xlarge
tipo di istanza, quindi è piuttosto muscoloso. Qualcuno conosce una soluzione alternativa per farlo funzionare su questa istanza? Mi piacerebbe conoscere le sfumature di memoria che causano questo problema solo sull'istanza ec2 e non sul mio laptop (processore OS X 10.9.5 Intel Core i7 da 2,7 GHz; memoria 16 GB 1600 MHz DDR3)
Grazie.