Ho un'applicazione Spark Streaming che produce un set di dati per ogni minuto. Ho bisogno di salvare / sovrascrivere i risultati dei dati elaborati.
Quando ho provato a sovrascrivere il set di dati org.apache.hadoop.mapred.FileAlreadyExistsException interrompe l'esecuzione.
Ho impostato la proprietà Spark set("spark.files.overwrite","true")
, ma non c'è fortuna.
Come sovrascrivere o predelete i file da Spark?
set("spark.files.overwrite","true")
funziona solo per i file aggiunti attraversospark.addFile()