Download di un file di grandi dimensioni utilizzando curl


87

Devo scaricare il file remoto usando curl.

Ecco il codice di esempio che ho:

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

$st = curl_exec($ch);
$fd = fopen($tmp_name, 'w');
fwrite($fd, $st);
fclose($fd);

curl_close($ch);

Ma non può gestire file di grandi dimensioni, perché legge prima nella memoria.

È possibile eseguire lo streaming del file direttamente su disco?

Risposte:


169
<?php
set_time_limit(0);
//This is the file where we save the    information
$fp = fopen (dirname(__FILE__) . '/localfile.tmp', 'w+');
//Here is the file we are downloading, replace spaces with %20
$ch = curl_init(str_replace(" ","%20",$url));
curl_setopt($ch, CURLOPT_TIMEOUT, 50);
// write curl response to file
curl_setopt($ch, CURLOPT_FILE, $fp); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
// get curl response
curl_exec($ch); 
curl_close($ch);
fclose($fp);
?>

5
Difendi il tuo commento @ yes123, mi interessa sapere.
Jürgen Paul

8
Correggimi se sbaglio, ma non penso che tu abbia effettivamente bisogno di manualmente fwritei dati poiché stai utilizzando CURLOPT_FILE.
Sasha Chedygov

1
Come @SashaChedygov ha sottolineato sopra, non è necessario utilizzare fwriteAND CURLOPT_FILE. Il passaggio $fpè sufficiente. Ho fatto entrambe le cose e mi sono ritrovato 1alla fine del contenuto del file.
graffetta

@Sasha Chedygov ~ sì, non hai bisogno difwrite
Alireza

5
Sembra che l'impostazione di CURLOPT_FILE prima di impostare CURLOPT_RETURNTRANSFER non funzioni, presumibilmente perché CURLOPT_FILE dipende dall'impostazione di CURLOPT_RETURNTRANSFER. php.net/manual/en/function.curl-setopt.php#99082
Nabi KAZ

25

Uso questa pratica funzione:

Scaricandolo con un passo di 4094 byte non riempirà la tua memoria

function download($file_source, $file_target) {
    $rh = fopen($file_source, 'rb');
    $wh = fopen($file_target, 'w+b');
    if (!$rh || !$wh) {
        return false;
    }

    while (!feof($rh)) {
        if (fwrite($wh, fread($rh, 4096)) === FALSE) {
            return false;
        }
        echo ' ';
        flush();
    }

    fclose($rh);
    fclose($wh);

    return true;
}

Utilizzo:

     $result = download('http://url','path/local/file');

Puoi quindi verificare se è tutto a posto con:

     if (!$result)
         throw new Exception('Download error...');

1
@Severus rilevi l'errore http come fopen()falso e il timeout lo metti nel ciclo while (chiama time()e fai i conti)
Silviu-Marian

2
cURL ha già un'implementazione funzionante di questo (vedi la risposta accettata), perché vorresti implementare qualcosa da solo?
Petr Peller

2
Perché l'interfaccia procedurale cURL è piuttosto scadente
dinamica

per quello che vale, ho usato stream_copy_to_streaminvece di copiare manualmente i contenuti, crea un codice più breve. Né questo né quello funziona con https(a meno che tu non stipuli a $context). Stile procedurale concertato: anche le funzioni dei file non sono del tutto OOP, e se metti le opzioni di curl in un array, sembrerà comunque più pulito.
ashein

L'ho testato con un https, funziona alla grande !!!, Grazie per il tuo aiuto @dynamic.
Ozal Zarbaliyev

6

Trova sotto il codice se vuoi scaricare il contenuto dell'URL specificato vuoi anche salvarlo in un file.

<?php
$ch = curl_init();
/**
* Set the URL of the page or file to download.
*/
curl_setopt($ch, CURLOPT_URL,'http://news.google.com/news?hl=en&topic=t&output=rss');

$fp = fopen('rss.xml', 'w+');
/**
* Ask cURL to write the contents to a file
*/
curl_setopt($ch, CURLOPT_FILE, $fp);

curl_exec ($ch);

curl_close ($ch);
fclose($fp);
?>

Se vuoi scaricare file dal server FTP puoi usare l'estensione FTP php. Di seguito il codice:

<?php
$SERVER_ADDRESS="";
$SERVER_USERNAME="";
$SERVER_PASSWORD="";
$conn_id = ftp_connect($SERVER_ADDRESS);

// login with username and password
$login_result = ftp_login($conn_id, $SERVER_USERNAME, $SERVER_PASSWORD);

$server_file="test.pdf" //FTP server file path 
$local_file = "new.pdf"; //Local server file path 

##----- DOWNLOAD $SERVER_FILE AND SAVE TO $LOCAL_FILE--------##
if (ftp_get($conn_id, $local_file, $server_file, FTP_BINARY)) {
    echo "Successfully written to $local_file\n";
} else {
    echo "There was a problem\n";
}

ftp_close($conn_id);
?>

4

quando curlviene utilizzato per scaricare un file di grandi dimensioni, questa CURLOPT_TIMEOUTè l'opzione principale che devi impostare.

CURLOPT_RETURNTRANSFER deve essere vero nel caso in cui si ottengano file come pdf / csv / immagine ecc.

Puoi trovare ulteriori dettagli qui (URL corretto) Curl Doc

Da quella pagina:

curl_setopt($request, CURLOPT_TIMEOUT, 300); //set timeout to 5 mins

curl_setopt($request, CURLOPT_RETURNTRANSFER, true); // true to get the output as string otherwise false

Puoi anche passare attraverso l'esempio del blog relativo al download di file con le nozioni di base
sull'arricciatura

2

Puoi usare questa funzione, che crea un file temp nel filesystem e restituisce il percorso del file scaricato se tutto ha funzionato bene:

function getFileContents($url)
{
    // Workaround: Save temp file
    $img = tempnam(sys_get_temp_dir(), 'pdf-');
    $img .= '.' . pathinfo($url, PATHINFO_EXTENSION);

    $fp = fopen($img, 'w+');

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);

    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FILE, $fp);
    curl_setopt($ch, CURLOPT_HEADER, false);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

    $result = curl_exec($ch);
    curl_close($ch);

    fclose($fp);

    return $result ? $img : false;
}
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.