Ultimamente, ho visto che scribd rende molto difficile per gli utenti (utenti gratuiti) navigare attraverso un documento ospitato sul loro sito. Non è possibile effettuare ricerche all'interno di un documento, figuriamoci poter scaricare lo stesso.
Usando javascript, caricano le pagine su richiesta nel browser, quindi la funzione "salva con nome" del browser non aiuta molto.
Con mia grande sorpresa, ho visto che persino copiare / incollare copie di testo senza senso negli appunti! Per scoprire cosa non andava, ho disattivato JavaScript nel browser e quindi ho caricato di nuovo lo stesso documento. Voilà, l'ho visto senza senso. E così, sembra che il javascript di scribd decodifichi in qualche modo il testo incomprensibile e poi lo visualizzi nel browser.
Ora, la mia domanda è, anche dopo che javascript è abilitato e il testo viene visualizzato correttamente nel browser, se vado a guardare gli oggetti DOM corrispondenti al testo che seleziono, vedo ancora il testo incomprensibile.
Quindi, ora, sono confuso. Il testo viene visualizzato correttamente per l'utente, ma gli oggetti DOM contengono ancora incomprensibili. Quindi la domanda è: che tipo di hook / codice javascript sta usando il sito, in modo da essere in grado di conservare il gibberish negli oggetti DOM e rendere comunque il testo decodificato?
C'è un modo per accedere al testo decodificato? La mia intenzione non è quella di decodificare l'algoritmo per decodificare, ma di individuare dove è memorizzato il testo decodificato?
Il documento di esempio è:
Guarda cosa succede quando si attiva / disattiva Javascript!