"Visualizza sorgente" equivalente per documenti Word?


11

A volte i documenti di Word sembrano essere più o meno rotti, di solito quando il layout è diventato piuttosto complesso e il documento ha cambiato mani e / o versioni un paio di volte. I sintomi possono essere che non accade nulla quando si premono i tasti Backspaceo Enterin una determinata posizione del documento in cui dovrebbe realmente funzionare, o che la formattazione sembra applicarsi e ripristinarsi più o meno casualmente. Penso che siamo stati tutti lì.

Spesso può essere molto difficile sapere esattamente cosa c'è che non va, dal momento che ciò che accade sotto il cofano in Word è abbastanza opaco. Potresti avere un documento che sembra vuoto, ma in realtà lo stato sottostante relativo alla formattazione ecc. Può essere piuttosto complesso.

In questi casi sarebbe utile dare una sbirciatina al codice sorgente dietro ciò che è mostrato nella pagina; ad esempio il modo in cui un browser potrebbe visualizzare View Source e idealmente essere in grado di apportare modifiche direttamente nel codice sorgente, ad esempio come si farebbe utilizzando Latex. Esiste un comando o un'utilità Visualizza tipo sorgente per i documenti di Microsoft Word?

La mia ipotesi è che non esiste un tale comando, o ne avrei sentito parlare. In tal caso, qualcuno ha un buon approccio quando si tratta di ottenere una presa sulla fastidiosa "formattazione nascosta" in un documento di Word ?

Sospetto che potrebbero esserci delle differenze nei formati .doc e .docx; Sono interessato in entrambi i casi.

Risposte:


11

Se la formattazione è ciò che ti interessa principalmente, Word ha una buona reputazione per ispezionare tutti i tipi di formattazione applicati a testo e oggetti chiamati Reveal Formatting . In Word 2007 e 2010 il collegamento per questo pannello è Shift+ F1.

inserisci qui la descrizione dell'immagine

Altrimenti, se stai cercando una comprensione ancora più profonda del formato del documento, puoi guardare l'XML per i file DOCX.

  1. Trova il tuo documento DOCX su disco.
  2. Cambia l'estensione del documento da .docx a .zip.
  3. Fare doppio clic sul file e aprirlo nel gestore archivio predefinito.
  4. Passare alla cartella "Word" nel programma zip e aprire Document.xml . Questo è il codice alla base di ciò che costituisce la maggior parte del contenuto del documento, sebbene gli altri file vengano utilizzati anche in altri modi, ad esempio per informazioni su stili o caratteri.

Avrai sicuramente bisogno di un editor XML decente solo per visualizzare i dati e anche allora è abbastanza complesso e per un documento di grandi dimensioni sarà molto lungo.

Quando si tratta di DOC, non esiste un modo semplice per "visualizzare l'origine" in quanto si tratta di un file binario costituito da flussi separati e quindi non esiste un modo semplice per visualizzare i contenuti.


È abbastanza utile, non lo sapevo. Un peccato che non si possa fare lo stesso per i file .doc, dato che è quello che la mia azienda usa ancora. Grazie per la spiegazione però!
Godsmith

1
@Godsmith È possibile salvare il DOC come DOCX utilizzando una versione più recente di Word, quindi tornare a DOC dopo aver apportato le modifiche. C'è una perdita di formato in questo processo, quindi fai attenzione, ma potresti scoprire che puoi apportare modifiche o risolvere problemi nei tuoi tipi DOC eseguendolo in DOCX.
ThisClark,

puoi anche salvare qualsiasi file direttamente come html in MS Word. In alternativa puoi salvare come RTF e aprire il file RTF come testo
phuclv

3

Immagino che il formato .doc sia piuttosto difficile, quindi non posso aiutarti qui. Tuttavia, .docx è in realtà un file zip con tutti i dettagli memorizzati in file XML. Quindi, rinomina il file in .zip e dai un'occhiata alla fonte!


0

Quando si tratta di un formato binario come * .doc, le cose sono più complicate. Puoi usare mso-dumper di LibreOffice . Basta clonare la soluzione sul computer locale ed eseguire

python doc-dump.py \path\to\file.doc >output.xml

Ora tutte le cose nel file binario verranno convertite in xml nel formato esatto descritto in Word (.doc) Formato file binario

C'è anche WordFileDump che è più semplice ma non potente come mso-dumper

Sfortunatamente quelli sono solo per analizzare la struttura e non c'è nessuno strumento per riassemblare l'output xml in un file * .doc, quindi una volta trovata la causa principale dovrai usare Word per modificarlo. Pertanto sarebbe più semplice convertire in * .docx, esaminare il file * .docx e riconvertirlo in * .doc se necessario

Oppure puoi anche salvare il file come RTF che è un file di testo "leggibile dall'uomo" invece di Office XML. In alternativa, salva il file word come html

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.