File Juicer

File Juicer pour Mac OS X

Reconstruire un document Word depuis un PDF

File Juicer est en premier lieu un extracteur d'images et de textes, mais si vous avez Mac OS X 10.4 vous pouvez l'employer pour convertir de simples fichiers PDF en Word, RTF ou texte ordinaire.

Les informations sur la structure du document Word ne sont pas enregistrées dans le fichier PDF quand elles sont produites. File Juicer n'essayera pas de les recréer. Vous pouvez extraire le texte à partir de documents PDF sous RTF (rich text format) et ceci peut être suffisant si vous n'avez pas besoin de préserver la disposition multi-colonne ou des tableaux.

Outils professionnels et Documents numérisés

Pour des logiciels avançés de conversion de PDF en Office et pour recréer la disposition, vous devriez jeter un coup d'oeil à Adobe Acrobat Professional 8 (Mac) or PDF2Office

File Juicer ne converti pas des images numérisées en texte via la reconnaissance optique de caractères. Il y a trois applications bien connues qui font cela : Adobe Acrobat Professional 8 (Mac), OmniPage Pro X (Mac) and ReadIris Pro (Mac). You can also choose to Vous pouvez aussi vouloiracheter un scanneur qui fournit un logiciel OCR (lisez attentivement la description).

Une façon économique - Via RTF

RTF est développé par Microsoft pour transporter le texte formaté entre les applications. Word, TextEdit et autres applications peuvent l'ouvrir retenant les polices, les tailles des polices et des couleurs. Il ne préservera pas la disposition.

File Juicer utilise le même moteur PDF en RTF qu'Aperçu d'Apple et vous pouvez faire la même extraction avec Aperçu si vous copiez et collez le texte de chaque page du PDF. File Juicer extrait les images du PDF et les place dans un dossier séparé. Vous les placez manuellement dans le document Word quand vous avez recréé la disposition.

Voici les préférences de File Juicer que je recommanderais pour extraire le texte et les images requis pour reconstruire un fichier Word.

Preferences for Conversion from PDF to Word

AutoFormat

Autoformat

Je recommande d'extraire l'ASCII et le RTF, car parfois il est plus facile de reconstruire le document à partir du texte pur sans formatage. Word vous laisse utiliser des noms abstraits pour le formatage comme "En-tête 1" ou "Normal". Dans le fichier RTF, ceci est remplacé par les noms et les tailles réelles des polices utilisés - comme "Arial 16" et "Times 12".
La fonction Autoformat... de Word est utilisée pour ajuster l'"information de police" de nouveau dans la structure du document.

Extraire des images à partir des fichiers

File Juicer est un outil d'extraction d'usage général conçu pour rechercher à l'intérieur de n'importe quel fichier pour voir s'il y a des images de n'importe quel format standard. Il a été initialement créé pour extraire des images à partir des fichiers PowerPoint, mais depuis il a été étendu pour identifier beaucoup de formats de fichier.

L'extraction des images à partir de PDF est fait sans recompression; il préserve ainsi toute la qualité qui a été archivée dans le fichier PDF initialement.

Reconstruction de documents Word à partir d'autres fichiers

Vous pouvez télécharger et essayer File Juicer gratuitement seulement pour cette fonction depuis la page File Juicer, mais vous pouvez également utiliser ses autres fonctions en parcourant le Guide utilisateur et les astuces des formats de fichiers.