Vidéo: Comment convertir un PDF numérisé en document Word ? 2025
Lorsque vous numérisez un document directement dans un fichier PDF, Acrobat capture tous les textes et graphiques sur chaque page comme s'ils étaient tous juste une grande image graphique. Cela va très bien, sauf qu'il ne va pas très loin car vous ne pouvez ni modifier ni rechercher le document PDF (car, en ce qui concerne Acrobat, le document ne contient aucun texte à éditer ou à rechercher, juste un graphique humoristique). C'est là qu'intervient le plug-in Paper Capture dans Acrobat 5 pour Windows: vous pouvez l'utiliser pour créer un PDF que vous pouvez simplement rechercher ou modifier et rechercher.
Pour une raison inconnue, certaines des premières copies d'Acrobat 5 pour Windows ont été expédiées sans le plug-in Paper Capture. Si vous ne trouvez pas l'élément Paper Capture dans votre menu Outils dans Acrobat 5, vous devez télécharger et installer le plug-in Paper Capture sur le site Web d'Adobe. Notez que le plug-in Paper Capture a une limite de document de 50 pages. Si vous devez traiter des documents PDF de plus de 50 pages, vous devez vous procurer Adobe Acrobat Capture, une version complète du plug-in Paper Capture pouvant gérer des documents plus longs.
Pour utiliser Paper Capture, il vous suffit de sélectionner Outils -> Paper Capture pour ouvrir la boîte de dialogue Paper Capture Plug-In, sélectionnez la ou les pages à traiter (All Pages, Current Page, ou De Page x à y ), puis cliquez sur le bouton OK; l'utilitaire Paper Capture fait le reste. Lors du traitement de la ou des pages du document que vous avez désigné, une boîte de dialogue d'alerte Plug-In Paper Capture vous informe de l'avancement de la préparation et de l'exécution de la reconnaissance de page. Lorsque Paper Capture termine la reconnaissance de la page, cette boîte de dialogue d'alerte disparaît et vous pouvez enregistrer les modifications dans votre document PDF à l'aide de la commande Fichier -> Enregistrer.
Lorsque vous effectuez la reconnaissance de page dans un document PDF, le plug-in Paper Capture vous offre le choix entre les trois options de style de sortie suivantes:
- Texte et graphiques mis en forme pour texte dans le document PDF à la fois modifiable et consultable. Sélectionnez ce paramètre si vous souhaitez non seulement pouvoir trouver du texte dans le document, mais aussi éventuellement y apporter des modifications.
- Image consultable (exacte) pour que le texte du document PDF soit consultable mais non modifiable (c'est le paramètre par défaut). Utilisez ce paramètre si vous traitez un document qui doit être interrogeable mais ne doit jamais être modifié de quelque façon que ce soit, tel qu'un contrat exécuté.
- Image rechercheable (Compact) pour rendre le texte du document PDF consultable mais non modifiable et pour compresser ses graphiques.Sélectionnez ce paramètre si vous traitez un document dont le texte nécessite une recherche sans modification et qui contient également un nombre important d'images graphiques à compresser. Lorsque vous sélectionnez ce paramètre, Capture papier applique la compression JPEG aux images couleur et la compression ZIP aux images en noir et blanc.
Pour sélectionner un paramètre de style de sortie différent, cliquez sur le bouton Préférences dans la boîte de dialogue Plug-in Paper Capture pour ouvrir la boîte de dialogue Préférences. Cette boîte de dialogue vous permet non seulement de sélectionner un nouveau style de sortie dans le menu déroulant Style de sortie PDF, mais également de désigner la langue principale utilisée dans le texte du menu local Langue OCR principale (OCR signifie Optical Character Recognition, qui est le type de logiciel utilisé par Paper Capture pour reconnaître et convertir le texte capturé en tant que graphique en texte pouvant être recherché et modifié.
Si votre document PDF contient des images graphiques, vous pouvez indiquer à Paper Capture combien il faut compresser les images en sélectionnant la résolution maximale dans le menu local Images de sous-échantillonnage. Ce menu vous offre trois options en plus de Aucune (sans compression): Basse (300 dpi), Moyenne (150 dpi) et Haute (72 dpi). Les options Basse, Moyenne et Haute font référence à la quantité de compression appliquée aux images, et les valeurs 300, 150 et 72 dpi (points par pouce) se réfèrent à leur résolution et donc à leur qualité. Comme toujours, plus la compression est élevée, plus la taille du fichier est petite et plus la qualité de l'image est réduite.
Après avoir traité les pages de votre document PDF avec le plug-in Paper Capture, utilisez la fonction Rechercher (Ctrl + F sous Windows et Commande + F sur Mac) pour rechercher des mots ou des phrases dans le texte afin de le vérifier peut être recherché. Si vous avez utilisé le style de sortie Texte et graphiques mis en forme pour effectuer la reconnaissance de page, vous pouvez sélectionner l'outil Texte de retouche en cliquant sur son bouton dans la barre d'outils Edition ou en tapant T, puis cliquez sur le pointeur sélectionnez la ligne avec un cadre de sélection pour vérifier que vous pouvez également modifier le texte. N'oubliez pas d'utiliser Fichier -> Enregistrer pour enregistrer les modifications apportées à votre document en effectuant un traitement avec Paper Capture.
