Comment modifier un texte scanné ?

Il y a quelques semaines, au travail, vos collègues vous ont confié une tâche : vous devez copier plusieurs pages d’un livre sur l’ordinateur, à l’aide d’un traitement de texte. De plus, comme si le travail assigné n’était pas assez stimulant, ils vous ont demandé de modifier le texte de quelques pages.  Ne désespérez pas ! Vous faites une grosse erreur : ne savez-vous pas que vous pouvez simplifier considérablement votre travail, grâce à l’utilisation de la technologie ? Il existe plusieurs outils qui permettent de scanner des documents et de reconnaître des caractères optiques. Vous vous demandez ce que vous pourriez en faire ? Eh bien, la réponse est vite dite : vous en avez besoin pour modifier un texte scanné.

Les outils de reconnaissance optique de caractères sont en fait capables de convertir la numérisation d’une page écrite d’un livre en texte éditable. Donc, pour faire simple, il suffit de scanner le texte et de ne faire la modification que pour les sections concernées. L’utilisation d’un programme OCR est finalement beaucoup plus facile et rapide que la copie manuelle des différentes pages du livre ! Découvrez les programmes et outils recommandés.

Programmes pour éditer le texte scanné

Si vous êtes au bureau ou à la maison et que vous devez scanner du texte à partir de pages de documents, vous pouvez compter sur certaines solutions à installer sur votre ordinateur Windows ou MacOS. Dans les prochaines lignes, il est recommandé d’installer quelques logiciels sur votre ordinateur qui vous permettront de modifier le texte de vos documents scannés.

TopOCR (Windows)

Un programme intéressant pour l’analyse OCR des documents scannés est TopOCR. Ce logiciel pour mac ou Windows est un logiciel payant (il coûte 4,99 $) mais vous pouvez télécharger une version d’évaluation entièrement gratuite.

Allez sur le site officiel à ce lien et cliquez sur le bouton “Essayez-le” en haut. Cliquez ensuite sur l’icône représentant un appareil photo pour télécharger le fichier topocrdemo.exe. Ensuite, double-cliquez sur le fichier et cliquez sur Oui dans la fenêtre de contrôle de l’utilisateur. Cliquez ensuite sur Suivant > J’accepte > Installer > Terminer pour terminer le processus d’installation.

Démarrez maintenant le programme via son icône de bureau et importez le document sur lequel vous souhaitez effectuer l’analyse OCR. Pour ce faire, dans la fenêtre de gauche, cliquez sur Fichier puis sur Ouvrir, en sélectionnant le fichier PDF. L’image sera analysée immédiatement, ce qui vous donnera un aperçu dans la fenêtre de droite. Si l’analyse ne démarre pas, cliquez sur le bouton OCR dans la fenêtre de droite. Pour enregistrer le texte extrait, dans la fenêtre de droite, cliquez sur Fichier puis sur Enregistrer sous. Cette fonction n’est toutefois pas disponible dans la version de démonstration.

Adobe Acrobat Pro (Windows/macOS)

Parmi les programmes que vous pouvez utiliser pour modifier le texte d’un document scanné, mon choix se porte sur Adobe Acrobat Pro. Ce logiciel payant, mais disponible en version d’essai gratuite, sera utile pour effectuer de nombreuses opérations sur votre PDF, y compris l’OCR, c’est-à-dire la reconnaissance de texte.

Vous pouvez télécharger Adobe Acrobat Pro à partir de ce lien, aussi bien sur votre ordinateur Windows que sur MacOS. Cliquez ensuite sur le bouton “Go” et connectez-vous avec votre compte Adobe ID. Téléchargez ensuite le programme d’installation pour votre système d’exploitation Windows ou mac OS. Après avoir téléchargé le fichier, double-cliquez dessus pour effectuer le processus d’installation automatique. Démarrez ensuite le programme à l’aide de son icône et, dans la barre de menu supérieure, cliquez sur Fichier > Ouvrir, puis sélectionnez le fichier PDF numérisé sur votre ordinateur. Ensuite, sélectionnez dans la barre de droite l’élément “Edit PDF” pour lancer l’analyse OCR.

Attendez quelques secondes pour que le processus d’analyse soit terminé. Le texte sera désormais éditable sous tous ses aspects : vous pouvez supprimer du texte, en ajouter de nouveaux ou corriger des erreurs. Lorsque vous avez terminé vos modifications des paramètres, cliquez sur le bouton Enregistrer en haut (symbole de disquette) pour conserver les modifications que vous avez effectuées.

Application permettant de modifier le texte scanné

Si vous êtes toujours en déplacement et que vous avez besoin d’une solution à portée de votre smartphone. Sur votre appareil mobile, Android ou iOS, vous pouvez télécharger l’une des nombreuses applications qui exécutent une fonction OCR du texte scanné.

FineScanner PDF (Android/iOS)

Cette application a été développée par ABBYY, une société célèbre pour son logiciel de numérisation. Vous pouvez télécharger gratuitement FineScanner PDF, soit sur votre appareil Android (via le Play Store), soit sur votre iPhone/iPad (via l’App Store). Après avoir téléchargé l’application grâce aux liens fournis, il vous suffit de l’ouvrir pour voir comment elle fonctionne. Une fois ouvert, vous verrez une présentation de l’application, à l’issue de laquelle vous serez invité à profiter de la réduction pour acheter un abonnement. Si vous n’êtes pas intéressé pour le moment, fermez la fenêtre en appuyant sur la flèche de droite.

Ensuite, appuyez sur l’icône rouge avec un symbole d’appareil photo et acceptez les messages demandant l’accès aux autorisations de votre appareil. Encadrez maintenant la page que vous voulez numériser et appuyez sur le bouton de l’obturateur. Appuyez maintenant sur l’icône de prévisualisation pour voir le résultat. Vous pouvez définir le type de filtre Original, Noir et blanc, Niveaux de gris ou Couleur, ou définir des coupures de presse ou faire pivoter l’image. Lorsque vous avez terminé, appuyez sur Enregistrer.

Pour extraire le texte de l’image maintenant, tapez sur l’icône T à côté de l’aperçu du document. Si vous utilisez la version gratuite, vous verrez un message indiquant le nombre de scans OCR encore disponibles. Appuyez sur Essayez de définir la langue et le type de format de sortie. Puis touchez Reconnaître le texte et attendez la fin du processus. À côté de l’aperçu du document, vous trouverez maintenant une nouvelle icône, qui vous permettra de voir le résultat de l’analyse, puis de modifier le texte du document scanné.

Adobe Scan et Adobe Acrobat Reader (Android/iOS)

Si vous cherchez une solution alternative à celle que j’ai proposée précédemment, il est conseillé de choisir Adobe Scan, disponible gratuitement sur l’Android Play Store et sur l’App Store de l’iOS.

Après avoir téléchargé et installé l’application, une page de connexion vous sera présentée à son ouverture. Vous pouvez utiliser votre compte Facebook ou Google ou votre identifiant Adobe. Une fois connecté, il vous sera demandé d’accéder à l’appareil photo de votre appareil, ce que vous devrez accepter. Encadrez maintenant le document avec l’appareil photo et attendez que la capture automatique s’active. Une zone bleue apparaîtra pour mettre en évidence le document à scanner. À ce stade, essayez de garder votre appareil aussi immobile que possible afin de pouvoir bien scanner.

Dès que l’image a été capturée, vous en voyez un aperçu, qui peut être édité à l’aide des outils fournis. Appuyez ensuite sur Enregistrer le PDF pour confirmer la numérisation et enregistrer une copie sur votre appareil. Le document sera alors disponible dans l’écran d’accueil de l’application et, si vous attendez quelques secondes, vous verrez également l’analyse OCR complète du document.

Appuyez ensuite sur le bouton Ouvrir dans Acrobat pour afficher le texte du document scanné. Lorsque vous appuyez sur ce bouton, le document sera ouvert à l’aide d’une autre application, Adobe Acrobat Reader. Si vous ne l’avez pas, vous pouvez le télécharger gratuitement sur votre appareil Android ou sur le système d’exploitation iOS ; sinon, suivez les instructions à l’écran.

Après avoir ouvert le document dans Adobe Acrobat Reader, tapez sur l’icône ☰ en haut à gauche et sélectionnez Exporter PDF. Il vous sera demandé, si vous ne l’avez pas, un abonnement mensuel pour exporter des fichiers PDF dans un format Word, Excel ou RTF entièrement modifiable.

Outil en ligne pour modifier le texte scanné

Si vous ne souhaitez pas installer d’applications ou de logiciels, il vous suffit de vous fier à un outil en ligne qui effectuera une reconnaissance OCR sur le document scanné. Dans les prochaines lignes, quelques services web pourraient vous convenir.

OCR en ligne

Le premier service web pour effectuer la reconnaissance de texte d’un document scanné est l’OCR en ligne. Ce service gratuit est disponible sur le site officiel à l’adresse suivante

Après avoir ouvert le lien que j’ai fourni avec votre navigateur préféré, vous pouvez lancer la numérisation OCR. Tout d’abord, cliquez sur le bouton bleu “Select file” et sélectionnez le fichier de document scanné à partir de votre appareil. Les formats pris en charge sont les suivants : PDF, JPG, BMP, TIFF et GIF. Après avoir joint le fichier, vous devrez sélectionner la langue du texte, puis la sélectionner dans la liste déroulante. De nombreuses langues sont prises en charge, à vous de choisir la bonne. Par exemple, si le document est en italien, veuillez sélectionner italien ; si la langue est l’anglais, sélectionnez anglais.

Le résultat de l’extraction du texte peut être téléchargé dans un fichier. Vous pouvez alors choisir entre les formats Microsoft office Word docx, Microsoft office Excel xlsx ou Text Plain txt. Une fois que vous avez également sélectionné le format de sortie, cliquez sur le bouton à droite Convertir. Attendez quelques secondes, afin que l’analyse OCR puisse reconnaître tout le texte inséré dans le document. Vous pouvez alors immédiatement prévisualiser le résultat en utilisant le panneau ci-dessous ou télécharger le document texte directement sur votre appareil en cliquant sur le bouton Télécharger le fichier de sortie.

Convertir

Un autre service utile qui vous permet d’effectuer une analyse OCR sur les documents est Convertio. Ce service web est disponible gratuitement pour seulement 10 pages. Toutefois, vous pouvez demander d’autres analyses, en ouvrant un compte et en payant une redevance qui dépendra du nombre de pages à analyser.

Toutefois, ce service est plus complet que le précédent. En fait, il permet l’importation de documents également à partir de services et d’URL en nuage, outre le fait que plusieurs langues peuvent être associées pendant l’analyse, au cas où le document devrait présenter des termes dans différentes langues. Si ce service en ligne éveille votre curiosité, vous pouvez y accéder par ce lien officiel. Après avoir ouvert la page, repérez la case rouge et cliquez sur l’icône du mode d’importation du document de votre choix.

Vous pouvez sélectionner le fichier à partir de votre ordinateur, de votre Dropbox, de Google Drive ou d’une URL. De nombreux formats d’entrée sont pris en charge ; à titre d’exemple, vous pouvez utiliser des fichiers aux formats TGA, PGM, PBM et aux formats classiques PDF, JPG ou BMP. Sélectionnez ensuite la langue du texte dans les listes déroulantes. Vous disposez de quatre champs linguistiques, mais s’ils ne sont pas suffisants, cliquez sur le bouton Plus de langues pour ajouter d’autres champs linguistiques.

Enfin, sélectionnez le format de sortie du document dans la liste et choisissez d’effectuer une analyse OCR sur toutes les pages ou sur certains numéros de page spécifiques. Ensuite, résolvez le CAPTCHA et cliquez sur le bouton Convertir ou sur les boutons Google Drive ou Dropbox si vous souhaitez que le résultat de l’analyse soit automatiquement téléchargé dans votre nuage. Lorsque l’analyse est terminée (ce qui prendra très peu de temps), cliquez sur le bouton vert de téléchargement à côté du document que vous avez joint. Si votre document présente des images et du texte, le document que vous téléchargez présentera le texte modifiable, y compris toutes les images qui étaient présentes.