Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
xsane2tess [Le 14/12/2014, 16:35]
L'Africain Maj de la page
xsane2tess [Le 03/03/2023, 19:13] (Version actuelle)
L'Africain
Ligne 1: Ligne 1:
-{{tag>​scanner graphisme ocr}}+{{tag>Xenial ​scanner graphisme ocr}}
  
 ---- ----
Ligne 5: Ligne 5:
 ====== xsane2tess : un adaptateur tesseract pour Xsane ====== ====== xsane2tess : un adaptateur tesseract pour Xsane ======
  
-**xsane2tess** est un adaptateur permettant d'​utiliser le moteur de reconnaissance optique de caractères [[:​tesseract-ocr|tesseract]] ​ avec l'interface graphique ​[[:Xsane]]. Xsane2tess a été proposé par MadMax sur le forum [[http://​www.mandrivauser.de/​viewtopic.php?​pid=166894#​p166894|MandrivaUser.de]]. +**xsane2tess** est un adaptateur permettant d'​utiliser le moteur de reconnaissance optique de caractères [[:​tesseract-ocr|tesseract]] ​ avec l'application de numérisation ​[[:​Xsane]]. ​**Xsane2tess** a été proposé par MadMax sur le forum [[http://​www.mandrivauser.de/​viewtopic.php?​pid=166894#​p166894|MandrivaUser.de]].
  
 ===== Pré-requis ===== ===== Pré-requis =====
- +  * Disposer des [[:​sudo|droits d'​administration]];​ 
-Pour utiliser xsane2tess, il faut installer ​[[:​tesseract-ocr|tesseract]] avec les modules de langue que l'on souhaite pouvoir utiliser. +  * Disposer d'une connexion à Internet configurée et activée; 
- +  * Avoir installé les paquets: 
-Il est nécessaire ​[[:tutoriel:​comment_installer_un_paquet|d'​installer les paquets]] **[[apt>​xsane,​ imagemagick|Xsane et imagemagick]]**.+    * **[[:​tesseract-ocr|tesseract]]** avec les modules de langue que l'on souhaite pouvoir utiliser; 
 +    * **[[:Xsane]]** 
 +    * et **[[:imagemagick]]**
  
 ===== Installation ===== ===== Installation =====
-Suivez ​la procédure suivante: +Pour utiliser la reconnaissance optique de caractères [[:​tesseract-ocr|tesseract]] ​ avec l'​application de numérisation [[:Xsane]], il est nécessaire de créer un [[:​script]]. Pour cela, il suffit de suivre ​la procédure suivante: 
-  - [[:​tutoriel:​comment_modifier_un_fichier|Créez le fichier]] **xsane2tess** par exemple sur votre Bureau et copiez-y le contenu suivant: +  - [[:​tutoriel:​comment_modifier_un_fichier|Créez le fichier]] **xsane2tess** par exemple sur votre Bureau et copiez-y le contenu suivant: <file txt xsane2tess>#​!/​bin/​bash
-<file txt xsane2tess>#​!/​bin/​bash+
   #   #
   #   #
Ligne 104: Ligne 104:
   # delete tesseract output   # delete tesseract output
   rm "​$TXT_FILE"​.txt</​file>​   rm "​$TXT_FILE"​.txt</​file>​
-  - [[:​tutoriel:​script_shell#​methode_graphique|Rendez exécutable]] ​le fichier //​xsane2tess//,​ +  - [[:​tutoriel:​script_shell#​methode_graphique|Rendez exécutable]] ​ce fichier //​xsane2tess//,​ 
-  - Copiez ​le fichier xsane2tess dans ///​usr/​bin//,​ en admettant que vous l'avez enregistré sur votre Bureau, sinon adapter le chemin:+  - Depuis un [[:​terminal]],​ copiez ​le fichier ​//xsane2tess// dans le dossier ​dans ///​usr/​bin//,​ en admettant que vous l'avez enregistré sur votre Bureau, sinon adapter le chemin:
 <​code>​sudo cp Bureau/​xsane2tess /​usr/​bin</​code>​ <​code>​sudo cp Bureau/​xsane2tess /​usr/​bin</​code>​
-Vous pourrez ensuite consulter le fichier //​xsane2tess.log// ​pour observer les éventuelles erreurs ​dans le dossier //tmp//. +Vous pourrez ensuite consulter le fichier //​xsane2tess.log//​ dans le dossier ​// /​tmp// ​pour observer les éventuelles erreurs ​.
  
 ===== Utilisation ===== ===== Utilisation =====
  
-Dans votre [[:unity#​dash|tableau de bord Unity]] entrer le mot clé "​Xsane"​.\\ +  - Lancer l'​application ​[[:Xsane]]  
-Puis Préférences -> Configuration -> Onglet "​OCR"​ entrez les informations suivantes en respectant bien la casse : +  ​- ​Puis dans le menu: Préférences -> Configuration -> Onglet "​OCR"​ entrez les informations suivantes en respectant bien la casse : 
-  * **Commande OCR** : xsane2tess -l fra  +    * **Commande OCR** : xsane2tess -l fra  
-  * **Option de fichier d'​entrée** : -i +    * **Option de fichier d'​entrée** : -i 
-  * **Option de fichier de sortie** : -o+    * **Option de fichier de sortie** : -o
  
 La langue du texte à numériser peut être modifiée quand on le veut dans le menu de configuration de XSane [[:​tesseract-ocr#​les_options_de_langues|(l'​option-l)]],​ à condition d'​avoir installé les fichiers de langues correspondants de tesseract, comme indiqué dans le paragraphe [[#​Pré-requis]].\\ La langue du texte à numériser peut être modifiée quand on le veut dans le menu de configuration de XSane [[:​tesseract-ocr#​les_options_de_langues|(l'​option-l)]],​ à condition d'​avoir installé les fichiers de langues correspondants de tesseract, comme indiqué dans le paragraphe [[#​Pré-requis]].\\
-XSane présente le grand avantage de permettre la sélection des colonnes ou zones d'un texte l'une après l'​autre grâce à la prévisualisation,​ et donc  avant traitement ​ROC par tesseract.+[[:XSane]] présente le grand avantage de permettre la sélection des colonnes ou zones d'un texte l'une après l'​autre grâce à la prévisualisation,​ et donc  avant traitement ​[[:​OCR]] ​par tesseract.
  
 On obtient de bons résultats en numérisant à 300 ppi, noir et blanc (fichier ​ "type : TEXT"​). On obtient de bons résultats en numérisant à 300 ppi, noir et blanc (fichier ​ "type : TEXT"​).
 Pour plus de précisions,​ voir le paragraphe sur [[:​ocr#​xsane|la ROC avec XSane]]. Pour plus de précisions,​ voir le paragraphe sur [[:​ocr#​xsane|la ROC avec XSane]].
  
-Il suffit ensuite de copier-coller les fichiers obtenus dans un fichier ​LibreOffice Writer, et la reconnaissance orthographique fait le reste...+Il suffit ensuite de copier-coller les fichiers obtenus dans une application de traitement de texte comme LibreOffice Writer, et la reconnaissance orthographique fait le reste...
  
-===== Références =====+=====Désinstallation==== 
 +Pour supprimer cette application,​ il suffit de [[:​tutoriel:​comment_supprimer_un_paquet|supprimer son paquet]], les paquets de langues installées et si ils ne sont plus nécessaires pour d'​autres applications,​ supprimer les paquets **  [[:​tesseract-ocr|tesseract]]** et  **[[:​Imagemagick]]**. Le script créé plus haut ne sera plus utile, vous pouvez aussi le supprimer.\\ 
 +Selon la méthode choisie, la configuration globale des applications sont conservées ou supprimées. Les journaux du système, et les fichiers de préférence des utilisateurs dans leurs dossiers personnels sont toujours conservés.
  
-  ​* [[http://​www.mandrivauser.de/​viewtopic.php?​pid=166894#p166894| Le post de MadMax ​sur xsane2tess]] (de)+===== Voir aussi ===== 
 + 
 +  ​* [[https://​web.archive.org/​web/​20090719052550/​http://​www.mandrivauser.de/​viewtopic.php?​pid=166894| Le post de MadMax ​concernant ​xsane2tess ​disponible sur Internet Archive]] (de)
   * [[:​tesseract-ocr]] (fr)   * [[:​tesseract-ocr]] (fr)
   * [[:Xsane]] (fr)   * [[:Xsane]] (fr)
-  * [[http://​www.equinoxefr.org/​post/​2008/​07/​05/​xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/​ | Une solution qui fonctionne : xsane2tess ...]] (fr) +  * [[https://​www.equinoxefr.org/​post/​2008/​07/​05/​xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/​ | Une solution qui fonctionne : xsane2tess ...]] (fr) 
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=78804| Le fil de discussion du forum Ubuntu-fr dédié à la Reconnaissance Optique de Caractères.]] (fr)+  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=78804| Le fil de discussion du forum Ubuntu-fr dédié à la Reconnaissance Optique de Caractères.]] (fr)
    
 ------ ------
  
 //​Contributeurs : [[utilisateurs:​Sorbus]],​ [[utilisateurs:​l_Africain|L'​Africain]] // //​Contributeurs : [[utilisateurs:​Sorbus]],​ [[utilisateurs:​l_Africain|L'​Africain]] //
- 
  • xsane2tess.1418571319.txt.gz
  • Dernière modification: Le 14/12/2014, 16:35
  • par L'Africain