Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
xsane2tess [Le 14/12/2014, 16:35] L'Africain Maj de la page |
xsane2tess [Le 03/03/2023, 19:13] (Version actuelle) L'Africain |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag>scanner graphisme ocr}} | + | {{tag>Xenial scanner graphisme ocr}} |
---- | ---- | ||
Ligne 5: | Ligne 5: | ||
====== xsane2tess : un adaptateur tesseract pour Xsane ====== | ====== xsane2tess : un adaptateur tesseract pour Xsane ====== | ||
- | **xsane2tess** est un adaptateur permettant d'utiliser le moteur de reconnaissance optique de caractères [[:tesseract-ocr|tesseract]] avec l'interface graphique [[:Xsane]]. Xsane2tess a été proposé par MadMax sur le forum [[http://www.mandrivauser.de/viewtopic.php?pid=166894#p166894|MandrivaUser.de]]. | + | **xsane2tess** est un adaptateur permettant d'utiliser le moteur de reconnaissance optique de caractères [[:tesseract-ocr|tesseract]] avec l'application de numérisation [[:Xsane]]. **Xsane2tess** a été proposé par MadMax sur le forum [[http://www.mandrivauser.de/viewtopic.php?pid=166894#p166894|MandrivaUser.de]]. |
===== Pré-requis ===== | ===== Pré-requis ===== | ||
- | + | * Disposer des [[:sudo|droits d'administration]]; | |
- | Pour utiliser xsane2tess, il faut installer [[:tesseract-ocr|tesseract]] avec les modules de langue que l'on souhaite pouvoir utiliser. | + | * Disposer d'une connexion à Internet configurée et activée; |
- | + | * Avoir installé les paquets: | |
- | Il est nécessaire [[:tutoriel:comment_installer_un_paquet|d'installer les paquets]] **[[apt>xsane, imagemagick|Xsane et imagemagick]]**. | + | * **[[:tesseract-ocr|tesseract]]** avec les modules de langue que l'on souhaite pouvoir utiliser; |
+ | * **[[:Xsane]]** | ||
+ | * et **[[:imagemagick]]** | ||
===== Installation ===== | ===== Installation ===== | ||
- | Suivez la procédure suivante: | + | Pour utiliser la reconnaissance optique de caractères [[:tesseract-ocr|tesseract]] avec l'application de numérisation [[:Xsane]], il est nécessaire de créer un [[:script]]. Pour cela, il suffit de suivre la procédure suivante: |
- | - [[:tutoriel:comment_modifier_un_fichier|Créez le fichier]] **xsane2tess** par exemple sur votre Bureau et copiez-y le contenu suivant: | + | - [[:tutoriel:comment_modifier_un_fichier|Créez le fichier]] **xsane2tess** par exemple sur votre Bureau et copiez-y le contenu suivant: <file txt xsane2tess>#!/bin/bash |
- | <file txt xsane2tess>#!/bin/bash | + | |
# | # | ||
# | # | ||
Ligne 104: | Ligne 104: | ||
# delete tesseract output | # delete tesseract output | ||
rm "$TXT_FILE".txt</file> | rm "$TXT_FILE".txt</file> | ||
- | - [[:tutoriel:script_shell#methode_graphique|Rendez exécutable]] le fichier //xsane2tess//, | + | - [[:tutoriel:script_shell#methode_graphique|Rendez exécutable]] ce fichier //xsane2tess//, |
- | - Copiez le fichier xsane2tess dans ///usr/bin//, en admettant que vous l'avez enregistré sur votre Bureau, sinon adapter le chemin: | + | - Depuis un [[:terminal]], copiez le fichier //xsane2tess// dans le dossier dans ///usr/bin//, en admettant que vous l'avez enregistré sur votre Bureau, sinon adapter le chemin: |
<code>sudo cp Bureau/xsane2tess /usr/bin</code> | <code>sudo cp Bureau/xsane2tess /usr/bin</code> | ||
- | Vous pourrez ensuite consulter le fichier //xsane2tess.log// pour observer les éventuelles erreurs dans le dossier //tmp//. | + | Vous pourrez ensuite consulter le fichier //xsane2tess.log// dans le dossier // /tmp// pour observer les éventuelles erreurs . |
===== Utilisation ===== | ===== Utilisation ===== | ||
- | Dans votre [[:unity#dash|tableau de bord Unity]] entrer le mot clé "Xsane".\\ | + | - Lancer l'application [[:Xsane]] |
- | Puis Préférences -> Configuration -> Onglet "OCR" entrez les informations suivantes en respectant bien la casse : | + | - Puis dans le menu: Préférences -> Configuration -> Onglet "OCR" entrez les informations suivantes en respectant bien la casse : |
- | * **Commande OCR** : xsane2tess -l fra | + | * **Commande OCR** : xsane2tess -l fra |
- | * **Option de fichier d'entrée** : -i | + | * **Option de fichier d'entrée** : -i |
- | * **Option de fichier de sortie** : -o | + | * **Option de fichier de sortie** : -o |
La langue du texte à numériser peut être modifiée quand on le veut dans le menu de configuration de XSane [[:tesseract-ocr#les_options_de_langues|(l'option-l)]], à condition d'avoir installé les fichiers de langues correspondants de tesseract, comme indiqué dans le paragraphe [[#Pré-requis]].\\ | La langue du texte à numériser peut être modifiée quand on le veut dans le menu de configuration de XSane [[:tesseract-ocr#les_options_de_langues|(l'option-l)]], à condition d'avoir installé les fichiers de langues correspondants de tesseract, comme indiqué dans le paragraphe [[#Pré-requis]].\\ | ||
- | XSane présente le grand avantage de permettre la sélection des colonnes ou zones d'un texte l'une après l'autre grâce à la prévisualisation, et donc avant traitement ROC par tesseract. | + | [[:XSane]] présente le grand avantage de permettre la sélection des colonnes ou zones d'un texte l'une après l'autre grâce à la prévisualisation, et donc avant traitement [[:OCR]] par tesseract. |
On obtient de bons résultats en numérisant à 300 ppi, noir et blanc (fichier "type : TEXT"). | On obtient de bons résultats en numérisant à 300 ppi, noir et blanc (fichier "type : TEXT"). | ||
Pour plus de précisions, voir le paragraphe sur [[:ocr#xsane|la ROC avec XSane]]. | Pour plus de précisions, voir le paragraphe sur [[:ocr#xsane|la ROC avec XSane]]. | ||
- | Il suffit ensuite de copier-coller les fichiers obtenus dans un fichier LibreOffice Writer, et la reconnaissance orthographique fait le reste... | + | Il suffit ensuite de copier-coller les fichiers obtenus dans une application de traitement de texte comme LibreOffice Writer, et la reconnaissance orthographique fait le reste... |
- | ===== Références ===== | + | =====Désinstallation==== |
+ | Pour supprimer cette application, il suffit de [[:tutoriel:comment_supprimer_un_paquet|supprimer son paquet]], les paquets de langues installées et si ils ne sont plus nécessaires pour d'autres applications, supprimer les paquets ** [[:tesseract-ocr|tesseract]]** et **[[:Imagemagick]]**. Le script créé plus haut ne sera plus utile, vous pouvez aussi le supprimer.\\ | ||
+ | Selon la méthode choisie, la configuration globale des applications sont conservées ou supprimées. Les journaux du système, et les fichiers de préférence des utilisateurs dans leurs dossiers personnels sont toujours conservés. | ||
- | * [[http://www.mandrivauser.de/viewtopic.php?pid=166894#p166894| Le post de MadMax sur xsane2tess]] (de) | + | ===== Voir aussi ===== |
+ | |||
+ | * [[https://web.archive.org/web/20090719052550/http://www.mandrivauser.de/viewtopic.php?pid=166894| Le post de MadMax concernant xsane2tess disponible sur Internet Archive]] (de) | ||
* [[:tesseract-ocr]] (fr) | * [[:tesseract-ocr]] (fr) | ||
* [[:Xsane]] (fr) | * [[:Xsane]] (fr) | ||
- | * [[http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/ | Une solution qui fonctionne : xsane2tess ...]] (fr) | + | * [[https://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/ | Une solution qui fonctionne : xsane2tess ...]] (fr) |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=78804| Le fil de discussion du forum Ubuntu-fr dédié à la Reconnaissance Optique de Caractères.]] (fr) | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=78804| Le fil de discussion du forum Ubuntu-fr dédié à la Reconnaissance Optique de Caractères.]] (fr) |
------ | ------ | ||
//Contributeurs : [[utilisateurs:Sorbus]], [[utilisateurs:l_Africain|L'Africain]] // | //Contributeurs : [[utilisateurs:Sorbus]], [[utilisateurs:l_Africain|L'Africain]] // | ||
- |