Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
ocr [Le 20/12/2021, 22:30] wiki-corrector-bot passage de http à https sur les liens externes (détecté et corrigé via le bot wiki-corrector (https://forum.ubuntu-fr.org/viewtopic.php?id=2067892) |
ocr [Le 28/09/2022, 20:49] Amiralgaby [Cuneiform] amélioration du code shell - repéré grâce à wiki-corrector |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | |||
{{tag>bureautique portail}} | {{tag>bureautique portail}} | ||
Ligne 21: | Ligne 20: | ||
[[http://cognitiveforms.com/ru/products_and_services/Cuneiform.html#1189-Cuneiform|cuneiform]] (en russe, ou en [[http://en.cognitiveforms.ru/products/cuneiform/|anglais]]) est un OCR multi-plateforme, qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'image. Il supporte les fichiers images en bmp, jpg, png, tiff, Il peut exporter en format texte, html, rtf, et d'autres. | [[http://cognitiveforms.com/ru/products_and_services/Cuneiform.html#1189-Cuneiform|cuneiform]] (en russe, ou en [[http://en.cognitiveforms.ru/products/cuneiform/|anglais]]) est un OCR multi-plateforme, qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'image. Il supporte les fichiers images en bmp, jpg, png, tiff, Il peut exporter en format texte, html, rtf, et d'autres. | ||
- | Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://code.launchpad.net/cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://launchpad.net/cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. | + | Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://code.launchpad.net/cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://launchpad.net/cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. |
Voir la [[http://wiki.ubuntuusers.de/Cuneiform-Linux?highlight=cuneiform#Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract. | Voir la [[http://wiki.ubuntuusers.de/Cuneiform-Linux?highlight=cuneiform#Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract. | ||
Ligne 30: | Ligne 29: | ||
<file bash>#!/bin/sh | <file bash>#!/bin/sh | ||
- | printf %s "$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS" | | + | printf %s "$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS" | |
while read -r arg | while read -r arg | ||
do | do | ||
- | convert -colorspace GRAY $arg tmp.tiff | + | convert -colorspace GRAY "$arg" tmp.tiff |
- | cuneiform -l fra -f rtf -o $arg.rtf tmp.tiff | + | cuneiform -l fra -f rtf -o "$arg".rtf tmp.tiff |
rm tmp.tiff | rm tmp.tiff | ||
done</file> | done</file> | ||
Ligne 57: | Ligne 56: | ||
==== Gocr ==== | ==== Gocr ==== | ||
- | Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'erreur par document. | + | Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'erreur par document. |
Installez le paquet **[[apt>gocr]]** et **[[apt>gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire : | Installez le paquet **[[apt>gocr]]** et **[[apt>gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire : | ||
Ligne 79: | Ligne 78: | ||
Pour faire de la ROC avec Xsane il faut : | Pour faire de la ROC avec Xsane il faut : | ||
- | * Choisir son moteur d'OCR : ouvrir Xsane et dans //Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par : | + | * Choisir son moteur d'OCR : ouvrir Xsane et dans //Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par : |
* pour **gocr** avec la reconnaissance des caractères accentués <code>gocr -f UTF8</code> | * pour **gocr** avec la reconnaissance des caractères accentués <code>gocr -f UTF8</code> | ||
* pour **tesseract** <code >xsane2tess -l fra</code> | * pour **tesseract** <code >xsane2tess -l fra</code> | ||
Ligne 191: | Ligne 190: | ||
* [[https://appdb.winehq.org/objectManager.php?sClass=application&iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]] | * [[https://appdb.winehq.org/objectManager.php?sClass=application&iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]] | ||
* [[https://appdb.winehq.org/objectManager.php?sClass=application&iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://www.visionobjects.com/handwriting_recognition/downloadstylus3.htm#Linux|existe pour GNU/Linux]] ), reconnaît l'écriture attachée | * [[https://appdb.winehq.org/objectManager.php?sClass=application&iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://www.visionobjects.com/handwriting_recognition/downloadstylus3.htm#Linux|existe pour GNU/Linux]] ), reconnaît l'écriture attachée | ||
- | Non libre, [[http://www.visionobjects.com/handwriting_recognition/onlinestore.htm|versions d'évaluation 30 jours]] des logiciels sur le site officiel. | + | Non libre, [[http://www.visionobjects.com/handwriting_recognition/onlinestore.htm|versions d'évaluation 30 jours]] des logiciels sur le site officiel. |
===== Voir aussi ===== | ===== Voir aussi ===== |