« Logithèque Reconnaissance optique de caractères » : différence entre les versions

Dernière version du 12 juillet 2024 à 13:17

Logithèque - Bureautique - Reconnaissance optique de caractères

La reconnaissance optique de caractère (OCR) est longtemps resté un parent pauvre de GNU/Linux. Les choses commencent à bouger ...

Navigation dans la logithèque

Retour à Bureautique

Liste des logiciels [Reconnaissance optique de caractères]

Clara OCR

C'est un bon petit logiciel de reconnaissance de caractères. Il reste encore assez austère.

Licence : GPL.

GOCR

Un OCR pour linux, il sert de backend à kooka. Le 'frontend' par défaut est très spartiate (fait en tcl/tk).

Licence : GPL.

Kooka

Le logiciel d'OCR du projet KDE. Il semble bien avancé et assez simple d'emploi. Il utilise GOCR en tant que backend (programme ligne de commande pour faire la reconnaissance de caractère). Pour des reconnaissance optimale et rapide il est conseillé de scanner en mode "lineart" plutot que "couleur". Notre testeur n'a pas fait beaucoup d'essai mais en couleur il a obtenu 0% de réussite et après un temps de calcul assez long et en lineart il a obtenu 100% assez rapidement sur de courts extraits (quelques lignes).

Licence : GPL-like (GPL avec des exceptions).

Tesseract

Cette page est un peu ancienne, mais comme elle est toujours présente, je me sens obligé de parler de Tesseract.

Tesseract était un bon logiciel développé par HP entre 1985 et 1995, et qui a récemment été repris par google-code sous licence apache.

Pour le moment, comme GOCR, c'est en ligne de commande, mais vous pouvez utiliser gscan2pdf qui permet à tout utilisateur peu averti de l'utiliser. Pas de super-interface avec sélection des zones etc, j'espère que ça viendra rapidement.

http://google-code-updates.blogspot.com/2006/08/announcing-tesseract-ocr.html

@@ Ligne 1 : / Ligne 1 : @@
-==OCR==
+== Logithèque - Bureautique - Reconnaissance optique de caractères ==
-La reconnaissance optique de caractère (OCR) est longtemps resté un parent pauvre de Linux. Les choses commencent à bouger ...
-===Navigation dans les logiciels===
+La reconnaissance optique de caractère (OCR) est longtemps resté un parent pauvre de GNU/Linux. Les choses commencent à bouger ...
-* [[Logithèque:Bureautique|Retour à Bureautique]]
+=== Navigation dans la logithèque ===
-===Liste des logiciels [OCR]===
+* [[Logithèque Bureautique|Retour à Bureautique]]
+===Liste des logiciels [Reconnaissance optique de caractères]===
@@ Ligne 12 : / Ligne 13 : @@
 C'est un bon petit logiciel de reconnaissance de caractères.
 Il reste encore assez austère.
-* [http://www.claraocr.org/ http://www.claraocr.org/]
+* [http://www.claraocr.org/ http://www.claraocr.org]
-* [http://www.claraocr.org/screenshot7.html Copie d'écran]
+* [http://www.claraocr.org/screenshot7.html Capture d'écran]
+Licence : GPL.
 ====GOCR====
 Un OCR pour linux, il sert de backend à kooka. Le 'frontend' par défaut est très spartiate (fait en tcl/tk).
-* [http://jocr.sourceforge.net/ http://jocr.sourceforge.net/]
+* [http://jocr.sourceforge.net/ http://jocr.sourceforge.net]
-* [http://jocr.sourceforge.net/screenshots.html Copies d'écran]
+* [http://jocr.sourceforge.net/screenshots.html Captures d'écran]
+Licence : GPL.
+====Kooka====
+Le logiciel d'OCR du projet KDE. Il semble bien avancé et assez simple d'emploi. Il utilise GOCR en tant que backend (programme ligne de commande pour faire la reconnaissance de caractère). Pour des reconnaissance optimale et rapide il est conseillé de scanner en mode "lineart" plutot que "couleur". Notre testeur n'a pas fait beaucoup d'essai mais en couleur il a obtenu 0% de réussite et après un temps de calcul assez long et en lineart il a obtenu 100% assez rapidement sur de courts extraits (quelques lignes).
+* [http://kooka.kde.org/ http://kooka.kde.org]
+* [http://kooka.kde.org/screenshots Captures d'écran]
+Licence : GPL-like (GPL avec des exceptions).
+==== Tesseract ====
+Cette page est un peu ancienne, mais comme elle est toujours présente, je me sens obligé de parler de Tesseract.
+Tesseract était un bon logiciel développé par HP entre 1985 et 1995, et qui a récemment été repris par google-code sous licence apache.
+Pour le moment, comme GOCR, c'est en ligne de commande, mais vous pouvez utiliser gscan2pdf qui permet à tout utilisateur peu averti de l'utiliser. Pas de super-interface avec sélection des zones etc, j'espère que ça viendra rapidement.
+* http://google-code-updates.blogspot.com/2006/08/announcing-tesseract-ocr.html
-====kooka====
+[[Catégorie:Logithèque]]
-Le logiciel d'OCR du proget KDE. Il semble bien avancé et assez simple d'emploi. Il utilise GOCR en tant que backend (programme ligne de commande pour faire la reconnaissance de caractère). Pour des reconnaissance optimale et rapide je vous conseille de scanner en mode "lineart" plutot que "couleur". Je n'ai pas fais beaucoup d'essai mais en couleur j'ai 0% de réussite (ce qui est trés mauvais) apres un temps de calcul assez long et en lineart j'ai eu 100% assez rapidement sur de courts extraits (quelques lignes).
-* [http://www.kde.org/apps/kooka/ http://www.kde.org/apps/kooka/]
-* [http://www.kde.org/apps/kooka/screenshots/ Copies d'écran]

« Logithèque Reconnaissance optique de caractères » : différence entre les versions

Dernière version du 12 juillet 2024 à 13:17

Sommaire

Logithèque - Bureautique - Reconnaissance optique de caractères

Navigation dans la logithèque

Liste des logiciels [Reconnaissance optique de caractères]

Clara OCR

GOCR

Kooka

Tesseract

Menu de navigation

« Logithèque Reconnaissance optique de caractères » : différence entre les versions

Dernière version du 12 juillet 2024 à 13:17

Logithèque - Bureautique - Reconnaissance optique de caractères

Navigation dans la logithèque

Liste des logiciels [Reconnaissance optique de caractères]

Clara OCR

GOCR

Kooka

Tesseract

Menu de navigation

« Logithèque Reconnaissance optique de caractères » : différence entre les versions