Aller au contenu. | Aller à la navigation

Outil PloneMeeting (gestion des délibérations)
Vous êtes ici : Accueil Support Forums Outil PloneMeeting (gestion des délibérations) Reconnaissance de caractères (OCR)

Reconnaissance de caractères (OCR)

Remonter à Outil PloneMeeting (gestion des délibérations)

Reconnaissance de caractères (OCR)

Envoyé par Gerd Xhonneux (CPAS Eupen) le 12 Août 2009 à 14:28
Bonjour,

avec PloneMeeting on a la possibilité d'attacher des fichiers (à des demandes, des décisions, etc.).

En pratique ça va être soit des documents créés d'une façon électronique soit des documents papier scannés. Les derniers seront donc des images et "perdent" leur contenu dès qu'ils se trouvent dans Plone. Ce qui est dommâge surtout si on souhaite que la db de Plone soit aussi un archive électronique!

Il faudrait donc une solution et je pense que j'en ai trouvé une (ou au moins un début):

http://plone.org/documentation/how-to/ocr-in-plone-using-tesseract-ocr respectivement http://plone.org/products/pdftoocr/

Comment voyez-vous la possibilité d'inclure cela dans une installation par défaut de PloneMeeting?

Merci d'avance pour vos réflexions!

Re: Reconnaissance de caractères (OCR)

Envoyé par Gauthier Bastien (CommunesPlone) le 13 Août 2009 à 8:28
Je ne connais pas ces produits, mais personnellement, je préfère ne pas indexer les annexes.  En effet, l'utilisation de la recherche "à la Google" cad avec une seule zone de recherche étant bien souvent la règle, les données issues des annexes peuvent à mon avis après qq mois d'utilisation provoquer plus de "bruit" qu'apporter un quelconque avantage.  Je pense que la bonne définition des métadonnées dans les titre et description des différents éléments (et plus particulièrement des annexes) serait la meilleure solution quant à les retrouver par la suite...  Je mettrais plutôt l'accent sur la formation des utilisateurs (formation continue...) quant à la rédaction efficace des métadonnées dans l'application...

Ceci dit, il est évident que si on souhaite malgré tout indexer les annexes, ce genre d'outil est plus que nécessaire, mais je ne les connais pas...

Bien à toi,

Gauthier Bastien, AC Sambreville

Re: Reconnaissance de caractères (OCR)

Envoyé par Gerd Xhonneux (CPAS Eupen) le 15 Août 2009 à 8:40
Tu as certainement raison, Gauthier, mais si on voit l'affaire un peu à la longue, les données gèrées avec PloneMeeting vont être archivées électroniquement et peut-être représenter le SEUL archive (j'ai posé des questions à ce propos à Edouard Vercruysse et à la communauté germanophone). PloneMeeting ou plutôt Plone sera donc la GED (voir aussi les projets de la communauté française) qui sert de base. Il est à mon avis alors également primordial de pouvoir "OCRiser" et indexer les PDF annexés.

J'ai reçu une information de Gaëtan que je n'ai pas encore exploré profondément mais elle peut éventuellement éclairer les choses...

Re: Reconnaissance de caractères (OCR)

Envoyé par Gauthier Bastien (CommunesPlone) le 24 Août 2009 à 11:23
En effet, une solution d'OCRisation des documents et par extension d'indexation des fichiers attachés va être ajoutée à PloneMeeting.

Pour plus d'infos : http://dev.communesplone.org/trac/ticket/832

Bien à toi,

Gauthier Bastien, AC Sambreville
Rendu par Ploneboard
Actions sur le document