Skip to content. | Skip to navigation

Outil PloneMeeting (gestion des délibérations)
Sections
You are here: Home Support Forums Outil PloneMeeting (gestion des délibérations) Reconnaissance de caractères (OCR)

Reconnaissance de caractères (OCR)

Up to Outil PloneMeeting (gestion des délibérations)

Reconnaissance de caractères (OCR)

Posted by Gerd Xhonneux (CPAS Eupen) at August 12. 2009
Bonjour,

avec PloneMeeting on a la possibilité d'attacher des fichiers (à des demandes, des décisions, etc.).

En pratique ça va être soit des documents créés d'une façon électronique soit des documents papier scannés. Les derniers seront donc des images et "perdent" leur contenu dès qu'ils se trouvent dans Plone. Ce qui est dommâge surtout si on souhaite que la db de Plone soit aussi un archive électronique!

Il faudrait donc une solution et je pense que j'en ai trouvé une (ou au moins un début):

http://plone.org/documentation/how-to/ocr-in-plone-using-tesseract-ocr respectivement http://plone.org/products/pdftoocr/

Comment voyez-vous la possibilité d'inclure cela dans une installation par défaut de PloneMeeting?

Merci d'avance pour vos réflexions!

Re: Reconnaissance de caractères (OCR)

Posted by Gauthier Bastien (CommunesPlone) at August 13. 2009
Je ne connais pas ces produits, mais personnellement, je préfère ne pas indexer les annexes.  En effet, l'utilisation de la recherche "à la Google" cad avec une seule zone de recherche étant bien souvent la règle, les données issues des annexes peuvent à mon avis après qq mois d'utilisation provoquer plus de "bruit" qu'apporter un quelconque avantage.  Je pense que la bonne définition des métadonnées dans les titre et description des différents éléments (et plus particulièrement des annexes) serait la meilleure solution quant à les retrouver par la suite...  Je mettrais plutôt l'accent sur la formation des utilisateurs (formation continue...) quant à la rédaction efficace des métadonnées dans l'application...

Ceci dit, il est évident que si on souhaite malgré tout indexer les annexes, ce genre d'outil est plus que nécessaire, mais je ne les connais pas...

Bien à toi,

Gauthier Bastien, AC Sambreville

Re: Reconnaissance de caractères (OCR)

Posted by Gerd Xhonneux (CPAS Eupen) at August 15. 2009
Tu as certainement raison, Gauthier, mais si on voit l'affaire un peu à la longue, les données gèrées avec PloneMeeting vont être archivées électroniquement et peut-être représenter le SEUL archive (j'ai posé des questions à ce propos à Edouard Vercruysse et à la communauté germanophone). PloneMeeting ou plutôt Plone sera donc la GED (voir aussi les projets de la communauté française) qui sert de base. Il est à mon avis alors également primordial de pouvoir "OCRiser" et indexer les PDF annexés.

J'ai reçu une information de Gaëtan que je n'ai pas encore exploré profondément mais elle peut éventuellement éclairer les choses...

Re: Reconnaissance de caractères (OCR)

Posted by Gauthier Bastien (CommunesPlone) at August 24. 2009
En effet, une solution d'OCRisation des documents et par extension d'indexation des fichiers attachés va être ajoutée à PloneMeeting.

Pour plus d'infos : http://dev.communesplone.org/trac/ticket/832

Bien à toi,

Gauthier Bastien, AC Sambreville
Powered by Ploneboard
Document Actions