Reconnaissance de caractères (OCR)
Bonjour,
avec PloneMeeting on a la possibilité d'attacher des fichiers (à des demandes, des décisions, etc.).
En pratique ça va être soit des documents créés d'une façon électronique soit des documents papier scannés. Les derniers seront donc des images et "perdent" leur contenu dès qu'ils se trouvent dans Plone. Ce qui est dommâge surtout si on souhaite que la db de Plone soit aussi un archive électronique!
Il faudrait donc une solution et je pense que j'en ai trouvé une (ou au moins un début):
http://plone.org/documentation/how-to/ocr-in-plone-using-tesseract-ocr respectivement http://plone.org/products/pdftoocr/
Comment voyez-vous la possibilité d'inclure cela dans une installation par défaut de PloneMeeting?
Merci d'avance pour vos réflexions!
avec PloneMeeting on a la possibilité d'attacher des fichiers (à des demandes, des décisions, etc.).
En pratique ça va être soit des documents créés d'une façon électronique soit des documents papier scannés. Les derniers seront donc des images et "perdent" leur contenu dès qu'ils se trouvent dans Plone. Ce qui est dommâge surtout si on souhaite que la db de Plone soit aussi un archive électronique!
Il faudrait donc une solution et je pense que j'en ai trouvé une (ou au moins un début):
http://plone.org/documentation/how-to/ocr-in-plone-using-tesseract-ocr respectivement http://plone.org/products/pdftoocr/
Comment voyez-vous la possibilité d'inclure cela dans une installation par défaut de PloneMeeting?
Merci d'avance pour vos réflexions!
Re: Reconnaissance de caractères (OCR)
Je ne connais pas ces produits, mais personnellement, je préfère ne pas indexer les annexes. En effet, l'utilisation de la recherche "à la Google" cad avec une seule zone de recherche étant bien souvent la règle, les données issues des annexes peuvent à mon avis après qq mois d'utilisation provoquer plus de "bruit" qu'apporter un quelconque avantage. Je pense que la bonne définition des métadonnées dans les titre et description des différents éléments (et plus particulièrement des annexes) serait la meilleure solution quant à les retrouver par la suite... Je mettrais plutôt l'accent sur la formation des utilisateurs (formation continue...) quant à la rédaction efficace des métadonnées dans l'application...
Ceci dit, il est évident que si on souhaite malgré tout indexer les annexes, ce genre d'outil est plus que nécessaire, mais je ne les connais pas...
Bien à toi,
Gauthier Bastien, AC Sambreville
Ceci dit, il est évident que si on souhaite malgré tout indexer les annexes, ce genre d'outil est plus que nécessaire, mais je ne les connais pas...
Bien à toi,
Gauthier Bastien, AC Sambreville
Tu as certainement raison, Gauthier, mais si on voit l'affaire un peu à la longue, les données gèrées avec PloneMeeting vont être archivées électroniquement et peut-être représenter le SEUL archive (j'ai posé des questions à ce propos à Edouard Vercruysse et à la communauté germanophone). PloneMeeting ou plutôt Plone sera donc la GED (voir aussi les projets de la communauté française) qui sert de base. Il est à mon avis alors également primordial de pouvoir "OCRiser" et indexer les PDF annexés.
J'ai reçu une information de Gaëtan que je n'ai pas encore exploré profondément mais elle peut éventuellement éclairer les choses...
J'ai reçu une information de Gaëtan que je n'ai pas encore exploré profondément mais elle peut éventuellement éclairer les choses...
Re: Reconnaissance de caractères (OCR)
En effet, une solution d'OCRisation des documents et par extension d'indexation des fichiers attachés va être ajoutée à PloneMeeting.
Pour plus d'infos : http://dev.communesplone.org/trac/ticket/832
Bien à toi,
Gauthier Bastien, AC Sambreville
Pour plus d'infos : http://dev.communesplone.org/trac/ticket/832
Bien à toi,
Gauthier Bastien, AC Sambreville
Rendu par Ploneboard

