ImageBasic de Diamond Head Software

Comme il existe une production OEM de matériels, il existe une production OEM de logiciels. La société américaine Diamond Head Software a puisé dans cette production pour constituer une collection de modules logiciels propres à la GED qu'elle propose aux intégrateurs de solutions GED et aux SSII.

par Francis Pelletier © Copyright 1995 MOSARCA

Sous le nom d'ImageBasic, la société Diamond Head Software (Honolulu) a élaboré une offre très complète de modules logiciels pour la capture, le traitement d'images numérisées et l'intégration de ces images dans des environnements existants, intégration qui se fait en général par l'intermédiaire de solutions de workflow ou de &laqno;Groupware». Depuis quelques semaines, ImageBasic est revendu en France par la société Mediagraph (Boulogne). L'un des avantages d'ImageBasic est de permettre un développement rapide d'applications de gestion et de traitement électroniques de documents sous MS-Windows à l'aide d'outils de programmation abordables comme Visual Basic ou Gupta SQL Windows, etc. On peut ainsi ajouter des fonctionnalités GED à des applicatifs réalisés à partir de bases de données (Oracle, Sybase, SQL Server, compatibles ODBC, etc.) fonctionnant sous MS-Windows.
ImageBasic comprend les composants de base d'un système GED. Pour la gestion des scanners, il reprend les API ou bibliothèques de programmes ISIS de Pixel Translations, lesquelles supportent plus d'une centaine de numériseurs du marché. Outre les scanners munis d'un contrôleur/interface SCSI, ISIS peut gérer certains modèles dits &laqno;vidéo» au travers de cartes spécialisées comme les produits Kofax, Xionics ou Dunord. De même, ImageBasic dans sa version 2.1 contient des logiciels de gestion des numériseurs Kodak ImageLink (500, 900, 923 et 990) mais leur utilisation nécessite une licence spécifique. Elle comprend des modules logiciels de compression des images numérisées aux standards CCITT G3/G4 pour les images bitonales et JPEG pour les originaux en couleurs ou capturés avec plusieurs niveaux de gris. Sans oublier les logiciels de décompression et de gestion de l'affichage d'images numérisées sur des moniteurs SVGA 24 bits.

Des modules OCR et d'indexation de documents


Aujourd'hui, il ne saurait y avoir d'application GED complète sans reconnaissance optique. Dans ImageBasic, les développeurs trouveront plusieurs modules de reconnaissance optique de caractères, de lecture de codes-barres et de traitement de formulaires. Ils retiennent celui ou ceux utiles aux besoins des clients. Pour la lecture et la conversion de documents imprimés ou dactylographiés, Diamond Head Software a retenu les moteurs OCR de Calera et de Xerox (TextBridge), le second ayant la capacité de reconnaître plusieurs langues, notamment des langues dont l'alphabet comprend des caractères accentués, et d'effectuer des vérifications. Le troisième moteur OCR d'ImageBasic repose sur le produit de la société Nestor (USA) qui jouit de fonctionnalités de type ICR (Intelligent Character Recognition) et autorise la lecture de documents manuscrits.
Pour l'indexation automatique de documents lors d'une saisie par lots, ImageBasic dispose de deux modules logiciels provenant de VisionShape (USA). Le premier a pour fonction de localiser et d'interpréter des codes-barres pour que documents et lots de pages soient attribués à un dossier ou à une référence en liaison avec la base de données de l'applicatif. Le second module est plus particulièrement destiné à l'identification de documents par lecture et interprétation de marques (type case cochée).
Trois autres modules opèrent le prétraitement des documents ou le traitement de formulaires. Il s'agit de ScanFix et de FormFix de Sequoia Data et de WinForm de GDI. ScanFix est plus particulièrement destiné à améliorer la qualité de l'image des documents numérisés lorsque cette image doit passer à la reconnaissance optique de caractères pour que son contenu soit récupéré. Il permet d'éliminer automatiquement des tâches indésirables, un fond ou des lignes dans le cas de formulaires afin de faciliter et d'améliorer un traitement ultérieur par OCR. ScanFix redresse également les images légèrement inclinées lors de la numérisation, permet d'effectuer une rotation et d'éliminer des bords. FormFix bénéficie des mêmes fonctionnalités que ScanFix avec en plus la possibilité de définir des zones sur lesquelles doivent être appliqués des traitements particuliers. Dans le cas de formulaires, il permet de ne conserver que les zones d'informations utiles sur lesquelles va être appliquée la reconnaissance optique de caractères. De même, FormFix permet de ne conserver qu'une partie de l'image numérisée en définissant une zone spécifique comme, par exemple, une signature. Quant à WinForm de GDI, c'est un logiciel de création de formulaire pour l'indexation automatique de documents.
A la reconnaissance optique d'un fichier textuel succède de plus en plus souvent une indexation en texte intégral. ImageBasic est donc pourvu d'un module d'indexation et de recherche en texte intégral, le produit ZyIndex de ZyLab. Celui-ci permet, après la reconnaissance optique de caractères, d'effectuer automatiquement l'indexation des fichiers ASCII puis, en phase d'exploitation, de rechercher l'un d'eux en utilisant un mot, un groupe de mots ou même les opérateurs classiques. La version de base d'ImageBasic (V. 2.1), c'est-à-dire celle qui inclut la gestion des scanners, le traitement des images, leur visualisation et l'impression, est commercialisée à partir de 1750 dollars dans sa version dite &laqno;standard». Le toolkit professionnel pour développeur est proposé au prix approximatif de 5.200 dollars. Il inclut les modules de numérisation (sauf les drivers pour les scanners Kodak), d'indexation par codes-barres, de correction d'images numérisées ScanFix, les programmes OCR (Calera, Nestor, Xerox) ainsi que les logiciels de numérisation et de visualisation d'images couleur et d'annotation des documents. Plusieurs versions intermédiaires sont proposées selon les besoins de chaque application. Le module d'indexation et de recherche en texte intégral ZyIndex est proposé, en option, au prix approximatif de 4.000 dollars. L'intégration de ces différents modules logiciels donne lieu au versement de royalties par poste équipé. Leurs prix sont tout à fait raissonnables et dégressifs selon le nombre de runtime utilisés dans la même application. A titre d'exemple, les royalties pour la version standard d'ImageBasic varient entre 40 et 70 dollars pour la partie numérisation/ affichage/impression jusqu'à 25 licences. La licence d'un moteur OCR Calera est de l'ordre de 80 dollars par poste tandis que le module OCR/ICR de Nestor est facturé environ 450 dollars.

Des modules d'interfaçage direct à Lotus Notes et à ActionWorkflow


L'une des caractéristiques notables d'ImageBasic est de proposer des modules d'interfaçage à Lotus Notes au travers de Visual Basic. Ces modules permettent d'ajouter des fonctionnalités complexes à ce fédérateur d'informations et de les insérer au serveur Lotus Notes Processing ainsi qu'à LN:DI 2.5 (Lotus Notes Document Imaging). La version de base de ce module coûte approximativement 1.995 dollars pour les fonctions de numérisation, d'affichage et d'impression d'images avec Lotus Notes. Les fonctions pour l'Image Processing Serveur valent 395 dollars auxquels s'ajoutent 795 dollars pour les modules OCR et de traitement d'image.
En matière de workflow, Diamond Head a retenu le produit de la société américaine Action Technologies tournant sous Windows-NT et SQL Server. Ce workflow permet de gérer et de traiter des documents numérisés puis de les diffuser vers des utilisateurs connectés à un réseau local en fonction des tâches qui leur ont été assignées. Le module ImageBasic pour Action Workflow comprend quelques compléments logiciels par rapport à sa version de base. Il est commercialisé au prix de 13.890 dollars aux USA avec une licence d'Action Workflow et dix licences pour des postes clients. Inversement, les utilisateurs actuels de ce workflow peuvent acquérir les modules ImageBasic pour 4.490 dollars.

Des possibilités d'interfaçage avec des gestionnaires d'archivage


Pour l'instant, la société Diamond Head n'a pas intégré dans son offre de gestionnaires d'archivage d'informations ou de documents, qu'il s'agisse de programmes d'archivage proprement dits ou de logiciels de gestion hiérarchique de données. Par contre, après évaluation, elle a sélectionné quelques produits qui peuvent être conjointement utilisés avec des applications de gestion électronique de documents ou d'informations développées avec ImageBasic 2.1. Ce sont des gestionnaires sur disques optiques numériques WORM ou effaçables ainsi que sur CD-ROM/CD-WORM. Pour les environnements NetWare de Novell - et bientôt Windows-NT -, Diamond Head recommande le Virtual CD de Celerity Systems supportant les juke-boxes de CD-ROM de NSM et de Pioneer ainsi que la solution de LaserData pour les unités de DON ou des juke-boxes de DON. De même, le HSM d'Imagery Software (MOS N°133, page 15) peut également être utilisé pour la gestion de juke-boxes de DON sur NetWare. Pour la connexion avec un serveur fonctionnant sous Windows-NT, Diamond Head recommande plusieurs logiciels éprouvés qui sont l'Image Server (version 2.0) de Watermark et le Disk Extender d'Optical Technology Group. S'y ajoute, comme nous l'avons déjà mentionné, le &laqno;Mass Storage Server» de Lotus Notes supportant plusieurs types d'unités de DON ou de juke-boxes de disques optiques numériques. Dans un second temps, les dirigeants de Diamond Head prévoient d'élargir les possibilités d'ImageBasic en lui ajoutant des modules packagés. Sont ainsi prévus pour un avenir assez proche des modules de gestion de périphériques ou de sous-systèmes de stockage et des modules de gestion de télécopies sur réseau local.

ImageBasic : une solution packagée pour le développement de la GED


Diamond Head a élaboré cette offre ImageBasic dans l'intention de proposer aux intégrateurs, aux SSII et dans une certaine mesure aux utilisateurs, des outils logiciels permettant de développer rapidement une solution GED personnalisée. ImageBasic fait partie de cette nouvelle catégorie de produits que l'on peut regrouper sous le terme de &laqno;GED modulaire». Il constitue une &laqno;collection» de logiciels testés individuellement et collectivement dans leur rôle de modules facilement intégrables dans des applicatifs personnalisés. Selon les dirigeants de Diamond Head, un peu plus d'un millier de développeurs - principalement américains - ont déjà acquis une licence d'ImageBasic pour concevoir des applicatifs de gestion électronique de documents. Parmi ceux-ci, on trouve quelques grands noms connus internationalement comme Data General, Filenet (pour un projet Sprint), IBM (pour Visual Info), Keyfile ainsi que Viewstar et Optika.


Francis Pelletier © Copyright 1995 MOSARCA

Cet article a été publié dans le magazine MOS N°135 - Juin 1995

Lire un article sur Mediagraph, l'importateur d'Image Basic