par Francis Pelletier © Copyright 1995 MOSARCA
Sous le nom d'ImageBasic, la société Diamond
Head Software (Honolulu) a élaboré une offre très
complète de modules logiciels pour la capture, le traitement d'images
numérisées et l'intégration de ces images dans des
environnements existants, intégration qui se fait en général
par l'intermédiaire de solutions de workflow ou de &laqno;Groupware».
Depuis quelques semaines, ImageBasic est revendu en France par la société
Mediagraph (Boulogne). L'un des avantages
d'ImageBasic est de permettre un développement rapide d'applications
de gestion et de traitement électroniques de documents sous MS-Windows
à l'aide d'outils de programmation abordables comme Visual Basic
ou Gupta SQL Windows, etc. On peut ainsi ajouter des fonctionnalités
GED à des applicatifs réalisés à partir de bases
de données (Oracle, Sybase, SQL Server, compatibles ODBC, etc.) fonctionnant
sous MS-Windows.
ImageBasic comprend les composants de base d'un système GED. Pour
la gestion des scanners, il reprend les API ou bibliothèques de programmes
ISIS de Pixel Translations, lesquelles supportent plus d'une centaine de
numériseurs du marché. Outre les scanners munis d'un contrôleur/interface
SCSI, ISIS peut gérer certains modèles dits &laqno;vidéo»
au travers de cartes spécialisées comme les produits Kofax,
Xionics ou Dunord. De même, ImageBasic dans sa version 2.1 contient
des logiciels de gestion des numériseurs Kodak ImageLink (500, 900,
923 et 990) mais leur utilisation nécessite une licence spécifique.
Elle comprend des modules logiciels de compression des images numérisées
aux standards CCITT G3/G4 pour les images bitonales et JPEG pour les originaux
en couleurs ou capturés avec plusieurs niveaux de gris. Sans oublier
les logiciels de décompression et de gestion de l'affichage d'images
numérisées sur des moniteurs SVGA 24 bits.
Aujourd'hui, il ne saurait y avoir d'application GED complète sans
reconnaissance optique. Dans ImageBasic, les développeurs trouveront
plusieurs modules de reconnaissance optique de caractères, de lecture
de codes-barres et de traitement de formulaires. Ils retiennent celui ou
ceux utiles aux besoins des clients. Pour la lecture et la conversion de
documents imprimés ou dactylographiés, Diamond Head Software
a retenu les moteurs OCR de Calera et de Xerox (TextBridge), le second ayant
la capacité de reconnaître plusieurs langues, notamment des
langues dont l'alphabet comprend des caractères accentués,
et d'effectuer des vérifications. Le troisième moteur OCR
d'ImageBasic repose sur le produit de la société Nestor (USA)
qui jouit de fonctionnalités de type ICR (Intelligent Character Recognition)
et autorise la lecture de documents manuscrits.
Pour l'indexation automatique de documents lors d'une saisie par lots, ImageBasic
dispose de deux modules logiciels provenant de VisionShape (USA). Le premier
a pour fonction de localiser et d'interpréter des codes-barres pour
que documents et lots de pages soient attribués à un dossier
ou à une référence en liaison avec la base de données
de l'applicatif. Le second module est plus particulièrement destiné
à l'identification de documents par lecture et interprétation
de marques (type case cochée).
Trois autres modules opèrent le prétraitement des documents
ou le traitement de formulaires. Il s'agit de ScanFix et de FormFix de Sequoia
Data et de WinForm de GDI. ScanFix est plus particulièrement destiné
à améliorer la qualité de l'image des documents numérisés
lorsque cette image doit passer à la reconnaissance optique de caractères
pour que son contenu soit récupéré. Il permet d'éliminer
automatiquement des tâches indésirables, un fond ou des lignes
dans le cas de formulaires afin de faciliter et d'améliorer un traitement
ultérieur par OCR. ScanFix redresse également les images légèrement
inclinées lors de la numérisation, permet d'effectuer une
rotation et d'éliminer des bords. FormFix bénéficie
des mêmes fonctionnalités que ScanFix avec en plus la possibilité
de définir des zones sur lesquelles doivent être appliqués
des traitements particuliers. Dans le cas de formulaires, il permet de ne
conserver que les zones d'informations utiles sur lesquelles va être
appliquée la reconnaissance optique de caractères. De même,
FormFix permet de ne conserver qu'une partie de l'image numérisée
en définissant une zone spécifique comme, par exemple, une
signature. Quant à WinForm de GDI, c'est un logiciel de création
de formulaire pour l'indexation automatique de documents.
A la reconnaissance optique d'un fichier textuel succède de plus
en plus souvent une indexation en texte intégral. ImageBasic est
donc pourvu d'un module d'indexation et de recherche en texte intégral,
le produit ZyIndex de ZyLab. Celui-ci permet, après la reconnaissance
optique de caractères, d'effectuer automatiquement l'indexation des
fichiers ASCII puis, en phase d'exploitation, de rechercher l'un d'eux en
utilisant un mot, un groupe de mots ou même les opérateurs
classiques. La version de base d'ImageBasic (V. 2.1), c'est-à-dire
celle qui inclut la gestion des scanners, le traitement des images, leur
visualisation et l'impression, est commercialisée à partir
de 1750 dollars dans sa version dite &laqno;standard». Le toolkit
professionnel pour développeur est proposé au prix approximatif
de 5.200 dollars. Il inclut les modules de numérisation (sauf les
drivers pour les scanners Kodak), d'indexation par codes-barres, de correction
d'images numérisées ScanFix, les programmes OCR (Calera, Nestor,
Xerox) ainsi que les logiciels de numérisation et de visualisation
d'images couleur et d'annotation des documents. Plusieurs versions intermédiaires
sont proposées selon les besoins de chaque application. Le module
d'indexation et de recherche en texte intégral ZyIndex est proposé,
en option, au prix approximatif de 4.000 dollars. L'intégration de
ces différents modules logiciels donne lieu au versement de royalties
par poste équipé. Leurs prix sont tout à fait raissonnables
et dégressifs selon le nombre de runtime utilisés dans la
même application. A titre d'exemple, les royalties pour la version
standard d'ImageBasic varient entre 40 et 70 dollars pour la partie numérisation/
affichage/impression jusqu'à 25 licences. La licence d'un moteur
OCR Calera est de l'ordre de 80 dollars par poste tandis que le module OCR/ICR
de Nestor est facturé environ 450 dollars.
L'une des caractéristiques notables d'ImageBasic est de proposer
des modules d'interfaçage à Lotus Notes au travers de Visual
Basic. Ces modules permettent d'ajouter des fonctionnalités complexes
à ce fédérateur d'informations et de les insérer
au serveur Lotus Notes Processing ainsi qu'à LN:DI 2.5 (Lotus Notes
Document Imaging). La version de base de ce module coûte approximativement
1.995 dollars pour les fonctions de numérisation, d'affichage et
d'impression d'images avec Lotus Notes. Les fonctions pour l'Image Processing
Serveur valent 395 dollars auxquels s'ajoutent 795 dollars pour les modules
OCR et de traitement d'image.
En matière de workflow, Diamond Head a retenu le produit de la société
américaine Action Technologies tournant sous Windows-NT et SQL Server.
Ce workflow permet de gérer et de traiter des documents numérisés
puis de les diffuser vers des utilisateurs connectés à un
réseau local en fonction des tâches qui leur ont été
assignées. Le module ImageBasic pour Action Workflow comprend quelques
compléments logiciels par rapport à sa version de base. Il
est commercialisé au prix de 13.890 dollars aux USA avec une licence
d'Action Workflow et dix licences pour des postes clients. Inversement,
les utilisateurs actuels de ce workflow peuvent acquérir les modules
ImageBasic pour 4.490 dollars.
Pour l'instant, la société Diamond Head n'a pas intégré
dans son offre de gestionnaires d'archivage d'informations ou de documents,
qu'il s'agisse de programmes d'archivage proprement dits ou de logiciels
de gestion hiérarchique de données. Par contre, après
évaluation, elle a sélectionné quelques produits qui
peuvent être conjointement utilisés avec des applications de
gestion électronique de documents ou d'informations développées
avec ImageBasic 2.1. Ce sont des gestionnaires sur disques optiques numériques
WORM ou effaçables ainsi que sur CD-ROM/CD-WORM. Pour les environnements
NetWare de Novell - et bientôt Windows-NT -, Diamond Head recommande
le Virtual CD de Celerity Systems supportant les juke-boxes de CD-ROM de
NSM et de Pioneer ainsi que la solution de LaserData pour les unités
de DON ou des juke-boxes de DON. De même, le HSM d'Imagery Software
(MOS N°133, page 15) peut également être utilisé
pour la gestion de juke-boxes de DON sur NetWare. Pour la connexion avec
un serveur fonctionnant sous Windows-NT, Diamond Head recommande plusieurs
logiciels éprouvés qui sont l'Image Server (version 2.0) de
Watermark et le Disk Extender d'Optical Technology Group. S'y ajoute, comme
nous l'avons déjà mentionné, le &laqno;Mass Storage
Server» de Lotus Notes supportant plusieurs types d'unités
de DON ou de juke-boxes de disques optiques numériques. Dans un second
temps, les dirigeants de Diamond Head prévoient d'élargir
les possibilités d'ImageBasic en lui ajoutant des modules packagés.
Sont ainsi prévus pour un avenir assez proche des modules de gestion
de périphériques ou de sous-systèmes de stockage et
des modules de gestion de télécopies sur réseau local.
Diamond Head a élaboré cette offre ImageBasic dans l'intention
de proposer aux intégrateurs, aux SSII et dans une certaine mesure
aux utilisateurs, des outils logiciels permettant de développer rapidement
une solution GED personnalisée. ImageBasic fait partie de cette nouvelle
catégorie de produits que l'on peut regrouper sous le terme de &laqno;GED
modulaire». Il constitue une &laqno;collection» de logiciels
testés individuellement et collectivement dans leur rôle de
modules facilement intégrables dans des applicatifs personnalisés.
Selon les dirigeants de Diamond Head, un peu plus d'un millier de développeurs
- principalement américains - ont déjà acquis une licence
d'ImageBasic pour concevoir des applicatifs de gestion électronique
de documents. Parmi ceux-ci, on trouve quelques grands noms connus internationalement
comme Data General, Filenet (pour un projet Sprint), IBM (pour Visual Info),
Keyfile ainsi que Viewstar et Optika.
Francis Pelletier © Copyright 1995 MOSARCA
Cet article a été publié dans le magazine MOS N°135
- Juin 1995