Le blog Acolad

Captiva as a Service (CaaS) : captures intelligentes de données dans le cloud

Rédigé par Acolad team | 7 mars 2019 08:00:00

Pour bon nombre d'entreprises, réussir la transformation numérique en réduisant les coûts est une gageure. La priorité est sans conteste d'optimiser la valeur des informations, quelle qu'en soient les sources, les formats et les volumes (qui vont croissants). En cela, le rôle des outils pour collecter, gérer et échanger l'information devient majeur. Et comme les budgets accordés à l'informatique dépendent le plus souvent de la taille de la société, les petites et moyennes entreprises disposent de peu de moyens pour investir dans les nouvelles technologies. Pourtant, n'importe quelle entreprise, quelle que soit sa taille, peut désormais avoir accès à des données commerciales critiques, rapidement et facilement, tout en augmentant sa productivité.

Les outils de capture des données d'entreprise comme Captiva ont enfin un prix abordable pour toutes les entreprises, petites ou grandes. Captiva as a Service (CaaS) est une plateforme rentable pour la capture intelligente de données, qui permet à votre partenaire technique d'exploiter et de paramétrer Captiva dans le cloud. Avec cette capture dans le cloud, vous simplifierez la gestion des outils informatiques et vous économiserez en temps et en argent. Dans le même temps vous augmenterez l'efficacité des opérations de toutes vos équipes ou services, en leur épargnant les opérations manuelles de classement, saisie des données, ou archivage de documents.

Comment CaaS est devenu un véritable service, grâce à des applications et solutions variées ?

Hébergement dans le cloud : l'environnement Azure

Nous nous sommes appuyés sur Azure pour déployer un environnement accessible aux clients, mais qui respecte les paramètres de sécurité Azure. Cette solution dans le cloud, proposée par Microsoft, nous permet de dimensionner la bande passante en fonction des besoins. Lorsque davantage de clients souhaitent se connecter à CaaS ou lorsque les clients augmentent le volume de transfert, le système Azure permet de déployer facilement de nouvelles machines pour ne pas ralentir les opérations.

Si vous souhaitez vraiment optimiser la valeur de vos investissements dans le cloud, vous pouvez choisir de combiner une infrastructure cloud robuste (sur Azure par exemple) avec le fournisseur de gestion de services d'hébergement qui vous convient. Vous pourrez ainsi mettre un coup d’accélérateur à vos projets et optimiser vos ressources, tout en vous déchargeant de toutes les tâches liées à la gestion de l'infrastructure matérielle, au suivi, à la mise à l'échelle (et autres préoccupations) sur votre partenaire.

Agile, la méthode de développement pour la prestation de services continus

Des applications de type Jenkins et Azure DevOps s'attaquent également à un autre problème informatique classique : la dérive (drift) du système, résultat de trop d'opérations manuelles (sources d'erreurs) exécutées dans des environnements différents par des personnes différentes. Grâce à ces applications, nous pouvons mettre en place une prestation de services en continu qui réduit les risques associés aux erreurs manuelles et garantit la stabilité du système à l'utilisation. Ces solutions permettent également des déploiements de mises à jour plus faciles et plus fréquents. Cela nous permet de procéder à des « échecs accélérés » (fail fast), terme Agile, souvent mal interprété. Il signifie que les dysfonctionnements sont remontés plus vite, ce qui permet un développement plus rapide, qui répond mieux aux besoins spécifiques du client.

Services de capture web

Pour activer CaaS, nous utilisons Captiva 7.7, qui intègre les composants Web Capture Web Client (CWC) et un service REST auquel on se connecte à l'aide de l'API hébergé dans le serveur Microsoft Internet Information Services (IIS).

Le CWC se connecte aux flux de données créés dans Captiva Designer et déployés sur le serveur, ce qui entraîne que si l'on utilisait déjà Captiva en interne, on peut continuer d'utiliser les flux existants dans le cloud, en procédant à des ajustements mineurs. Le CWC est un composant puissant qui permet la reconnaissance et l'indexation immédiates des données en fonction du type de document trouvé. Ainsi, on peut combiner l'étape de saisie (par exemple par numérisation du document) avec l'étape d'indexation (par exemple par reconnaissance et classification automatisées du document) pour obtenir un flux simplifié pour les documents entrants. Concrètement, pour un de nos développements CaaS, il a fallu mettre en place un parcours de reconnaissance des factures. Ce flux de capture des données reconnaît le format du document (une facture) ainsi que les valeurs y figurent, et renvoie ces valeurs au format JSON (JavaScript Object Notation). Le fichier JSON intègre ensuite les résultats dans un système de traitement et peut ainsi déclencher un nouveau paiement.

Capture, une solution souple

Le service REST, créé par OpenText, permet de se connecter directement, depuis n'importe application d'entreprise, au serveur InputAccel, qui contient tous les modules Captiva pour la numérisation, la capture de données (et de documents) et la reconnaissance intelligente des documents. Les utilisateurs peuvent envoyer leurs documents vers des modules comme FullPageOCR, Classify et ClassifyAndExtract, en fonction de leurs besoins. La reconnaissance ou lecture optique des caractères convertit les images des documents dactylographiés, manuscrits ou imprimés en texte encodé, tandis que les outils Classify et ClassifyAndExtract identifient le type de document grâce à son contenu. Selon le type de document, le contenu peut ensuite être ajouté à un workflow ou intégrer un autre système pour un suivi ultérieur.

Protection de l'environnement

Pour maintenir une plateforme, sans dérive (drift) et éviter tous les problèmes autre que ceux dus à des opérations manuelles, nous utilisons PowerShell allié à Azure DevOps pour automatiser l'ensemble des mises à jour et configurations. Ainsi, nous garantissons la stabilité de l'ensemble du système, du développement, aux tests, à la validation et à la mise en place des environnements de production. Se passer des opérations manuelles permet également d'éviter les risques d'anomalies.

Le code source des flux Capture est conservé dans la solution de versioning GIT qui sécurise les flux par un système de contrôle de versions. Ainsi, on s'assure qu'une version précédente peut être facilement récupérée et redéployée lorsqu'une mise à jour ou une modification de la plateforme génère des dysfonctionnements.

Déploiement automatique

Pour s'assurer que tous les fichiers sont présents, prêts à être déployés, nous automatisons leur préparation au cours d'une étape définie dans DevOps. Pour la publication, nous utilisons les fonctionnalités offertes par Captiva pour déployer le process et les fichiers qui y sont rattachés. Ces fonctionnalités traitent le codage et la reconnaissance spécifiée dans la définition du projet pour les environnements de développement, de test, de validation ou de production du projet.

Il suffit donc que les développeurs Captiva se connectent à l'environnement de développement de leur application et passent par DevOps pour passer du développement au test, à l'approbation et enfin à la production. Puisque tous ces changements de statut sont traités par DevOps, l'opération peut se répéter et être exécutée à l'infini. Cette automatisation simplifie grandement la procédure de publication. Vous n'aurez plus besoin de rédiger des manuels d'explications, plus de risque d'oublier une étape ou de mal l'exécuter, parce que le manuel d'explication est mal compris. Vous passez d'une étape à l'autre en appuyant sur un bouton.

Pour résumer

La capture dans le cloud avec l'outil Captiva, ou CaaS (Captiva as a Service) est une solution de capture de données simple d'utilisation, qui s'adapte facilement à la croissance des besoins de votre entreprise. Puisqu'elle est hébergée dans le cloud, elle reste disponible en permanence, ce qui vous permet de changer de fournisseur de cloud si besoin. Où que se trouvent vos collaborateurs dans le monde, ils peuvent tous se connecter à cette solution centralisée, soit par le composant Capture web client (CWC), soit par l'API REST pour une reconnaissance de caractères par OCRing ou pour classer un document.

Comme l'accès est simplifié, quelle que soit leur localisation géographique, les équipes distantes peuvent se connecter à cette solution de capture centrale. CaaS n'est pas figé. Les évolutions du système sont simples, chaque fois qu'un nouveau type de document doit être traité ou qu'un service de l'entreprise souhaite capturer de nouvelles données. Cette évolutivité signifie également que votre investissement de départ pour héberger votre solution de numérisation peut être réduit : le système s'adapte à votre évolution. Les machines du cloud sont facilement répliquées et déployées, ce qui veut dire que même si un problème survient sur vos serveurs, votre solution cloud peut être rétablie en quelques heures, au lieu de quelques jours.

Sur le plan du développement, grâce à Azure DevOps, nous garantissons une solution facile à utiliser et à déployer, qui permet aux développeurs de passer rapidement d'un environnement à l'autre sans que le système ne dérive à cause d'actions manuelles. Il n'y a plus non plus besoin de rédiger un nouveau manuel à chaque instance.

Vous vous demandez quel système est le plus adapté à votre gestion des documents : le cloud ou des serveurs dans vos locaux ? Envoyez-nous vos questions ou commentaires ci-dessous, pour que nous vous permettions de trouver la solution pour faciliter les tâches de vos collaborateurs et simplifier vos contenus d'entreprise.