Au Coeur de la Document Intelligence de GRAL : Comment Cognity Transforme les Données Non Structurées en Décisions

Les entreprises fonctionnent avec des documents. Les réclamations d'assurance arrivent sous forme de PDF scannés. Les contrats fournisseurs sous forme de fichiers Word avec suivi des modifications. Les dossiers réglementaires arrivent en XML dans des fichiers ZIP joints à des emails. Les dossiers médicaux mélangent notes manuscrites et formulaires imprimés. Les bons de commande varient d'un fournisseur à l'autre.

Les données piégées dans ces documents orientent les décisions d'entreprise — mais les extraire de manière fiable, à grande échelle, à travers différents formats et langues, est un problème que la plupart des entreprises n'ont pas résolu. Elles ont des équipes entières qui font de la saisie manuelle. Elles ont des systèmes OCR de 2014 qui fonctionnent sur exactement un type de document. Elles ont des bots RPA qui cassent à chaque changement de mise en page.

GRAL a construit Cognity pour résoudre le problème de la document intelligence de manière adéquate. Pas pour un seul type de document dans un format contrôlé, mais pour le chaos complet de la réalité documentaire enterprise.

Pourquoi le Traitement Documentaire Traditionnel Échoue

Le marché du traitement documentaire est rempli d'outils qui fonctionnent en démo et échouent en production. Les modes de défaillance sont constants :

Sensibilité à la mise en page. L'OCR traditionnel et l'extraction basée sur des templates supposent que les documents suivent une mise en page fixe. Déplacez un champ de deux centimètres vers la droite et l'extraction se casse. Passez d'une mise en page à deux colonnes à trois colonnes et le système produit des déchets. Les documents d'entreprise réels — surtout ceux provenant de parties externes — changent de mise en page sans préavis.

Fragilité de format. Un système entraîné sur des PDF numériques propres échoue sur les documents scannés. Un système qui gère les scans échoue sur les photographies de documents prises avec des téléphones. Un système construit pour l'anglais échoue sur les factures en allemand. Les flux documentaires enterprise incluent chaque format, chaque niveau de qualité, chaque langue.

Cécité contextuelle. L'extraction traditionnelle extrait du texte des champs. Elle ne comprend pas ce que signifie le document. Une facture qui indique "30 jours nets" à côté d'une date nécessite la compréhension des conditions de paiement pour extraire la date d'échéance. Une clause contractuelle qui fait référence à la "Section 4.2(b)" nécessite la compréhension de la structure du document. Un formulaire médical où "idem" apparaît dans le champ adresse nécessite la compréhension du contexte.

Fragilité de passage à l'échelle. Des systèmes qui fonctionnent à dix documents par heure s'effondrent à dix mille. Des systèmes construits pour un type de document nécessitent une configuration séparée pour chaque nouveau type. Ajouter le format de facture d'un nouveau fournisseur signifie des semaines de construction et de test de templates.

Comment Fonctionne Cognity

Cognity est la plateforme de document intelligence de GRAL. Elle traite les documents à travers un pipeline qui combine vision par ordinateur, compréhension du langage naturel et connaissance du domaine.

Ingestion des Documents

Cognity accepte des documents dans tout format que les entreprises utilisent réellement :

PDF numériques avec texte intégré — le cas facile.
PDF scannés et fichiers image nécessitant l'OCR — le cas courant.
Photographies de documents physiques, y compris distorsion de perspective, éclairage variable et occlusion partielle.
Corps d'emails et pièces jointes — y compris les cas où les informations pertinentes sont réparties entre le texte de l'email et un document joint.
Documents Office (Word, Excel, PowerPoint) avec objets intégrés, commentaires et suivi des modifications.
Formats de données structurés (XML, JSON, CSV) devant être corrélés avec des documents non structurés.

La couche d'ingestion normalise tous les inputs en une représentation commune qui préserve à la fois le contenu textuel et la disposition spatiale du document. Cette double représentation est critique — de nombreuses tâches d'extraction dépendent de la compréhension de l'emplacement de l'information sur la page, pas seulement de ce que dit le texte.

Compréhension Visuelle

La couche de compréhension visuelle de Cognity traite le document en tant qu'image, indépendamment de l'extraction du texte. Cette couche identifie :

Structure du document. En-têtes, paragraphes, tableaux, listes, signatures, tampons, logos et annotations manuscrites. Le modèle de structure comprend des mises en page de documents jamais vues auparavant car il a appris la grammaire visuelle des documents d'entreprise — pas des templates de formulaires spécifiques.

Tableaux. L'extraction de tableaux est notoirement difficile car les tableaux dans les documents réels ont des cellules fusionnées, des en-têtes étendus, des bordures de colonnes implicites et des sous-tableaux imbriqués. Le modèle de tableaux de Cognity gère ces cas car il a été entraîné sur des milliers de tableaux enterprise réels, pas des exemples synthétiques.

Écriture manuscrite. De nombreux documents enterprise incluent des éléments manuscrits — signatures, annotations, corrections, champs remplis à la main. La reconnaissance d'écriture de Cognity gère plusieurs scripts et fonctionne avec la réalité désordonnée de l'écriture réelle, pas des échantillons soigneusement écrits.

Extraction Sémantique

Le texte brut et la mise en page sont des entrées pour l'extraction, pas la sortie. La couche d'extraction sémantique de Cognity comprend ce que signifie le document :

Extraction d'entités avec contexte de domaine. Cognity extrait des entités — noms, dates, montants, adresses, numéros de référence — en utilisant des modèles qui comprennent le domaine du document. Un champ "date" sur une réclamation d'assurance a une sémantique différente d'un champ "date" sur un bon de commande. Le modèle d'extraction utilise le type de document et le contexte environnant pour désambiguïser.

Mapping des relations. Les documents contiennent des relations entre entités. Une ligne de facture relie une description de produit, une quantité, un prix unitaire et un total. Une clause contractuelle relie des parties, des obligations, des conditions et des dates. Cognity extrait ces relations, pas seulement des champs isolés.

Résolution des références croisées. Les documents enterprise font référence à d'autres documents, à des sections internes et à des standards externes. Cognity résout ces références, reliant "conformément à l'Accord du 15 mars" à l'accord effectif dans le document store et "tel que défini à la Section 2" à la section pertinente dans le même document.

Confiance et Validation

Chaque extraction dans Cognity porte un score de confiance. Mais les scores de confiance seuls ne sont pas exploitables — ce qui compte est de savoir quand faire confiance à l'extraction et quand la signaler pour révision humaine.

Confiance calibrée. Les scores de confiance de Cognity sont calibrés par rapport à la précision réelle. Quand le système rapporte 95% de confiance, l'extraction est correcte 95% du temps. Cette calibration est maintenue grâce à un suivi continu et une recalibration sur les données de production.

Validation par règles métier. Les données extraites passent par des règles métier configurables. Un total de facture qui ne correspond pas à la somme des lignes est signalé indépendamment de la confiance d'extraction. Une date contractuelle dans le passé quand le système attend une date future est signalée.

Routage human-in-the-loop. Quand la confiance d'extraction descend sous un seuil configurable, ou quand les règles métier signalent une incohérence, le document est routé vers un réviseur humain. Les corrections du réviseur alimentent l'amélioration du modèle.

Intégration avec les Systèmes Enterprise

Cognity n'existe pas de manière isolée. Les données extraites alimentent les systèmes enterprise où elles orientent les décisions :

Systèmes ERP qui reçoivent les données de factures validées, les confirmations de bons de commande et les informations fournisseurs.
Systèmes de réclamations qui reçoivent les détails extraits des réclamations, l'analyse de la documentation justificative et les contrôles de conformité.
Gestion des contrats qui reçoit l'extraction de clauses, le suivi des obligations et la surveillance des dates de renouvellement.
Systèmes réglementaires qui reçoivent l'analyse des documents de conformité, la validation des dossiers et la documentation d'audit.

Ces intégrations utilisent la couche standard de connecteurs GRAL, la même infrastructure que Sentara et les autres plateformes GRAL utilisent.

Performance en Production

Les métriques de production de Cognity à travers les déploiements gérés par GRAL :

Débit de traitement. 2 400 pages par heure par noeud de traitement. La mise à l'échelle horizontale est linéaire — dix noeuds traitent 24 000 pages par heure.
Précision d'extraction. 97,3% de précision au niveau du champ sur tous les types de documents. Les déploiements spécifiques à un domaine avec des modèles fine-tunés atteignent 99,1% sur les types de documents cibles.
Précision d'extraction de tableaux. 94,8% de précision au niveau de la cellule sur des tableaux complexes avec cellules fusionnées et en-têtes étendus.
Reconnaissance d'écriture manuscrite. 91,2% de précision par caractère sur des annotations manuscrites réelles.
Latence de bout en bout. P50 : 2,3 secondes par page. P99 : 8,1 secondes par page. Mesurée de l'ingestion à la sortie d'extraction validée.

Ces métriques sont des moyennes de production à travers plusieurs clients, types de documents et niveaux de qualité.

Ce Qui Rend l'Approche GRAL Différente

GRAL n'a pas inventé le document AI. La différence est la discipline d'ingénierie appliquée aux exigences de production :

Zéro template. Cognity ne nécessite pas de templates pour de nouveaux types de documents. Les modèles de compréhension visuelle et d'extraction sémantique généralisent à des documents jamais vus. Ajouter le format de facture d'un nouveau fournisseur ne nécessite pas des semaines de configuration — cela nécessite de charger quelques exemples pour la validation.

Multilingue par défaut. Cognity traite des documents dans toute langue que les clients GRAL rencontrent. Les entreprises européennes gèrent des documents dans des dizaines de langues. Un système qui ne gère que l'anglais n'est pas enterprise-ready.

Traitement on-premise. Comme toutes les plateformes GRAL, Cognity tourne sur l'infrastructure du client. Les documents contenant des données personnelles sensibles, des informations financières ou des secrets commerciaux ne quittent jamais le réseau du client.

Apprentissage continu. Chaque correction humaine dans la boucle de révision améliore les modèles d'extraction. Cognity devient plus précis avec le temps, pas moins. L'apprentissage est fédéré entre les déploiements — les améliorations issues des corrections d'un client bénéficient à tous les clients, sans partager les documents réels.

GRAL a construit Cognity parce que la document intelligence enterprise exige la même rigueur d'ingénierie que tout autre système de production. Pas une démo qui fonctionne sur des PDF propres, mais une plateforme qui gère la pleine réalité des documents enterprise — chaque format, chaque langue, chaque niveau de qualité, chaque cas limite — de manière fiable, à grande échelle, en production.

Au Coeur de la Document Intelligence de GRAL : Comment Cognity Transforme les Données Non Structurées en Décisions — GRAL Blog