Startup Parashift lanciert KI-basierte Daten-Extraktion aus Dokumenten

Kürzlich hat das in Sissach BL ansässige Startup Parashift ein Cloud-basiertes sogenanntes Document Center vorgestellt. Der Hersteller proprietärer KI-Technologie verspricht damit zu Tiefstpreisen Dokumenten auslesen und zur Weiterverarbeitung etwa im ERP-System elektronisch zur Verfügung stellen zu können. Derzeit verarbeite das Tool erst deutschsprachige Rechnungen, Gutschtriften und Quittungen, erklärt Thilo Rossa, Solution Specialist bei Parashift auf Anfrage. Weitere Sprachen und Dokumententypen wie etwa auch Lieferscheine oder HR-Dokus sollen folgen.
 
Die Software erkenne bisher rund 50 verschiedene Dokumententypen, wobei zur Zeit bis 20'000 Dokumente im Monat mit ersten Kunden verarbeitetet werden. Die KI-basierte Lösung sei aufgrund der Learnings in den letzten sechs Monaten nun einsatzbereit, heisst es in einem Blog-Beitrag des CEO und Gründers Alain Veuve dazu.
 
So können das Parashift Document Center (PDC) nun in drei Versionen genutzt werden. In der Basis-Extraktion werden nur die von den Kunden eingescannte Dokumente ausgelesen und elektronisch so zur Verfügung gestellt, dass sie beispielsweise ins ERP übernommen werden können. Eine Qualitätsprüfung findet nicht statt, da die innerhalb von 10 bis 40 Sekunden über die Parashift-API ausgelieferten Datenbestände dem Kunden trotz möglicher Unvollständigkeit ausreichen für die weitere Nutzung. Diese Option sei ideal für Softwareanbieter welche beispielsweise Rechnungsinformationen wie IBAN, Datum oder Totalbetrag in ihrer Applikation weiterverwenden wollen, schreibt Veuve.
 
In der zweiten Variante, Self-Validation genannt, werden die eingescannten Daten nach der Extraktion in einem Zwischenschritt vom Kunden zunächst selbst korrigiert, bevor sie dann zu digitalen Weiterverarbeitung ausgeliefert werden. In der dritten Version wird diese manuelle Qualitätskontrolle von Parashift ausgeführt.
 
Wie hoch die via KI bisher erreichte Datenqualität ist, wird nicht ausdrücklich genannt. Parashift selber gibt nur die vom PDC angestrebte Qualität der verfügbar gemachten Daten an. Sie soll bei der Datenextraktion in der Basis-Extraktion eine Genauigkeit von 99,4 Prozent für Rechnungen erreichen und 100-Prozent bei der Verarbeitung aller Buchhaltungsbelege, wenn die Daten mit der Buchhaltung des Nutzers synchronisiert sind.
 
"Während die erreichte Genauigkeit bereits sehr hoch ist, erstaunt selbst unser eigenes Team die Rate der Verbesserung. Wir hätten erwartet, dass nach 24 Monaten die wöchentliche Verbesserung allmählich abflacht. Das Gegenteil ist der Fall; die Verbesserungsrate nimmt über Zeit sogar zu", schreibt Veuve. Man sei "zuversichtlich, unserem Ziel – sämtliche Dokumente des geschäftlichen Verkehrs in derselben Qualität wie ein Mensch in weniger als 10 Sekunden zu Kosten von weniger als einen Rappen extrahieren zu können – in grossen Schritten näher zu kommen".
 
Ein weiteres Problem besteht noch bei den Schnittstellen zu den Buchhaltungen der Kunden. Bisher müssen die noch von den PDC-Nutzern selbst gebaut werden. Laut Rossa werde Parashift aber schon bald Schnittstellen zu Standardanwendungen wie etwa Sage 200, Abacus oder Navision verfügbar machen. Derzeit kann man das PDC aus der Cloud inklusive Support nutzen. (vri)