T-Systems-Claim-Logo
Suchen
digitale hellblaue Pfeile vor einem dunklen Hintergrund

Digitalisierung von Dokumenten und Bildern in AWS

Erfahren Sie, wie Sie mit Amazon Textract vorhandene Dokumente digitalisieren können, um datengesteuerte Entscheidungen zum Vorteil Ihres Unternehmens zu treffen

18. Oktober 2021Esteban Uscanga-Olea

Der erste Schritt zur Datensteuerung

Es gibt viele verschiedene digitale Lösungen, Texte und Informationen zu managen, zum Beispiel Tesseract OCR. Die Herausforderung dabei ist aber: den bereitgestellten Service zu verwalten, um sicherzustellen, dass jede Lösung ohne großen Zeit- und Arbeitsaufwand horizontal skaliert und gleichzeitig die vorhandene Architektur angepasst wird. Lesen Sie weiter, um zu erfahren, wie das Digitalisierungs-Tool Amazon Textract bei der Lösung dieser Herausforderungen hilft und sie AWS zu ihrem Vorteil nutzen.

Textanalyse mit Amazon Textract

Digitale Dokumentensymbole in Hellblau auf dunkelblauem Hintergrund

Amazon Textract ist ein Service auf der Basis maschinellen Lernens. Über OCR (optical character recognition) erkennt und extrahiert AWS Textract automatisch gedruckten Text, Handschrift und strukturierte Daten (z.B. relevante Felder und deren Werte) aus Tabellen, Bildern und anderen digitalen Formen sowie aus Scan-Uploads gedruckter Dokumente und PDFs. Textract kann durch einen strukturierten Satz von Technologieregeln und -befehlen zur erfolgreichen Automatisierung des Digitalisierungsprozesses beitragen. Die Machine-Learning-Modelle von Amazon Textract wurden an Millionen von Unterlagen und Papieren trainiert, sodass praktisch jeder von Ihnen hochgeladene oder gescannte Dokument-Typ automatisch erkannt und für die Textextraktion verarbeitet werden kann. Wenn Informationen aus Dokumenten-Uploads extrahiert werden, gibt der Cloud-Service für jedes identifizierte Element einen Konfidenzwert an, damit Sie fundierte Entscheidungen darüber treffen können, wie Sie die Ergebnisse verwenden möchten. Lesen Sie hier mehr.

AWS Textract in Aktion

Wir haben kürzlich Textract von Amazon Web Services verwendet, um Unternehmen zu zeigen, wie effektiv Dokumente mit AWS digitalisiert werden können. Unsere Aufgabe war es, Daten aus PDF-Dateien zu extrahieren, die an eingehende E-Mails angehängt waren. Diese Aufgabe manuell durchzuführen, dauerte fünf bis zehn Minuten pro PDF-Dokument. Denn der Bediener musste die extrahierten Daten physisch überprüfen. Schnell stiegt die große Menge an Dokumenten, die extrahiert werden mussten, jeden Monat weiter an. Irgendwann erhielten wir jeden Monat Hunderte, sodass klar wurde: Wir mussten den Prozess automatisieren. 

Als wir anfingen, AWS Textract zur Prozessautomatisierung zu verwenden, bauten wir eine serverlose Pipeline auf, um die E-Mails automatisch zu verarbeiten, Daten aus den Anhängen zu extrahieren, zu verfeinern und in DynamoDB zu speichern.

Sobald die relevanten Daten digitalisiert waren, konnten wir die volle Leistungsfähigkeit der AWS Services nutzen.

Diagramm zeigt Textract Prozess

Wie das Diagramm zeigt, ist AWS Textract ein effektiver Service für die Digitalisierung historischer Papiere. In diesem Fall übernimmt AWS Textract die Inhalte, verarbeitet sie automatisch mithilfe von maschinellem Lernen und verwaltet die Digitalisierung Ihrer Texte und anderer Unterlagen. Weitere digitale Amazon-Dienste wie AWS Lambda und Dynamo DB stellen sicher, dass wir die von uns gesammelten Daten effektiv speichern und elektronisch archivieren können.

Dieser automatische Prozess macht manuelle Kontrollen überflüssig und ermöglicht es uns, jeden Monat etwa zehn bis zwölf Arbeitstage einzusparen. Darüber hinaus kann die Lösung durch Verwendung einer ereignisgesteuerten und serverlosen Architektur bedarfsgerecht skaliert werden. Sie verarbeitet Informationen autonom.

Unsere Erfahrung zeigt, dass AWS Textract eine effiziente und automatisierte Digitalisierung vorhandener Dokumente ermöglicht, wodurch der Zeit- und Kostenaufwand für die Durchführung manueller Aufgaben reduziert wird.

Esteban Uscanga-Olea, Cloud Solutions Architect, T-Systems International GmbH

Was bedeutet das für mich als Unternehmer?

Unsere Erfahrung zeigt, dass AWS Textract ein effektiver Service für die Verwaltung des Digitalisierungsprozesses ist. Im Vergleich zu manuellen oder teilmanuellen Ansätzen bietet die Lösung erhebliche Zeiteinsparungen und macht das papierlose Büro zur Realität. Die integrierte Lösung ermöglicht es Ihrem Unternehmen, in Sekundenschnelle fortschrittliche Analysen zu nutzen und die ersten Schritte in Richtung eines digitalisierten, vor allem stärker datengesteuerten Unternehmens zu gehen.

Sie möchten AWS Textract verwenden und erfahren, wie es sich effektiv in andere AWS Services zur digitalen Transformation ihrer Arbeit integrieren lässt? Dann greifen Sie auf den Code und das Repository zu, indem Sie hier klicken.


Zum Autor
IM-Uscanga-Olea-Esteban

Esteban Uscanga-Olea

Cloud Solutions Architect, T-Systems International GmbH

Profil und alle Artikel ansehen

Das könnte Sie auch interessieren:

Besuchen Sie t-systems.com außerhalb von Germany? Besuchen Sie die lokale Website für weiterführende Informationen und Angebote für Ihr Land.