Case Study: Optimierte Antragsbearbeitung mit maßgeschneidertem OCR-Training von Fahrzeugscheinen

Case Study: Optimierte Antragsbearbeitung mit maßgeschneidertem OCR-Training von Fahrzeugscheinen

Diese Case Study gewährt Einblicke in unsere Methodik der Echtzeitauslesung von relevanten Informationen auf der Vorderseite von hochgeladenen Fahrzeugpapieren. Unter Berücksichtigung unserer vorangegangenen Case Studies Identifizierung der richtigen Kunden-Dokumente durch KI und Intelligentes Zuschneiden von hochgeladenen Kunden-Dokumenten erläutern wir detailliert den Prozess und Modell-Training zur Bilderkennung und Textauslesung. Durch die Implementierung maßgeschneiderter ODM- und OCR-Lösungen optimieren wir nicht nur die Kundenzufriedenheit, sondern reduzieren auch die Bearbeitungszeit von bis zu 10 Tagen auf unter 2 Sekunden, was zu einer signifikanten Steigerung der operativen Effizienz führt.

Umfang der Arbeit

Im folgenden Beispielbild, das von unseren Kunden eingereicht wurde, sind die rot markierten Bereiche entscheidend. Sie müssen digital erkannt werden, damit das Unternehmen, welches Dienstleistungen zur Abwicklung von Emissionseinsparungen für Elektrofahrzeugbesitzer anbietet, sie für den Zertifizierungsantrag nutzen kann.

Um ein hohes Maß an Genauigkeit bei der Extraktion von Informationen aus dem bereitgestellten Dokument zu erreichen, ist eine intelligente Anwendung erforderlich. Diese Anwendung benötigt maßgeschneiderte Deep-Learning-Modelle, die ein Objekterkennungsmodell zur Lokalisierung der relevanten Bereiche und ein Modell zur optischen Zeichenerkennung zum genauen Lesen des Inhalts innerhalb dieser Bereiche umfassen.

Training des Objekterkennungsmodells (Object Detection Model)

Das Ziel des Objekterkennungsmodells (ODM) besteht darin, diese 10 Felder einzeln anhand ihrer vier Koordinaten (oben links, oben rechts, unten rechts, unten links) zu identifizieren. Um ein solches Modell effektiv zu trainieren, ist ein umfangreicher Datenbeschriftungsprozess erforderlich. Wir haben etwa 10.000 Dokumente von Kunden mit der Open-Source-Software CVAT sorgfältig beschriftet, indem wir jedes der 10 Felder in ein Rechteck eingeschlossen haben. Diese beschrifteten Feldbilder wurden anschließend in Trainings-, Validierungs- und Testgruppen unterteilt. Bemerkenswerterweise erreichte das Modell RetinaNet, das auf die Lokalisierung orientierter Bounding Boxes (zur Behandlung von Feldern in verschiedenen Winkeln) zugeschnitten ist und über ein ResNet-50-Backbone und ein Feature-Pyramidennetzwerk verfügt, eine hervorragende durchschnittliche Genauigkeit von 98 %.

Training des optischen Zeichenerkennungsmodells (Optical Recognition Model)

Dieselbe Beschriftungssoftware wurde zur manuellen Eingabe der Werte für jedes Feldbild verwendet. Um den Anforderungen eines optischen Zeichenerkennungsmodells (OCR) gerecht zu werden, wurden einzelne Feldbilder abgeschnitten, da diese Modelle eine einzeilige Texteingabe zusammen mit den entsprechenden Textwerten erfordern. Angesichts der Einbeziehung von 10 Feldern pro Bild haben wir durch die Beschriftung von 10.000 Bildern einen Datensatz von 100.000 Einträgen zusammengetragen.

Wir trainierten das Keras-OCR-Modell auf diesem Datensatz und nahmen einige benutzerdefinierte Anpassungen vor. Dies führte zu bemerkenswerten Genauigkeiten von 99 % auf der Feldebene und 95 % für die Erkennung auf Dokumentenebene. Die Feld-bezogene Genauigkeit spiegelt den Anteil der korrekt gelesenen Felder im Verhältnis zur Gesamtzahl der Felder wider, während die Dokumenten-bezogene Genauigkeit das Verhältnis der Dokumente, in denen alle Felder korrekt erkannt wurden, zur Gesamtzahl der Dokumente darstellt.

Die Integration der Lösung in die bestehende Codebasis

Die folgende Abbildung veranschaulicht den Prozess der Kundenregistrierung im Kontext der KI. Es zeigt die Funktionsweise der Deep-Learning-Modelle, die in dieser Case Study besprochen werden, zusammen mit denen, die in früheren Case Studies – Case Study I und Case Study II – vorgestellt wurden.

Ergebnis

Die Vorteile der OCR lassen sich wie folgt zusammenfassen:

  1. Schlanker Prozess: OCR ersetzt einen manuellen Prozess durch ein automatisiertes und intelligentes System, das Kundendaten aus den Bildern der Vorderseite von Fahrzeugscheinen extrahiert.
  1. Überprüfung der Anspruchsberechtigung: Die Erkennung des Kraftstoffcodes hilft bei der sofortigen Feststellung, ob ein Kunde für die Antragsstellung infrage kommt. Nur vollelektrische Fahrzeuge sind berechtigt. Wenn der Wert dieses Feldes einen anderen Wert als 0004″ hat, werden die Kunden in Echtzeit darüber informiert, dass sie keinen Anspruch auf eine Quote haben, weil sie kein Elektrofahrzeug besitzen.
  1. Effiziente FIN-Erkennung: Die Erkennung der Fahrzeugidentifikationsnummer (FIN) bei der Registrierung ist von großem Vorteil. Da jede FIN für ein Fahrzeug einzigartig ist, ermöglicht sie eine Echtzeit-Datenbankprüfung, um festzustellen, ob ein Kunde bereits registriert ist. Dadurch erhalten die Kunden eine sofortige Rückmeldung und Probleme mit doppelten Registrierungen bzw. Anträgen werden vermieden.
  1. Transparenz für Kunden: Bei der Registrierung gibt die ausgelesene Angabe der Fahrzeugklasse den Kunden sofortigen Einblick in die Höhe der Auszahlung aus dem Handel ihrer Emissionseinsparungsrechte. Diese Auszahlung variiert je nach Fahrzeugklasse. Dieses zusätzliche Feature steigert nicht nur die Kundenzufriedenheit, sondern gewährleistet auch klare Erwartungen bezüglich der Zahlungen, um Missverständnisse zu vermeiden.“

Die Implementierung von Deep-Learning-Anwendungen führt zu erheblichen Zeit- und Arbeitseinsparungen für das entsprechende Unternehmen, insbesondere bei Aufgaben, die zuvor stark auf manuelle Bearbeitung angewiesen waren. Der Übergang zu einem vollständig automatisierten Kundenregistrierungsprozess steigert die betriebliche Effizienz in den interdisziplinären Abteilungen des Unternehmens und führt zu einer erheblichen Steigerung der Kundenzufriedenheit durch Echtzeit-Feedback und Vermeidung längerer Bearbeitungszeiten.

Projektdetails

Diese Case Study untersucht unsere Strategie zur Extraktion von Informationen aus Vorderseitenbildern von Fahrzeugzulassungspapieren, die von Kunden hochgeladen wurden. Mit maßgeschneiderten Deep-Learning-Modellen für die Objekterkennung (ODM) und optische Zeichenerkennung (OCR) erzielten wir herausragende Genauigkeiten von jeweils 98 % und 99 %. Die Umsetzung von OCR optimierte Prozesse, überprüfte die Antragsberechtigung, erkannte Fahrzeugidentifikationsnummern und erhöhte die Transparenz für Kunden. Diese automatisierte Lösung führte zu erheblichen Zeit- und Aufwandsersparnissen, verbesserte die operative Effizienz und Kundenerfahrung im vollautomatisierten Antragsprozess.

Projektaufgaben

  • Evaluation

    Wir haben hohe Genauigkeiten von 98 % für die Objekterkennung (ODM) und 99 % für die optische Zeichenerkennung (OCR) erzielt.

  • Mehrwert für das Unternehmen

    Unsere maßgeschneiderte ODM- und OCR-Lösung ermöglicht eine Echtzeitauslesung von Fahrzeugscheinen im Antragsprozess. Dies optimiert die Kundenregistrierung, reduziert die Bearbeitungszeit von bis zu 10 Tagen auf nur 2 Sekunden und steigert die operative Effizienz durch einen nahtlosen und fehlerfreien Workflow.