OCR-Text­erkennung

Machen Sie gescannte Dokumente durchsuchbar – automatisch, intelligent und im Hintergrund.

Was ist OCR? – Texterkennung, die Ihre Dokumente durchsuchbar macht

OCR (Optical Character Recognition) ist eine Technologie, die Text aus gescannten PDF-Dokumenten oder Bildern extrahiert. In Tidion läuft OCR automatisch für alle hochgeladenen PDF-Dokumente – ohne manuellen Aufwand. So werden auch gescannte Rechnungen, Verträge oder Belege durchsuchbar und finden sich in Sekunden.

OCR macht gescannte Dokumente durchsuchbar

Stellen Sie sich vor: Sie haben eine gescannte Rechnung als PDF. Normalerweise können Sie nur nach dem Dateinamen suchen. Mit OCR-Texterkennung wird der gesamte Text aus dem gescannten Dokument extrahiert – Sie finden die Rechnung auch, wenn Sie nach Rechnungsnummer, Betrag oder Absender suchen.

Tidion unterscheidet automatisch zwischen digitalen PDFs (Text wird direkt extrahiert) und gescannten PDFs (OCR wird angewendet). Dokumente werden automatisch korrekt ausgerichtet – auch wenn sie schief gescannt wurden.

✓ Automatisch aktiv: OCR ist immer aktiviert – Sie müssen nichts zusätzlich einrichten.

OCR-Texterkennung

Automatische Verarbeitung im Hintergrund

Sobald Sie ein PDF hochladen, startet OCR automatisch im Hintergrund. Sie können sofort weiterarbeiten – die Verarbeitung läuft parallel, ohne dass Sie warten müssen.

Ihre Vorteile:

  • Keine manuelle Aktivierung nötig – OCR läuft automatisch
  • Verarbeitung im Hintergrund – Sie können weiterarbeiten
  • Status-Anzeige zeigt Fortschritt in Echtzeit
  • Automatische Queue-Verwaltung für optimale Performance

Der OCR-Status wird automatisch überwacht und aktualisiert – Sie sehen sofort, wann ein Dokument verarbeitet ist und durchsuchbar wird.

OCR-Texterkennung

Intelligente Verarbeitung für optimale Ergebnisse

Tidion verwendet ein Dual-OCR-Verfahren für optimale Ergebnisse: Zwei verschiedene OCR-Engines arbeiten zusammen – die erste extrahiert den Text, die zweite sorgt für PDF/A-Konvertierung und Qualitätsverbesserung. Das Ergebnis: hochwertiger, durchsuchbarer Text in langzeitarchivierungskonformem Format.

Dokumente werden automatisch korrekt ausgerichtet, Kontrast und Schärfe werden optimiert, und Leerzeichen sowie Tabellen werden intelligent formatiert. So erhalten Sie die bestmögliche Textqualität.

✓ Beste Qualität: Dual-OCR-Verfahren sorgt für optimale Erkennungsraten von über 95%.

Gescannte Dokumente werden durchsuchbar

Nach erfolgreicher OCR-Verarbeitung können Sie gescannte Dokumente genauso durchsuchen wie digitale. Geben Sie einfach Suchbegriffe ein – Tidion findet das Dokument über den extrahierten Text, nicht nur über den Dateinamen.

Beispiel: Eine gescannte Rechnung mit der Rechnungsnummer "12345" wird gefunden, wenn Sie nach "12345" suchen – auch wenn der Dateiname "scan001.pdf" lautet. Der extrahierte Text wird in der Datenbank gespeichert und ist sofort durchsuchbar.

✓ Volltextsuche: Finden Sie jedes Dokument über seinen Inhalt – nicht nur über den Namen.

Weitere Vorteile der OCR-Texterkennung

Automatische Orientierungserkennung

Dokumente werden automatisch korrekt ausgerichtet – auch wenn sie schief gescannt wurden. Keine manuelle Rotation nötig.

PDF/A-Konvertierung

Dokumente werden automatisch in das langzeitarchivierungskonforme PDF/A-Format konvertiert – ideal für Compliance.

Status-Badges ein/ausblenden

Sie können OCR-Status-Badges in den Einstellungen aktivieren oder deaktivieren – für eine saubere Ansicht.

Automatische Queue-Verwaltung

Dokumente werden automatisch in eine Warteschlange eingereiht und sequenziell verarbeitet – für optimale Performance.

Erfolgsrate über 95%

Dank Dual-OCR-Verfahren erreicht Tidion eine Erkennungsrate von über 95% – auch bei schwierigen Dokumenten.

Mobile-optimiert

Alle OCR-Funktionen sind auch auf mobilen Geräten vollständig verfügbar – Status-Updates funktionieren auch im Hintergrund.

Häufige Fragen

Muss ich OCR manuell aktivieren?

Nein! OCR ist automatisch für alle PDF-Uploads aktiviert. Sie müssen nichts zusätzlich einrichten – einfach hochladen und OCR läuft automatisch im Hintergrund.

Wie lange dauert OCR?

Digitale PDFs, E-Mails oder E-Rechnungen werden direkt verarbeitet. Eine einseitige gescannte PDF benötigt je nach Inhalt ca. 5 - 20 Sekunden. Große mehrseitige Dokumente können auch länger dauern – die Verarbeitung läuft aber automatisch im Hintergrund.

Was passiert bei einem OCR-Fehler?

Das Dokument bleibt im System, aber der Text ist nicht durchsuchbar. Sie können die Verarbeitung über die OCR-Verwaltung mit einem Klick wiederholen. Meistens liegt es an beschädigten PDFs oder zu großen Dateien.

Werden handschriftliche Notizen erkannt?

OCR funktioniert am besten mit gedrucktem Text. Handschriftliche Notizen werden nur unzureichend erkannt. Für beste Ergebnisse sollten Dokumente klar gedruckt und mit mindestens 300 DPI gescannt sein.

Kann ich OCR-Ergebnisse bearbeiten?

Der extrahierte Text wird automatisch gespeichert und kann nicht manuell bearbeitet werden. Sie können sowohl beim Upload als auch danach noch eigene Suchbegriffe hinzufügen.

Fragen zu Tidion®, Funktionen oder den Preisen?

Wir freuen uns von Ihnen zu hören.

Kontakt aufnehmen

Aktuelle Artikel aus unserem Blog

Tipps, Best Practices und aktuelle Informationen rund um digitale Archivierung, E-Rechnungen, GoBD-Konformität und Dokumentenmanagement für deutsche Unternehmen.

Alle Artikel anzeigen