10 häufigste Fehler bei der Dokumentenarchivierung
Vermeiden Sie die 10 häufigsten Fehler bei der Dokumentenarchivierung. Von unvollständiger Erfassung über fehlende Backups bis zu GoBD-Verstößen – so archivieren Sie richtig.
Machen Sie gescannte Dokumente durchsuchbar – automatisch, intelligent und im Hintergrund.
OCR (Optical Character Recognition) ist eine Technologie, die Text aus gescannten PDF-Dokumenten oder Bildern extrahiert. In Tidion läuft OCR automatisch für alle hochgeladenen PDF-Dokumente – ohne manuellen Aufwand. So werden auch gescannte Rechnungen, Verträge oder Belege durchsuchbar und finden sich in Sekunden.
Stellen Sie sich vor: Sie haben eine gescannte Rechnung als PDF. Normalerweise können Sie nur nach dem Dateinamen suchen. Mit OCR-Texterkennung wird der gesamte Text aus dem gescannten Dokument extrahiert – Sie finden die Rechnung auch, wenn Sie nach Rechnungsnummer, Betrag oder Absender suchen.
Tidion unterscheidet automatisch zwischen digitalen PDFs (Text wird direkt extrahiert) und gescannten PDFs (OCR wird angewendet). Dokumente werden automatisch korrekt ausgerichtet – auch wenn sie schief gescannt wurden.
✓ Automatisch aktiv: OCR ist immer aktiviert – Sie müssen nichts zusätzlich einrichten.
Sobald Sie ein PDF hochladen, startet OCR automatisch im Hintergrund. Sie können sofort weiterarbeiten – die Verarbeitung läuft parallel, ohne dass Sie warten müssen.
Ihre Vorteile:
Der OCR-Status wird automatisch überwacht und aktualisiert – Sie sehen sofort, wann ein Dokument verarbeitet ist und durchsuchbar wird.
Tidion verwendet ein Dual-OCR-Verfahren für optimale Ergebnisse: Zwei verschiedene OCR-Engines arbeiten zusammen – die erste extrahiert den Text, die zweite sorgt für PDF/A-Konvertierung und Qualitätsverbesserung. Das Ergebnis: hochwertiger, durchsuchbarer Text in langzeitarchivierungskonformem Format.
Dokumente werden automatisch korrekt ausgerichtet, Kontrast und Schärfe werden optimiert, und Leerzeichen sowie Tabellen werden intelligent formatiert. So erhalten Sie die bestmögliche Textqualität.
✓ Beste Qualität: Dual-OCR-Verfahren sorgt für optimale Erkennungsraten von über 95%.
Nach erfolgreicher OCR-Verarbeitung können Sie gescannte Dokumente genauso durchsuchen wie digitale. Geben Sie einfach Suchbegriffe ein – Tidion findet das Dokument über den extrahierten Text, nicht nur über den Dateinamen.
Beispiel: Eine gescannte Rechnung mit der Rechnungsnummer "12345" wird gefunden, wenn Sie nach "12345" suchen – auch wenn der Dateiname "scan001.pdf" lautet. Der extrahierte Text wird in der Datenbank gespeichert und ist sofort durchsuchbar.
✓ Volltextsuche: Finden Sie jedes Dokument über seinen Inhalt – nicht nur über den Namen.
Dokumente werden automatisch korrekt ausgerichtet – auch wenn sie schief gescannt wurden. Keine manuelle Rotation nötig.
Dokumente werden automatisch in das langzeitarchivierungskonforme PDF/A-Format konvertiert – ideal für Compliance.
Sie können OCR-Status-Badges in den Einstellungen aktivieren oder deaktivieren – für eine saubere Ansicht.
Dokumente werden automatisch in eine Warteschlange eingereiht und sequenziell verarbeitet – für optimale Performance.
Dank Dual-OCR-Verfahren erreicht Tidion eine Erkennungsrate von über 95% – auch bei schwierigen Dokumenten.
Alle OCR-Funktionen sind auch auf mobilen Geräten vollständig verfügbar – Status-Updates funktionieren auch im Hintergrund.
Nein! OCR ist automatisch für alle PDF-Uploads aktiviert. Sie müssen nichts zusätzlich einrichten – einfach hochladen und OCR läuft automatisch im Hintergrund.
Digitale PDFs, E-Mails oder E-Rechnungen werden direkt verarbeitet. Eine einseitige gescannte PDF benötigt je nach Inhalt ca. 5 - 20 Sekunden. Große mehrseitige Dokumente können auch länger dauern – die Verarbeitung läuft aber automatisch im Hintergrund.
Das Dokument bleibt im System, aber der Text ist nicht durchsuchbar. Sie können die Verarbeitung über die OCR-Verwaltung mit einem Klick wiederholen. Meistens liegt es an beschädigten PDFs oder zu großen Dateien.
OCR funktioniert am besten mit gedrucktem Text. Handschriftliche Notizen werden nur unzureichend erkannt. Für beste Ergebnisse sollten Dokumente klar gedruckt und mit mindestens 300 DPI gescannt sein.
Der extrahierte Text wird automatisch gespeichert und kann nicht manuell bearbeitet werden. Sie können sowohl beim Upload als auch danach noch eigene Suchbegriffe hinzufügen.
Wir freuen uns von Ihnen zu hören.
Kontakt aufnehmen