Sprung zum Inhalt

Webdesign nach Maß von webdesign weisshart

Mein Blog

RSS Feed AbonnementRSS 2.0 Feed

zum Archiv und den Kategorien

Prizmo - beste Scan-/OCR App für das iPhone - auch mit VoiceOver

Sonntag, 24. Juli 2011

Prizmo

Die beste Scan-/OCR App bisher. Allerdings mit 7,99 € auch die teuerste. Jedoch, wie sich zeigen wird, jeden Cent Preis-wert.

Bisher getestete Scan-/OCR Apps:

  • SayText
  • DocScanner
  • OCRTOOL

Prism0 bietet beim Start neben Texterkennung auch die Verarbeitung von Visitenkarten, Rechnungen u.a. an. Ich werde mich auf die Kernfunktion Texterkennung beschränken.

Nachdem ein Foto aufgenommen, oder aus dem Album ausgewählt wurde, gibt es in der Fußzeile folgendes Menü:

  • Links (drehen)
  • Rechts (drehen)
  • Freistellen
  • Perspektive
  • Weiß(abgleich)
  • Widerrufen

Links und rechts drehen ist eigentlich überflüssig. Texte werden erkannt, auch wenn das Foto nicht richtig ausgerichtet ist. Ja, sogar zwei gleichzeitig eingescannte Buchseiten werden richtig erkannt. Ein Feature, das man nur bei "großen" OCR Programmen kennt.

Freistellen und Perspektive helfen, wenn bei der Aufnahme die Kamera nicht exakt ausgerichtet war. Blinden Benutzern hilft dies wenig. Aber für diesen Fall gibt es ein geniales Hilfsmittel: den i-Fix Stand.

Foto iFix Stand

Podcast: http://www.apfel-fleger.de/Podcasts/index.php?id=8
Doku zum i-Fix Stand vom Hersteller: https://public.me.com/i5b/de/ dort: T-117 i-FIX-stand.pdf

Weißabgleich kann eigentlich nie schaden, und man sollte ihn buchstäblich "blind" durchführen.

Das aufgenommene Foto unserer Buchvorlage - vor und nach dem Weißabgleich:

Screenshot'vorher
Screenshot nachher

Die Buttons rechts von Weiß(abgleich) sind mit VoiceOver nur mit temporärer Standardgeste erreichbar.

Siehe iPhone-Benutzerhandbuch:

… temporäre Standardgeste: Auf aktivem Element Doppeltippen und (1 Sekunde lang) halten + Standardgeste: Standardgeste verwenden. Durch das Doppeltippen und kurzzeitige Halten wird das iPhone dazu veranlasst, die nachfolgende Geste als Standardgeste zu interpretieren. Sie können zum Beispiel die Stellung eines Schalters ändern, indem Sie doppeltippen und nach kurzem Halten und ohne Abheben des Fingers Ihren Finger bewegen.

Die Taste "weiter" startet die OCR. Und jetzt zeigt Prizmo seine stärkste Seite.
Die Texterkennung ist sehr schnell, wesentlich schneller als alle oben zitierten Alternativ-Apps. Und sehr gut. Original der erkannten Seite ohne Nachbearbeitung:

DER WATZMANN Eine alte Sage erzählt, daß einst im Berchtesgadener Land ein König gewalttätig über sein Volk herrschte. Er verachtete das Gute, liebte nur die Jagd, und seine Untertanen zitterten, wenn sie den Lärm der Hörner, das Gebell der Hunde und das Stampfen der Rosse hörten. Bei Tag und Nacht brauste die wilde Jagd durch Wälder und Klüfte, verfolgte das Wild und vernichtete die Saat.
Eines Tages erschien der König mit seinem Troß auf einer Waldtrift, wo eine Herde weidete. Vor der Hütte saß die Hirtin, ihr schlafendes Kind im Arm. Neben ihr lag der Wachhtmd.
Da warfen sich des Königs Rüden auf den Hirtenhund und rissen gleichzeitig die schreckensstarre Frau zu Boden. Der König kam heran und lachte. Als der herbeigeeilte Hirt auf die jaulende Meute einschlug, hetzte der König rasend vor Wut Knechte und Hunde auf den Hirten, der wie sein Weib und sein Kind von der Meute zerissen wurde. Da erhob sich ein dumpfes Brausen, und jetzt würgten die Hunde den König und seine Familie, deren Leiber schließlich zu marmorkaitem Fels erstarrten.
Dieser Stoff wurde zu einer der bekanntesten Sagen des deutschen Sprachraumes, als Ludwig Ganghofer in seinem populär gewordenen Roman "Die Martinsldause" die erste Besiedelung der Berchtesgadener Urwälder schilderte.
Der Watzmann gehört zu den wenigen Bergen, die so unverkennbar einmalig sind, daß sie zum Symbol und Wahrzeichen eines Ortes werden. Mögen sie auch von anderen Seiten vielen anderen Gipfeln ähnlich sehen, eine Seite ist jedoch so charakteristisch und ohne Parallele, daß sie sich tief und unvergeßlich dem Beschauer einprägt. Was wäre Zermatt ohne die schlanke Pyramide des Matterhoms, Chamonix ohne die Eiskulisse der MontblancGruppe, Heiligenblut ohne die Nadelspitze des Groß loc~ 13

Wie bei allen Scan-/OCR-Apps gilt natürlich: Das Ergebnis kann nur so gut sein, wie die Aufnahme: Ausschnitt - Beleuchtung - Ausrichtung - Verwacklungsunschärfe usw. Für blinde Benutzer gilt hier wieder: den iFix Stand benutzen.

Interessantes Detail am Rande: Bei Serifen-Schriften ist die Erkennung um Klassen besser als bei Sans-Serif-Schriften.

Sobald die Texterkennung abgeschlossen ist, wird ein Bearbeiten Seite angezeigt. An dieser Stelle kann man den Text lesen / von VoiceOver vorlesen lassen, oder sofort auf "Weiter" tippen.

Die Fußleiste auf der dann folgenden Seite beinhaltet folgende Buttons:

  • Vorlesen: Die zusätzlich zu kaufenden Sprachen sind für VoiceOver Nutzer erst mal überflüssig. Es sei denn, man will die eigebaute Übersetzungsfunktion nutzen.
  • Kopieren (in die Zwischenablage)
  • Album (Original oder bearbeitets Foto im Album speichern)
  • E-Mail

Fußleisten-Buttons rechts von E-Mail sind bei aktivem VoiceOver wieder mit temporärer Standardgeste erreichbar,

  • Mobile Me
  • Dropbox - exportiert in einen voreingestellten Ordner Prizmo Exports. (aber von dort kann man es ja mit DropFiler verschieben)
  • Evernote
  • CloudApp - keine Ahnung, was das ist.

Fazit:

Eine Scan-/OCR App, die wirklich brauchbare Ergebnisse liefert, die, optimale Bedingungen vorausgesetzt, kaum noch einer Nachbearbeitung bedürfen.



Kommentare

Noch keine Beiträge.

Einen Kommentar abgeben

Damit Code-Beispiele richtig angezeigt werden, müssen Sonderzeichen maskiert werden (z.B. < zu &lt;).


(notwendig)

(notwendig)

Spamschutz:
Je nach Inhalt wird Ihr Kommentar eventuell nicht sofort angezeigt, sondern muss manuell freigeschaltet werden.

Archiv:

Kategorien:

Creative Commons Lizenzvertrag
Alle Texte (nicht Bilder!) Creative Commons CC BY-NC-SA 3.0 DE