
eZine von Alfred Rhomberg
Igler Reflexe - Von Superzeichen, automatischer Texterkennung bis zum gläsernen Menschen
Bildquelle: Igler Reflexe (zu ca.45 % verdeckt), Bild: Alfred Rhomberg
Warum konnten Apotheker früher, als Rezepte vom Arzt noch mit der Hand geschrieben wurden, meist die unleserlichsten Schriften der Ärzte lesen? Weil unser Gehirn im Laufe des Lebens durch Erfahrung in der Lage ist, sogenannte „Superzeichen“1 zu bilden. Wenn das Gehirn nur einen einzigen Druckbuchstabentyp „A“ kennt, wird es auch nur diesen einen Buchstaben in dieser Druckform wiedererkennen. Je mehr unser Gehirns lernt, dass es den Buchstaben A in verschiedenen Schreibweisen gibt, desto eher kann es das „A“ auch in den unterschiedlichen Schreibweisen lesen, weil ein übergeordnetes „Superzeichen“ für „A“ angelegt wurde.
Wie weit dieser Prozess der Bildung von Superzeichen geht, kann jeder selbst ausprobieren. Man nimmt eine Buchdruckseite, genauer genommen nur eine einzige Zeile, verdeckt die Zeile stufenweise von unten nach oben und wird feststellen, dass der obere unverdeckte Text bei den meisten Druckschriften noch gut erkennbar ist, selbst wenn fast die Hälfte der Schriftzeile verdeckt ist (manche Druckschriften sind sogar noch nach größerer Abdeckung deutbar). Möglich ist das nur, weil ein lesegeübter Mensch „Superzeichen“ in bestimmten Hirnarealen gebildet (erlernt) hat, die es ermöglichen, das Fehlende zu ergänzen. Genau so ist es auch bei der Entzifferung von Handschriften. Je mehr unterschiedliche Handschriften ein Mensch in seinem Leben gelesen hat, desto eher ist er in der Lage, auch fast unentzifferbare, neue Handschriften zu lesen – wofür besonders Apotheker einmal berühmt waren.
Automatische Texterkennung (OCR)
Superzeichen spielen im Computerzeitalter u.a. eine wichtige Rolle bei der Texterkennung von gescannten Buchseiten oder Zeitungsartikeln, die ja nach dem Scannen zunächst als Grafikformat vorliegen. Man bedient sich dabei sogenannter OCR Softwares (Optical Character Recognition). Diese Programme sind inzwischen so verfeinert worden, dass die meisten Druckschriften heute fast fehlerfrei erkannt werden können, wobei sich dieser Prozess in mehreren Stufen abspielt. Zunächst wird zwischen Textblöcken und grafischen Elementen unterschieden, dann werden die Zeilenstrukturen und schließlich einzelne Buchstaben erkannt, wobei die separierten Buchstaben mit im Programm gespeicherten Buchstaben verglichen werden. Noch vor 10 Jahren gab es bei bestimmten Schriftarten sehr häufig Erkennungsschwierigkeiten, insbesondere bei den „gotischen“ Titelüberschriften der Frankfurter Allgemeinen Zeitung und bei der Neuen Zürcher Zeitung. Heute ist es möglich durch Verbesserung der Programme auch die häufigen Verwechslungsfehler von 8, ß oder B auszuschalten. Dies geschieht durch ICR-Programme (Intelligent Character Recognition), die das OCR Ergebnis nach bestimmten Regeln überprüfen. Die Entwicklung ist sogar noch einen Schritt weiter fortgeschritten, inzwischen lassen sich auch handgeschriebene Buchstaben in Word-Dokumente umwandeln, sofern das Programm durch einen vorangegangenen „Lernprozess“ an eine bestimmte Handschrift gewöhnt wurde, d.h. deren Eigenheiten erlernt hat. Dies wird u.a. bei Kleinorganizern und Taschenrechnern benützt, bei denen es möglich ist, Ziffern mittels eines Griffels oder mit dem Finger auf einem Touch Screen einzutragen. Bis jetzt hat die Texterkennung bei Fließhandschriften dagegen noch ihre Grenzen, man kann jedoch davon ausgehen, dass es auch hier Fortschritte geben wird.
Captcha’s
Unter Captcha’s (Completely Automated Turing test to tell Computers and Human Apart) versteht man die grafische Verschleierung von Buchstaben und Zahlenfolgen, die per Zufallsgenerator generiert, als Password zur Identifikation eines bestimmten Benutzers vorgeschlagen werden, die nur der Mensch (als Internetnutzer) in seiner numerischen Bedeutung erkennen kann und z.B. bei Banküberweisungen zusätzlich zu einem Password in ein freies Feld eintragen werden müssen. Derzeit bedeutet diese Methode einen zusätzlichen Schutz, um nicht unbefugt in ein Netz einzudringen. Wie lange captcha’s noch diesen Schutz bieten werden ist fraglich und weitgehend von den Entwicklungen auf dem Gebiet der künstlichen Computer-Intelligenz abhängig. Vermutlich wäre es nützlich, die „captcha-Vorschläge“ nach relativ kurzer Zeit (z.B. 30 – 60 Sekunden) zu wechseln, weil auch sehr gute Entschlüsselungsprogramme (für den Fall, dass es in absehbarer Zeit überhaupt gelänge, die oft nahezu unleserlichen grafischen Zeichen maschinell in numerische Zeichen umzuwandeln) schon bei 6 Ziffern eine relativ lange Zeit brauchten, um sie zu identifizieren. Inzwischen gibt es bereits sogenannte Spambots (ursprünglich Programme um aus e-mailbotschaften e-mail Adressen auszukundschaften), die auch die captchas lesen und umgehen können.
TAN’s und Security Cards
Eine bekannte österreichische Bank benützt sogenannte „Security Cards“ statt der üblichen TAN’s (Transaktionsnummern), deren Prinzip darauf beruht, dass der Kunde eine kleine elektronische Karte erhält, bei der sich 6 Ziffern im Minutentakt verändern und die Ziffernfolge mit dem Zentralrechner der Bank getaktet ist. Dieser Schutz soll angeblich selbst im verschlüsselten https System, das alle Banken bei online Transaktionen benützen, einen wesentlich besseren Schutz als die üblichen TAN’s bieten.
Der gläserne Mensch
Viele Menschen fürchten sich zunehmend vor der Speicherung ihrer Fingerabdrücke, ihrer Pupillenmerkmale oder ihrer Gesichtsmimik und vergessen dabei, dass seit vielen Jahren bereits von fast jedem Menschen umfangreiche Daten gespeichert sind und weltweit abgerufen werden können. In den neuen EU Pässen sind z.B. viele personenbezogene Daten in den langen Passnummern gespeichert und zukünftig sollen Fingerabdrücke und weitere personenbezogene Daten zusätzlich zur Pflicht gemacht werden. Allzu große Angst sollte man davor nicht haben, denn auch das herkömmliche Passbild oder eine persönliche Unterschrift waren ja bereits personenbezogene Merkmale, mit denen wir längst zu leben gelernt hatten. Kritisch wird die Frage bei der Speicherung von Krankheitsdaten z.B. in E-Cards. Einerseits würde dies viele unnotwendige Doppeluntersuchungen ersparen und einem Arzt im Ernstfall sogar helfen, schneller und besser zu reagieren, weil die Kenntnis der Blutgruppe oder dass der Patient Diabetiker ist, lebensrettend sein kann. Diesen nicht zu unterschätzenden Vorteilen steht einzig und allein die Möglichkeit des Missbrauchs entgegen. So könnten Arbeitgeber oder Versicherungen sich mit Hilfe solcher Chipkarten (z.B. bei der Untersuchung durch den Betriebs- oder Kontrollarzt) Informationen über einen Stellenbewerber oder Versicherungsnehmer besorgen, deren Preisgabe unerlaubt ist. Niemand kann den Fortschritt aufhalten, das Einzige was wir können ist, immer bessere Sicherungssysteme zu entwickeln, um die unerlaubte Verwendung gespeicherter Daten möglichst zu verhindern.
1 Superzeichen hängen eng mit dem Begriff „Superierung“ zusammen. Man versteht darunter die Fähigkeit des Gehirns, Einzelheiten zu einem Ganzen zusammenfassen zu können. Dadurch entsteht eine Abstraktion komplexer Sachverhalte, wobei die übergeordnete Ganzheit als Superzeichen bezeichnet wird.
(Alfred Rhomberg)
am 24.07.2008 00:24
