Ist es noch "Enterprise Search" oder schon "Big Data"?

SEC 1.01 und CSC stellen eindrückliche Plattform für "Meaning Based Search" auf Basis von HP IDOL vor. Einfache Verknüpfung ganz unterschiedlicher Datenquellen.
 
Diese Woche stellten der Aarauer Spezialist für Highend-Umgebungen, SEC 1.01, sowie CSC Schweiz an zwei kleinen Veranstaltungen in Bern und Zürich ihre neue Plattform für "Meaning Based Search" vor. Was SEC-1.01-Gründer und -Mentor Rico Künzler zeigte, hat uns beeindruckt. Die Such-Plattform baut auf HP Autonomy IDOL auf. Wie ein HP-Vertreter an der Veranstaltung sagte, dürfte der kleine Aargauer IT-Dienstleister der kompetenteste Spezialist für HP IDOL nicht nur im deutschsprachigen Raum, sondern in ganz Europa sein.
 
SEC 1.01 bietet in Zusammenarbeit mit CSC als Systemintegrator mit Meaning Based Search eine Plattform an, mit der ganz unterschiedliche Kunden ihre Arbeitsprozesse massiv rationalisieren können. Besonders angesprochen werden Kunden aus der Finanzindustrie, aus dem Healthcare und von Behörden. Die Plattform speichert und analysiert auch die Daten des Europäischen Patentamts. Anwendungen für die forschende Industriebetriebe liegen auf der Hand.
 
Twitter, Datenbanken, Mail, Share Point, Fernsehen, Radio, Zeitung: Jegliche Datenquellen einbinden
Mit HP IDOL (IDOL steht für Intelligent Data Operating Layer) kann man beliebige Datenquellen speichern und durchsuchbar machen. Mehr noch: Die Plattform setzt gesprochene Sprache in Text um - und zwar in 150 Sprachen (!) und kann rund 1000 Datenformate (!!) behandeln. Mehr noch: IDOL schaut sich auch Fotos an und indexiert diese, wenn ein Text – zum Beispiel ein Namensschild – gefunden wird.
 
Mit IDOL kann man sowohl interne wie externe Quellen speichern und durchsuchbar machen. Auch die Aktivität in sozialen Medien, insbesondere Twitter, kann gespeichert, verfolgt und analysiert werden. So kann man mit "Meaning Based Search" Quellen verbinden, die bisher wenn überhaupt nur mit grösstem Aufwand durchsucht werden konnten. Ein Spital kann zum Beispiel Arztprotokolle, Fachzeitschriften, Lernvideos, E-Mails und die Webseite des Bundesamts für Gesundheit gleichzeitig durchsuchen und gelangt damit wesentlich rascher und sicherer zu gesicherten Diagnosen und Therapien.
 
Raffiniert auch, wie IDOL mit Filmen und Tondokumenten umgeht. Diese werden in Text umgewandelt. Findet man einen Treffer und lässt sich diesen Anzeigen, springt die Wiedergabe genau zu dem Punkt, an dem der Treffer vorkommt. Ein Beispiel: Man muss nicht jeden Beitrag in der Tagesschau ganz hören, um zum Treffer zu kommen.
 
Sentiment Analyse, Taxanomien, Parametric Search
"Meaning Based Search" von SEC 1.01 bietet einige Funktionen, die wir so noch nie gesehen haben. So Parametric Search: Wird eine Datenbank durchsucht, zum Beispiel die Ausschreibungsplattform SIMAP, so werden nicht nur Treffer angezeigt, sondern auch die Attribute dieser Treffer links im Fenster. Damit kann man dann die Trefferliste weiter eingrenzen. Ein Beispiel zur Verdeutlichung: Sucht man in SIMAP zum Beispiel nach Kanton Zug, so findet man alle Ausschreibungen und Zuschläge des Kantons in SIMAP. Nun zeigt IDOL aber das Attribut nach Art der Ausschreibung an, so dass man mit einem Mausklick alle freihändig vergebenen Zuschläge des Kantons Zug findet.
 
IDOL, respektive die auf IDOL aufgebaute Such-Lösung der Aargauer, kann auch Quellen nach "Gefühlen" durchsuchen. Firmen können so zum Beispiel Twitter nach negativen Äusserungen über ein Produkt durchforschen.
 
Fast noch erstaunlicher fanden wir an der Vorführung der Plattform gestern die Einbindung von Taxanomien. Man kann zum Beispiel das weltweit verwendete Krankheitsregister ICD (International Statistical Classification of Diseases and Related Health Problems) einbinden und verknüpfen. So kann man den Treffern gleich die richtigen Nummern nach ICD zuordnen. Wie Künzler gestern schmunzelnd sagte, interessieren sich sowohl Krankenkassen wie auch Gesundheitsanbieter brennend für die "Meaning Based Search"-Plattform.
 
Und die Sicherheit?
Nicht demonstriert gestern wurden Sicherheitsfunktionen. Werden Datenbanken und andere nicht-öffentliche Datenquellen eingebunden, so übernimmt Meaning Based Search die Berechtigungen der Datenquelle. So werden für einen bestimmten User nur E-Mails angezeigt, auf die er auch Zugriff haben darf. Diese Funktion hängt natürlich von der Qualität der Verzeichnisse beim Kunden ab. Gibt es davon mehrere und sind diese inkonsistent, müssen diese erst über einen Leisten geschlagen werden.
 
Einstieg mit nur 100'000 Franken
Gemäss Künzler braucht es nicht übermässig viel Hardware, um eine auf IDOL basierte Suchlösung zu bauen. Er stellt sich sowieso vor, dass bestimmte Datenquellen von Dienstleistern vorgehalten werden und nicht von jedem Kunden gespeichert werden müssen. Wie der SEC 1.01-Chef gestern sagte, kann man mit ungefähr 100'000 Franken eine Suchlösung unter Einbezug von relativ wenigen Datenquellen bauen.
 
Mit "Meaning Based Search" können Firmen grosse, schnelle Enterprise-Search-Lösungen bauen. Die Art und Weise, wie die Plattform aber mit Daten umgeht, gemahnt an "Big Data". Und zwar "very big". (hc)

Unser Kommentar:

HP Autonomy IDOL ist angeblich die Plattform, mit der der britische Geheimdienst GCHQ den gesamten Daten- und Sprachverkehr über die transatlantischen Glasfaserkabel speichert und durchsucht. Das sieht man der Plattform an: Vielen Funktionen – etwa die Umwandlung von Text aus Bildern – "riechen" nach Überwachung und "Big Brother".
 
Ich denke, SEC 1.01 und CSC als Systemintegrator werden gut daran tun, das Datenschutzrecht genau zu studieren und die zuständigen Datenschutz-Beamten zu konsultieren, bevor sie grosse Plattformen für "Meaning Based Search" bauen. Denn mit HP IDOL kann man nicht nur Daten analysieren, die eine Firma allenfalls nichts angehen, sondern auch Kombinationen schaffen, die wiederum neue Rückschlüsse ermöglichen.
 
Ausserdem müssen sich Anwender der eindrücklichen Lösung auch Gedanken zum Urheberrecht machen. Das Urheberrecht von Zeitungen zum Beispiel wird über die Besteuerung von Kopierern und Speicher minimal entgolten. Da IDOL keine Papierkopien macht und einmal speichert aber tausendfach verbreitet, wird das Urheberrecht von Quellen unserer Meinung nach verletzt. Dieses Problem lässt sich aber mit genügend Sorgfalt lösen. (Christoph Hugenschmidt)