Context is King – semantische Analyse treibt verlegerisch-buchhändlerische Geschäftsmodelle. Ein Bericht vom 15. CrossMediaForum München

Pop-up mit Werbegrafik
(Quelle: chip.de)

Signalfarbe grün – der Doppelstrich auf der Webseite sieht aus wie die eigentümliche Markierung eines Textlinks und zieht Computermäuse magisch an. Die Berührung des Mauspfeils öffnet ein Pop-up mit einer Werbegrafik. Hier spielt der Adserver von Vibrant Media passend zum Wortsinn seine Werbebotschaften aus.

„Contextual Advertising Technology“ oder – auf deutsch – „kontextbezogene Werbung“ ist die Zauberformel, mit der Vibrant Media das herzustellen versucht, was das Internet-Marketing so erfolgreich macht: Relevanz für den Werbekunden. Längst ist es ein Gemeinplatz, dass Content „King“ ist, um Relevanz überhaupt zu ermöglichen. Aber längst hat ein anderer König neben ihm auf dem Thron Platz genommen: der Kontext. Bedingt durch ihren Reichtum an hochwertigem Content, sind Verlage in einer guten Position im Kampf mit den amerikanischen Internet-Giganten um die Aufmerksamkeit des Web-Nutzers. Und zunehmend spielen sie auch die Kontext-Karte. Seit etwa zwei Jahren verbreiten sich semantische Technologien immer stärker im deutschsprachigen Internet. Eine aktuelle Studie von Heinold Spiller & Partner zeigte im Juni 2013, dass das Thema selbst in kleineren Buch-, Fachinformations- und Presseverlagen längst angekommen ist.

Was verbirgt sich hinter dem Begriff „Semantische Technologien“? Ein ganzes Bündel von Anwendungen, das durch die originale Bedeutung des griechischen Worts „semantikós“ – bedeutsam – zusammengehalten wird, wie Stefan Gaßmann, Geschäftsführer des Jenaer Publishing-Dienstleisters mediaTEXT, auf dem 15. CrossMediaForum in München ausführte. Die von Berater Ehrhardt F. Heinold veranstaltete Konferenz versammelte über 80 Experten, vor allem Vertreter der wichtigen Anwender aus der Verlagsbranche und der führenden Technologie-Anbieter wie moresophy, retresco, Semantic Web Company, TEMIS, aber auch Hersteller von Redaktions- und Suchsystemen, ohne deren Dienste Semantic Publishing nicht funktionieren kann. Allen semantischen Techniken ist eines gemeinsam: sie werten Content im Hypertext-Umfeld, also im Umfeld vernetzter, bildschirmlesbarer Inhalte, auf, indem sie sie in einen Bedeutungskontext stellen.

Dies kann bereits bei der Erstellung der Inhalte geschehen – ein Ansatz, den etwa die PAUX Technologies, der Berliner Startup von Michael Dreusicke, verfolgen. PAUX bietet seinen Kunden eine browserbasierte Texterfassungs-Oberfläche, die die Setzung von Auszeichnungen an bedeutsamen Stellen im Text, seine Anreicherung mit Inhalts-Schlagwörtern oder seine Zuordnung zu Taxonomien – hierarchischen Bedeutungs-Systematiken – erlaubt. Diese manuelle Anreicherung mit sogenannten Metadaten stellt richtig angewandt sicher, dass der Inhalt nicht nur unter den Begriffen angezeigt wird, die im Text selbst enthalten sind, sondern unter all denen, die interessierte Leser eingeben könnten. Eine politische Reportage über Palermo, mit der Geo-Information „Sizilien“ markiert oder „getaggt“, wird auf diese Weise unabhängig vom Wortlaut des Inhalts auffindbar auch für Leser, die sich für die gesamte Insel interessieren – ihre Relevanz wächst damit.

Ein anderer Ansatz ist die automatisierte Anreicherung der Inhalte mit Metadaten, die etwa TEMIS anbietet. Hier „versteht“ eine Maschine, mit computerlinguistischer Intelligenz ausgerüstet, jeden Text anhand der enthaltenen Wörter und Sätze und ordnet ihm Schlagwörter, Geoinformationen oder Positionen in einer zuvor manuell erstellten Taxonomie zu. Der Palermo-Bericht „weiß“ dank seiner Metadaten, dass er nicht nur auf Sizilien, sondern in Italien und in Europa spielt, und dass die dort erwähnte „Bank“ ein Finanzinstitut, kein Außenmöbel ist. Die MVS Medizinverlage in Stuttgart wenden diese Technologie in ihrer neuen Haustierärzte-Plattform VetCenter an, um die vorhandenen Inhalte optimal zu erschließen und die Verweildauer der User zu erhöhen – ein anderer Ausdruck für Relevanz.

Semantische Technologien können schließlich vorhandenen unveränderten Inhalten zusätzliche Relevanz verleihen, wenn sie in Suchalgorithmen integriert werden. „Intelligente Suche“ ist eine Software, die Treffer nicht nur dann auswirft, wenn diese 1:1 zum Suchwort passen, sondern Schreibvarianten, Tippfehler oder verwandte Begriffe angemessen berücksichtigt. Die Berliner retresco bietet unter anderem solche semantischen Suchlösungen an.

Welche dieser Grundtechniken am besten geeignet ist, hängt von der Zielsetzung ab. Lautet das Ziel „Alles Passende muss gefunden werden“, ist die automatische Anreicherung die beste Lösung. Die Unschärfe, die der menschlichen Sprache nun einmal eigen ist, wird allerdings dazu führen, dass auch irrelevante Ergebnisse angezeigt werden. Heißt dagegen das Ziel „Nur Passendes darf gefunden werden“, wird eine manuelle oder teilmanuelle Anreicherung das Mittel der Wahl sein. Hier arbeiten Maschinen vor und machen den menschlichen Bearbeitern Vorschläge, die diese übernehmen oder ablehnen können.

Doch wer hat überhaupt den Nutzen semantischer Technologien? Am unmittelbarsten Informations-Verbraucher, die in Webseiten, mobilen Anwendungen oder Datenbankangeboten, auch in Online-Shops nach Fakten oder Unterhaltung suchen oder von einem zum anderen Artikel springen. Je besser die Suchfunktion und je zahlreicher und passender die zusätzlich angebotenen ähnlichen Artikel, desto mehr wird der User subjektiv vom Informationsangebot profitieren, desto länger wird er verweilen, desto mehr wird er kaufen – physische Produkte oder virtuelle Artikel, also E-Content. Wenn der Verbraucher zusätzlich vom Anbieter erkannt wurde – z.B. weil er eingeloggt ist oder über Cookies, kleine Software-Schnipsel, die der Anbieter im Browser des Users temporär hinterlegt hat – und wenn seine Userdaten mit Metadaten bezüglich seiner Informationsbedürfnisse angereichert sind, kann das die Relevanz der angezeigten Inhalte dramatisch erhöhen. Unter „Bank“ bekommt dann der Finanzfachmann nur Informationen zum Kreditwesen angezeigt, der GaLaBau-Experte nur Gartenmöbel.

Die solcherart gesteigerte Relevanz lässt sich monetarisieren – für viele Anbieter aus den Verlagen ist sie der Schlüssel zum Paid Content, der Weg aus der Sackgasse des Gratis-Internets. Denn einerseits steigert Relevanz die Loyalität und Zahlungsbereitschaft des Lesers, andererseits ermöglicht sie die Aussteuerung kontextbezogener Werbung und macht einen Verlag damit relevanter für Werbeagenturen. So lässt sich das alte Paradigma „Publizistik wird vorfinanziert vom Verlag und gemeinsam bezahlt von Werbewirtschaft und Lesern“ in die Online-Welt fortsetzen – ein Jahrhundertproblem wäre damit gelöst. Verleger und andere Experten träumen schon von einem semantikgetriebenen „Web 3.0“, in dem die längst ersehnte Umwertung aller Werte endlich Realität wird.

Michael Lemster

Kommentare (0)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.