Computerclub 2, das Technikmagazin mit Wolfgang Back und Wolfgang Rudolph [Erkennungsmelodie] W.R. : Einen wunderschönen guten Tag wünsche ich Ihnen von meiner Seite und das tue ich auch für Wolfgang Back. Versucht er auch bei mir immer W.B. : Tutut.
W.R. : Er hat hier eben ein bisschen ‘rum geschmatzt. Warum weiß ich nicht, aber...
W.B. : Ich brauche nichts mehr zu sagen. Du machst ja alles für mich. Ja.
W.R. : Ich begrüße Sie ganz herzlich zu einer Sendung, in der sicherlich kontrovers diskutiert wird über Themen. Sie werden sich wundern, dass sowas bei uns vorkommt, aber Sie müssen auch mal sehen, was denn zukünftig mit dem Radio passiert und wie die Meinung der Offiziellen sind dazu.
W.B. : Mm.
W.R. : Aber wir haben auch noch ein zweites Thema, Herr Back.
W.B. : Ja, das ist der Professor Böttcher und der wird uns erzählen, wie man Daten komprimiert.
[Erkennungsmelodie] W.R. : Das Fernsehen erlebt ja zur Zeit einen Wandel. In einigen Bundesländern gibt es schon DVB-T. Das analoge Fernsehsignal ist abgeschaltet und nun muss man sich ein neues Fernsehgerät oder einen Adapter, eine Vorschaltbox oder Set top Box sagt man da, kaufen um weiter gucken zu können. Genau das gleiche hat man auch vor mit dem Radio. Mit dem UKW-Radio. Nur hier sieht's ein bisschen anders aus. Wir haben in Deutschland über 220 Millionen Radios, also fast sechs Radios pro Haushalt und wenn man so etwas austauschen müßte... Natürlich freuen sich Industriezweige darüber, aber stellen Sie sich vor, Ihre Radios im Mobiltelefon, im Wecker, in der Küchenuhr, die funktionieren nicht mehr und aus dem Auto müssten Sie Ihr Radio auch ausbauen. Das ist nicht ganz so trivial, so einfach.
W.B. : Also ich kann mich noch erinnern, dass es mal hieß, so um 2000 rum oder ein bisschen vorher, dass 2010 die ganze Digitalisierung gelaufen wäre. Das hieß auch, dass die analogen weg wären. Das wird nicht so schnell passieren.
W.R. : Nein, das wird nicht so schnell passieren, aber wie es mit dem Radio weitergeht und was Sinn macht oder ob das Radio künftig vielleicht über das Internet kommt... Ob das dann überhaupt noch Radio ist, dazu haben wir einen Gesprächspartner vom Deutschlandradio aus Berlin. Und zwar aus der Programmdirektion, Hauptabteilung Kultur und Musik, Dr. Wolfgang Hagen. Einen schönen guten Tag.
Dr. Hagen: Ich grüße Sie.
W.R. : Herr Doktor Hagen, Sie haben jetzt schon gehört, dass ich so ein bisschen rudere und auch der Wolfgang Back weiß nicht so genau, wie geht's denn weiter. Wird es es UKW weitergeben, über diesen Zeitraum 2012/2013? Gibt's da schon Entscheidungen dazu? Dr. Hagen: Also, es gibt keine Entscheidungen. Wo sollten die auch in einem föderalen Mediensystem herkommen? Das könnte ja nur über das TKG oder das Telekommunikationsgesetz laufen und die können aber wiederum keine Rundfunkverbreitung in irgendeiner Form gesetzlich regeln.
Ich muss Sie auch, was Ihre Eingangsmoderation betrifft, ein klein wenig korrigieren. Es ist zwar richtig, dass es terrestrisch nur noch digitales Fernsehen gibt, aber es gibt natürlich im Kabel nach wie vor analog. Die Kabel in der Bundesrepublik sind ja der Hauptträger und oder sagen wir zur Hälfte der Träger des, der Ausbreitung des Fernsehprogramms und die Kabel sind auch wieder geteilt in einen ziemlich großen analogen Bereich und in einen, nach wie vor wachsenden digitalen Bereich. Dies sozusagen nur mal am Rande.
Hörfunk wird nun leider nicht - oder zum Glück, je nachdem wie man's beurteilt-über Kabel empfangen. Also der Kabelempfang ist absolut minimal. Faktisch wirklich in Wirklichkeit unmessbar. Radio wird wirklich terrestrisch empfangen. Wir haben das ja gesagt, da sind irgendwie sechs Geräte im Haushalt. Man weiß gar nicht, wo es überall her tönt. Und die nutzen, am besten, wie durch man technisch sagt, durchdringende Frequenz. Das ist nun mal das UKW und zwar in den Bändern die wir haben, etwa 80 bis 100 Megahertz.
Und diese Kanäle waren mal vor 20 Jahren das ganz begehrte Objekt der Begierde von kommerziellen Datendiensten. Weil sie so tiefdurchdrängt sind, hat man gesagt, also diese Frequenzen wollen wir unbedingt haben, um also Datenkanäle der dritten und vierten Art aufzumachen. Wie gesagt, das war 70er, 80er Jahre so die Diskussion.
Inzwischen ist viel, viel, viel in die Welt gekommen, vor allen Dingen seit ‘92 eben GSM, der Standard für das Handy und mit all den Updates die es seither gibt und UMTS. Das heißt, die mobile Datenkommunikation hat inzwischen ganz andere Frequenzbereiche erobert, die sie praktisch aufgeben müßten, wenn sie das UKW noch mal neu erschließen wollten. So dass also erst mal von der Begehrseite her, ich nicht erkennen kann, dass jemand UKW unbedingt haben will.
Aber nach wie vor sehr attraktiv, stimmt. In den 80er Jahren hat man dann gesagt: Okay, wir digitalisieren das Radio und transferieren es auf ganz andere Frequenzen. Im jetzigen VHS-Band und noch höher. Und das UKW-Band machen wir frei. Das nennt man dann DAB.
Nun, DAB ist gescheitert, weil die Konsumenten es nicht angenommen haben. Wir haben es in der Bundesrepublik nicht, weil die Konsumenten es nicht angenommen haben.
W.R. : Nein.
Dr. Hagen: Wir haben in der Bundesrepublik eine flächendeckende...
W.B. : Weil den Konsumenten nichts geboten wurde.
Dr. Hagen: Ja, gut, also das kann man auch sagen.
W.B. Ja.
Dr. Hagen: Simulcast ist ein Argument. Aber wenn Sie sagen, die terrestrische Verbreitung des Fernsehens ist inzwischen ist digital, kann man sagen, neues ist da nicht drauf. Also insofern muss man immer die Kirche im Dorf lassen. Übrigens, im Bayerischen Rundfunk und im WDR gibt es durchaus den einen oder anderen Zusatzdienst, der auf diesem, wie ich sagen würde, sehr veraltetem Standard von DAB läuft. DAB ist ein Standard, der ist entwickelt worden in den 70er Jahren. Der läuft mit einem offiziell mit einer Kompression von M-Pack 2. Das macht kein Mensch mehr heute. Da gibt's alle möglichen Updates auch irgendwie. Dann hat man sich in den 70er, 80ern bei der Grundplanung von DAB gründlich vertan was die Durchdringungstiefen betrifft.
W.R. : Das hängt aber auch damit zusammen, dass das Bundesverteidigungsministerium Einspruch erhoben hat gegen die Sendeleistung.
Dr. Hagen: Nee nee. Überhaupt nicht, gar nicht. Da sind sie falsch informiert. Die Grundspezifikation von DAB ist die zehntel Leistung, die wir jetzt haben. Das ist die Spezifikation. Nur hat sich dann herausgestellt, dass im Praxistest, also in der wirklichen Wirklichkeit, diese durch diese Frequenzstärken nicht ausreichen. Die Feldstärken nicht ausreichen, um die Durchdringungen auch wirklich mal bis in ein paar Zimmer ins Haus zu kriegen und ich sage Ihnen, selbst mit den genehmigten Feldstärken, die man jetzt in Bayern und im WDR-Gebiet fährt, ist es immer noch schwer, mit diesen hochfrequenten Signalen wirklich auf ein Klo zu kommen, wenn ich das mal so salopp sagen darf, das mitten im Haus liegt. Jetzt mal vom Bastelkeller vollkommen zu schweigen. Den werden Sie mit DAB, meiner Ansicht nach, nie erreichen.
W.R. : Wenn ich heutzutage eine Flatrate habe, für das Internet und mache das mit UMTS das geht mittlerweile für 20 Euro, ohne Daten- und Zeitbegrenzung, habe ich jede Menge Radiosender, die ich dort empfangen, in Anführungszeichen, kann.
Dr. Hagen: Ja klar.
W.R. : Sie sind aber der Meinung, habe ich im Gespräch mit Ihnen schon früher geklärt, dass das kein Radio ist.
Dr. Hagen: Nein, also alles was...
W.R. : Wo ist die Abgrenzung für Sie?
Dr. Hagen: Die Abgrenzung ist technisch, ganz einfach. Ein elektromagnetisches Medium wie das Radio, da weiß der Sender niemals, wer das empfängt. Die Frequenzen strahlen aus und senden elektromagnetische Energien, die in irgendeiner Form von einer Antenne, wo auch immer, aufgenommen wird. Und wenn sie nicht aufgenommen werden, dann versickern sie sozusagen irgendwann im Orbit oder sonst wo.
Bei dem Internet ist das eine ganz andere Geschichte. Das Internet ist immer eine IP-Verbindung. Sie haben, egal ob UMTS oder Wireless Lan oder welcher Weg auch immer Sie ins Internet führt, sie haben innerhalb des Internets IP-Connections, und IP heißt, Sie haben eine Adresse und dasjenige was Sie konsumieren, also die Webseite oder den Stream oder was auch immer, hat auch eine IP-Adresse. Das ist jedenfalls der Standard von IP 4, den wir nach wie vor haben. Wenn es irgendwann mal IP 6 geben sollte, flächendeckend im Internet, dann kann man darüber diskutieren, ob eine broadcast-Spezifikation innerhalb dieses Protokolls Broadcast-ähnlich ist. Aber wie gesagt, das ist ja Zukunftsmusik, weil wir IP 6 ja nicht fahren, sondern IP 4.
Und solange es diese, dieses Protokoll gibt, bleibt es dabei, dass die technische Verbindung eindeutig ist. Eine Punkt zu Punkt-Verbindung und das heißt für uns natürlich: Wenn wir streamen, wissen wir immer sehr genau, wie viele Kunden wir gerade haben und... Also, alles was mit dem Internet läuft, lässt sich sozusagen über die Server relativ gut abgreifen, was den Konsum betrifft. Ein Radiosender weiß nie, ob er überhaupt gehört wird.
W.R. : Der öffentlich-rechtliche Gedanke dazu ist das dann der, dass man sagt, es gibt kein Radio wenn wir kein UKW, kein Lang-, Mittel-, Kurzwelle mehr haben?
Dr. Hagen: Das hat mit öffentlich-rechtlich nichts zu tun, sondern das ist, würde ich in meiner Eigenschaft als Medienwissenschaftler anmerken wollen, einfach ein anderes Medium, wenn ich eine Punkt-zu-Punkt-Verbindung habe. Aber ich bin... ich will ja überhaupt nicht in Abrede stellen, dass das Streamen von Hörfunkprogrammen ein sehr guter Zusatzdienst ist. Wenn ich zum Beispiel Reichweitenprobleme überbrücken will. Wenn ich in Zürich bin, am Wochenende, dann gehe ich natürlich ins Netz, mit meinem Laptop und höre mein Hörfunkprogramm, das dort weder UKW noch kabelmäßig übertragen wird - auch nicht Mittelwellen-mäßig - über'n Stream. Aber man muss sich nicht einbilden, dass die Streams der Ersatz für einen Hörfunksender werden.
W.B. : Ja, wenn Sie die auch nur 32 Kilobit stark machen, das ist klar.
Dr. Hagen: Es geht nicht um die Frage der Stärke, sondern es geht um die Frage: Wenn wir den gesamten Empfang von Deutschlandradio Kultur, und das ist wirklich ein Minderheitenprogramm, auf Stream umsetzen wollen, dann könnten wir das nicht mehr bezahlen. Weil Sie wissen, dass im Internet die Währung so ist, dass der Upstreamente, also der der die Daten abgibt, muss zahlen. Der die Daten empfängt muss nichts zahlen. Wenn ich also jetzt Tausend, oder Zehntausend Streams habe, die gleichzeitig laufen, da habe ich Gigabits am Tag.
W.B. : Das wissen wir. Wir haben 300 000 in der Woche Dr. Hagen: Ja wunderschön. Dann wisst Ihr ja was das kostet.
W.B. : Ja, das bezahlen aber andere.
Dr. Hagen: Ja das zahlen andere, schön. Aber ich meine, wir wollen ja nicht anfangen das gesamte Gebührengeld in...
W.B. : Aber ist es für den User denn nicht ganz egal, wenn er seine schöne Musik, meinetwegen Country Musik aus Amerika, übers Netz hört, oder ob er diese Musik in der Luft hört?
Dr. Hagen: Das ist für den User vollkommen egal. Der User der muss ja auch nicht ein Medium definieren.
W.B. : Der User muss Sie doch interessieren.
Dr. Hagen: Wir, in unserem Gespräch, versuchen, ein Medium zu definieren. Der User muss überhaupt nichts definieren. Der braucht einfach nur eben etwas zu hören.
W.B. : Aber Sie brauchen den User doch auch als... Dr. Hagen: Ja sicher W.B. : Ja.
W.R. : Und wenn die Mobilität, die ja nun wirklich in den letzten Jahren im Radio und Fernsehbereich sehr stark gewachsen ist, weiter so zunimmt, dann wird doch das normale Radio sicherlich weiter in den Hintergrund gedrängt. Vor allen Dingen, weil UKW ja nun wirklich regional ist. Das liegt an der Technik, der Ausbreitung, der physikalischen Grundlagen, die wir haben.
Dr. Hagen: Ja.
W.R. : Und dass UKW nur regional sein kann. DVB-S Radio zum Beispiel ist etwas anderes. Das kann ich Europaweit empfangen und IP, auch wenn es für Ihre Begriffe kein Radio ist, auch. Wird diese Welt, diese UKW-Welt, dann nicht relativ klein? Und auch der Werbemarkt, der ja nicht weiter wachsen kann?
Dr. Hagen: Das sind ja mehrere Fragen auf einmal. Also erst mal zum Medium Radio, da gilt es den alten Satz zu beherzigen: The small man listens to the small station . Radio ist sowieso in der Nutzung ein Regionalmedium. Die Leute wollen wissen, mehr oder minder, was um die Ecke passiert - Stichwort Bürgerradios. Die haben ja Erfolg, wenn sie gut gemacht sind und ansonsten gibt es die Landeswellen, die eben in den einzelnen Ländern deutlich zeigen, dass die Leute wirklich wissen wollen was in ihrem Land, in ihrer Gegend passiert. In ihrem und nicht in der Welt insgesamt. Das gilt übrigens teilweise auch für die Internet-Nutzung. Die Werbemarktsituation ist ja die, dass der Hörfunkmarkt zusammenbricht als Werbemarkt, wegen des Online-Marktes. Das sind teilweise zweistellige Prozentsätze pro Jahr, die das zurückgeht. Was uns allen Hörfunkmachern natürlich insgesamt, also auch den öffentlich-rechtlichen, Sorgen machen muss.
W.R. : Ja.
Dr. Hagen: Denn, wenn die Privaten nicht mehr existieren, dann ist das duale System von dieser Seite aus gefährdet.
Jetzt mal zur Nutzung des Hörfunks muss man aber doch noch mal anmerken, dass es nach wie vor immer noch mehr als eine verfassungsgebende Mehrheit des Volkes ist, das täglich etwa 200 Minuten lang, im Durchschnitt dieses Medium, und zwar in der konventionellen Form nutzt.
Deswegen fragen sich natürlich viele, obwohl diese Nutzung bei den jüngeren Menschen zurückgeht, gar keine Frage, liegt sie aber immer noch bei 70%. Obwohl sie schon 10% zurückgegangen ist. Dass sie zurückgeht auf null, das kucken wir uns beide erstmal an. Im Moment sind wir bei 70%. Da sind wir bei der ganzen Internet-Durchdringung noch nicht. Die Internet-Durchdringung liegt etwa bei 60%. Natürlich, bei den Jugendlichen ist sie schon lange erreicht.
Ich glaube einfach nicht, dass hier nicht das alte Medium Hörfunk eine gewisse Trägheit entwickelt, dass glaube ich eben wohl. Und dass es die Trägheit einfach verliert, das glaube ich nicht. Die Trägheit besteht ja darin, die beobachten wir in der Hörfunknutzung, das ist ein Umgebungsmedium. Das nutzt man sozusagen beim Aufstehen, das nutzt man beim Rasieren, das nutzt man bei irgendeiner Tätigkeit, das ist ein Medium, was man nebenbei nutzt wie man so schön sagt. Aber das heißt noch lange nicht, dass man keine Aufmerksamkeit für dieses Medium hat. Und das sind alles Kennzeichen eines Mediums, die das Internet ja nicht hat. Das Internet können sie ja nun wirklich überhaupt nicht als Nebenbei-Medium bezeichnen. Und vielleicht wollen die Menschen ja dieses Medium, das sie nebenbei nutzen, weiter nutzen. Auch wenn sie in die Welt der neuen Medien gehen.
W.R. : Also ich verstehe, dass Sie der Meinung sind, und der Meinung bin ich übrigens auch, dass unser normales UKW-Radio weiter existieren wird. Aber wenn Sie sagen Nebenbei-Nutzung... Das ist im Internet mit der Funktion in meinem Mobilfunktelefon und dem Freisprechen heute genau so schon möglich. Das kann ich also überall benutzen.
Dr. Hagen: Ja ja.
W.R. : Und der Empfang, der ist überall viel besser. Selbst im tiefsten Keller, egal wo ich bin, als vom Radio. Und ich höre meinen Heimatsender in Norwegen ganz genau so gut wie in Italien.
Dr. Hagen: Da haben Sie doch vollkommen recht. Sie verwechseln jetzt immer Übertragungsweg mit Medium. Der Übertragungsweg...
W.B. : Der Inhalt ist doch identisch.
Dr. Hagen: Nein, ist doch nicht... Ja, natürlich ist der Inhalt identisch, weil...
W.R. : Der Inhalt ist identisch, und deshalb ist es für den Endbenutzer doch ziemlich wurst, womit er das hört, auch wenn wir hier darüber sprechen, das eine ist Radio, das andere ist kein Radio.
Dr. Hagen: Also gut, gut, wenn Sie glauben, das können Sie ja gerne tun, dass alle Hörfunksender der Bundesrepublik, das sind, ich sag noch mal, 380 im Moment...
W.R. : Ja.
Dr. Hagen: Das Geld hätten, ihren gesamten Content über's Internet zu verbreiten, ich halte das technisch für nicht unmöglich, genauso wie Sie. Nur das ist praktisch unmöglich. Weil das kein Mensch bezahlen kann. Das ist das Problem.
Sie können nicht einfach davon ausgehen, dass die Upstream-Kosten, die... Nehmen wir mal eins zu eins die Situation vom Deutschlandfunk. Der Deutschlandfunk hat 1,4 Millionen Hörer pro Tag. Mit einer durchschnittlichen Hördauer von 200 Minuten. So, jetzt rechnen wir beide mal aus, was uns das am Tag kosten würde, den Deutschlandfunk nur übers Internet in der gleichen Nutzung an die Menschen zu bringen. Das kann der Deutschlandfunk nicht bezahlen.
Das ist das Problem.
Nicht so sehr das technische Problem, dass das... Internet ist sowieso das Simulationsmedium aller Medien. Alle Medien, die vorher da waren, können durch das Internet, nämlich durch die Computerisierung, simuliert werden. Sie können Fernsehen über das Internet machen, obwohl es kein Fernsehen ist. Sie können Radio übers Internet machen wo's kein Radio ist. Sie können ein Buch schreiben übers Internet obwohl Sie in Wirklichkeit nur bei on... bei google schreiben und gar nicht in ihrem, auf Ihrer Festplatte. Alles egal, alles virtuell, alles wunderschön. Aber wir reden jetzt doch gerade über die Frage, ob das Medium Radio, das nun einmal definiert wird durch elektromagnetische Ausstrahlung, seine Zukunft auch ohne das Internet behält. So habe ich Ihre Frage verstanden...
W.R. : Ja.
Ja.
Dr. Hagen: Und dem würde ich sagen: Ich glaube schon.
W.R. : Es war sehr interessant Ihre Meinung zu hören. Es war sehr interessant, Einblicke zu erhalten, die man vielleicht so nicht allgemein hat. Herr Dr. Hagen, wir sind unterschiedlicher Meinung, aber ich glaube wir sind uns einig, dass UKW-Radio weiterhin existieren wird.
W.B. : Und irgendwann wird man diese Folge, die wir gemacht haben, mal raus holen. Die, unsere Nachkommen werden sagen: Damals, da haben die noch über Radio diskutiert.
W.R. : Wie auch immer.
Dr. Hagen: War das Medium nicht so schlecht. Also ich wünsche Ihnen auch mal ‘nen guten Radioempfang. Hören Sie mal wieder ein Feature. Das kriegen Sie nämlich sonst nirgendwo, in keinem Medium W.R. : Also bei Deutschlandradio höre ich eigentlich am meisten. Ich bin ein Fan davon, weil es für mich immer noch ein Qualitätssender ist und das sage ich nicht aus Schmu sondern weil es die Wahrheit ist. Schönen Tag nach Berlin.
Dr. Hagen: Herzlichen Dank. Bis dann. Tschüss.
[Erkennungsmelodie] W.R. : Wolfgang, kannst Du Dich noch erinnern? So vor 20, 25 Jahren wenn man damals über Akustikkoppler mal so Texte ausgetauscht haben, einmal war das ein irres Gefühl, eine Sensation. Aber an Kompression hat ja keiner gedacht, obwohl es ja damals langsamer ging. Wann ging das eigentlich los, dass man gesagt hat: Wir müssen die Daten, die wir übertragen, komprimieren?
W.B. : Also, das war ja zum Teil so, dass wir froh waren, dass es nicht schneller war. Dass wir das mitlesen konnten, was da über den Plastik... Plastikkoppler wollte ich sagen.
W.R. : Ja waren ja teilweise Plastikkoppler.
W.B. : Was da über den Akustikkoppler da so reinkam.
W.R. : Ja.
W.B. : Denn wir hatten ja kaum Speicher zur Verfügung. Wo sollten wir das hintun.
W.R. : Ja, mit dem Speicher war es dann auch so. Es gab dann irgendwann Komprimierungsprogramme für Festplatten, ja. Das war ja schon irre. Da konnte man selbst in Windows später eingebaut. Erst als Tool und dann eingebaut konnte man die Festplatten komprimieren. Aber das ist ja immer noch ein Thema. Dieses Komprimieren.
W.B. : Ja.
W.R. : Und außerhalb der PCs gibt es dann ja auch noch XML-Komprimierung und du hast da so einen schönen ähnlichen Titel dafür. Wie heißt der?
W.B. : Ja, nee, wir sind wieder verbunden mit Dagstuhl. Mit diesem heißen Seminarveranstaltungen, die zum Teil wöchentlich sind, wo ganz tolle Zukunftsthemen besprochen werden. Der Titel in dieser Woche vom 22. Juni bis zum 27. Juni heißt Structure based compression of complex massive data.
W.R. : Ja, und am Telefon haben wir Professor Stefan Böttcher. Schönen guten Tag.
W.R. : Von der Universität Paderborn.
W.B. : Die uns ja auch sehr, sehr nahe liegt. Durch unsere Nächte, die wir dort veranstaltet haben.
Pr. Bö. : Ja, schönen guten Tag.
W.B. : Um was geht's denn da mit diesem XML? Ist da zip. Zip ist ja auch so eine schöne schöner Komprimierer. Ist da zip zu schlecht dafür, für XML zu komprimieren?
Pr. Bö. : Ja, letztendlich gibt es andere Verfahren, die da noch besser sind. Aber ich kann kurz sagen, worum es bei XML überhaupt geht. XML ist ein Datenformat was zum Austausch benutzt wird zwischen großen Datenmengen zwischen Unternehmen. Also typischerweise, wenn wir Produktkataloge haben, wenn wir Angebote haben, dann werden diese Produktkataloge auf der Client-Seite in XML dargestellt und auf der Server-Seite eben auch. Und XML ist das Austauschformat wo ich mit meinem Kunden die Daten austausche.
W.B. : Das war früher mal Pdf, nicht?
Pr. Bö: Pdf ist eigentlich eher für Dokumente. Und zwar für Dokumente, die ich drucken kann. Aber wenn ich Nutzdaten habe, Unternehmensdaten habe, dann ist das in XML soweit ich die Gelegenheit habe, oder die Möglichkeit habe, die Daten zu strukturieren nach meinem eigenen Bedürfnissen.
Anders als, sagen wir mal in relationalen Datenbanken, wo ich völlig rechteckige Tabellen habe, habe ich eben bei XML die Möglichkeit ja mehr zu den Daten dazu zu schreiben zu den einzelnen Datensätzen und zwar jeweils das, was für den Kunden relevant ist. Also wenn ich Angebote habe, wenn ich Aufträge beschreiben will, wenn ich Kunden beschreiben will, dann kann ich eben unterschiedlich viele Informationen, unterschiedlich strukturierte Informationen über einzelne Kunden oder Aufträge in XML darstellen.
Also von daher ist das Datenformat flexibler als das, was ich sonst zur Verfügung habe mit zum Beispiel relationalen Daten. In diesem Seminar in Dagstuhl geht es eben insbesondere da auch darum, auch diese Dateien zu komprimieren, weil die Daten zu groß sind oder als zu groß angesehen werden zum Austausch zwischen verschiedenen Computerprogrammen.
W.B. : Das heißt wie groß?
Pr. Bö. : Groß ist je nach Applikation. Das kann mehrere Megabytes sein. Also im Moment können wir eben auch Dateien, die ein paar hundert Megabytes sind, sehr gut komprimieren. Zum Beispiel, wenn man nur die Struktur komprimieren möchte, kann man Faktor hinkriegen zu also um das zwanzigfache verkleinern also auf 5% der originalen Größe.
W.B. : 5 Megabyte.
Pr. Bö. : Das ist ohne weiteres möglich. Und das... für die Struktur. Schwieriger ist es mit der String-Kompression, das sind extra Algorithmen. Das Kunststück ist aber, wenn man das komprimiert hat, dann sind die Daten so klein, dass man dann noch in diesen komprimierten Daten schnell das findet, was jemand sucht. Also man möchte ja auch, dafür ist XML eben auch gut, man möchte Anfragen unterstützen zum Beispiel mit Standardsprachen wie X-Path möchte man besonders schnell und effizient die richtigen Daten finden und das Kunststück ist, dass man das noch tun kann auf komprimierten Daten.
W.B. : Das wird also nicht dekomprimiert, sondern Sie arbeiten dann mit diesen komprimierten... Pr. Bö. : Genau.
W.B. : Dateien weiter.
Pr. Bö. : Genau.
Und dann das Modell dazu ist, dass diese Daten im Grunde genommen von einem Unternehmen zum nächsten geschickt werden können in komprimierter Form. Sie können in komprimierter Form gelesen werden, ausgewertet werden, Teile können extrahiert werden und die Idee ist, dass man die benötigten Teile dann an ein anderes Programm schickt, oder in ein anderes Unternehmen, möglichst ohne zu entpacken. Und genau das ist sozusagen die Herausforderung, dass man weiterhin auf kleinen Daten schnell und effizient arbeiten kann. Dass man sie zum Beispiel auch in mobile Geräte laden kann, so dass man sie dann eben auch im Cache halten kann und damit arbeiten kann.
W.R. : Und wie ist es möglich, einfach zu erklären, wie so eine Komprimierung funktioniert?
Pr. Bö. : Also eine XML Datei ist so strukturiert, dass man Inhalte beschreibt durch Mark-Up, also durch Namen. Hier beginnt die Informationen über einen Kunden, einen Auftrag, einen Teil.
Ein Kompressionsverfahren ist, dass man dieses Mark-Up, oder diese Tags, durchnummeriert. Kunde wird 1, Auftrag wird 2, Teil wird 3 und man speichert dann nur ganz kurze Nummern statt der Tags. Und so hat man das sehr große Mark-Up schon mal sehr klein nummeriert.
Eine zweite Sache ist, dass normalerweise jeder Kunde einen Auftrag erteilt, mindestens einen oder mehrere und dass die Aufträge Teile umfassen und dass man auf diese Weise sagen kann: Wenn ich die Struktur voraussagen kann, dann benutze ich Strukturinformation, wie so ein Dokument strukturiert sein muss, um das ebenfalls abzuziehen von so einem Dokument und übrig bleibt nur das Komprimat. Also, Beispiel ist, wenn Kunden Aufträge haben, dann werde ich gar nicht mehr speichern, dass die Aufträge haben, sondern das weiß ich. Und bei einem Verfahren, was wir entwickelt haben und jetzt auch zur, das Patent angemeldet haben, wird einfach nur noch gezählt wie viele Aufträge zum Kunden gehören und nur diese Zahl wird gespeichert. Und das ermöglicht eine erhebliche Verdichtung der Daten, weil ich bestimmte Tags, bestimmte Informationen, gar nicht mehr speichern muss.
Ein drittes Verfahren ist, dass man gemeinsame Teilbäume, die mehrfach auftauchen, nur einmal speichert. Also wenn ein Teil bestimmte Informationen hat, die zu dem bestellten Teil gehören, dann würde ich diese Informationen nicht immer wieder wiederholen, sondern nur einmal speichern und mehrfach verwenden. Und so ist es eben. Diese XML-Daten sind an sich Baumstrukturiert, dass ich diese Bäume von mehreren Stellen aus aufrufen kann und von mehreren Stellen aus wiederverwenden kann, statt sie erneut zu codieren. Das ist ein weiteres Verfahren.
Und hier auf dem Seminar befassen wir uns noch mit einem Verfahren, was darauf aufbauend ist. Da geht es eben um Grammatik-basierte Kompressionen. Also da geht es darum, nicht nur solche Teile zusammenzufassen, die identisch sind, sondern auch solche Teile zusammenzufassen, die fast identisch sind, die ähnlich sind. Und die Idee ist, dass man ja von fast identischen Mustern die identischen, gemeinsamen Teile nur einmal speichert und nur die Differenzen oder die Unterschiede speichert.
W.B. : Wenn Sie das so erzählen, dann klingt das ganz einfach, was Sie da machen. Ich glaube, dass da gehört viel Schmalz dazu das was man da vergeuden muss um diese... Pr. Bö: Ja.
W.B. : ...Kompressionsmöglichkeiten herauszufinden. Kann es denn sein, dass wir in Zukunft nur noch komprimierte Dateien haben, wenn wir die nicht dekomprimieren müssen. Können die Dateien doch alle kleiner werden.
Pr. Bö. : Ja.
Ich gehe mal davon aus, dass ein ganz großer Trend hin sein wird diese Dateien komprimiert aufzubewahren und komprimiert auszutauschen. Gerade weil auch Übertragungszeiten eben reduziert werden können, Übertragungsvolumina reduziert werden können und wenn wir an Geräte denken wie mobile Geräte, wenn wir an Sensornetzwerke denken, dann ist ja ganz entscheidend, dass man die Batteriekapazität schont und dann ist es unbedingt ein Vorteil, wenn Sie nur komprimierte Daten austauschen. Und letztendlich gibt's nur im letzten Schritt, wo ein Besucher wirklich etwas angezeigt haben will, darum, dass man Daten wirklich dekomprimiert. Und alle anderen könnten komprimiert, die könnten sogar komprimiert erfasst werden, also könnten gleich bei der Erfassung komprimiert werden und gar nicht mehr künftig im nachhinein komprimiert werden. Von daher spricht vieles dafür, zu sagen: Ja, wir tauschen im wesentlichen komprimierte Daten aus.
W.R. : Wo ist denn die Schwierigkeit wenn ich jetzt komprimierte Daten habe und ich will da drin etwas suchen?
Pr. Bö. : Ja, die Schwierigkeit ist, dass man das Kompressionsmuster verstehen muss und das unterscheidet sich jetzt sehr nach der Art des Kompressionsmusters wo die Schwierigkeiten wirklich liegen.
Vielleicht fange ich mal an mit dem Verfahren was gemeinsam strukturierte Daten nur einmal speichert. Das ist diese D-Kompression also gemeinsame Teilbäume werden nur einmal gespeichert. Das hat den Riesenvorteil, dass ich diese gemeinsam benutzten Teilbäume auch nur einmal durchsuchen muss, ja. Also von daher ist es zunächst einmal ein Riesenvorteil und eine Optimierung. Trotzdem muss ich, wenn ich ja zwei Wege habe, wie ich zu den Daten gekommen bin, muss ich mir merken, welchen Weg ich gekommen bin, weil ich unter Umständen auf diesem Weg zurück muss. Und nach dem, ja, nach dem nächsten Knoten suchen muss.
Ich sag mal ein praktisches Beispiel. Wir haben zwei verschiedene Aufträge, die von dem selben Kunden erstellt worden sind und die Information zum Kunden ist die Selbe beim zweiten Auftrag wie beim ersten. Was wir machen werden ist, dass wir beim zweiten Auftrag sagen: Ja, den Kunden hatten wir schon und anschließend kommen eben die Spezifika zu dem Auftrag. Und was wir jetzt machen müssen, wenn wir das komprimiert haben und suchen. Wir müssen uns einfach merken: Sind wir beim ersten Auftrag oder beim zweiten Auftrag damit wir dem Kunden auch das richtige schicken. Also, es geht sozusagen darum, aus diesen komprimierten Daten dann genau so gut suchen zu können und je nach Kompressionsverfahren kann das beliebig viel schwieriger werden, so will ich das mal sagen, aus den komprimierten Daten noch Dinge effizient zu finden. Über den dicken Daumen kann man sagen, je stärker ein Verfahren komprimiert, desto schwieriger wird es darin effizient auch noch etwas zu finden und von daher ist das so ein Trade off. Ich kann eben entweder besser komprimieren oder ich kann schneller suchen.
W.B. : Also ich glaube wir brauchen gar nicht zu erwähnen, dass dieses Verfahren verlustfrei dekomprimiert werden kann.
Pr. Bö. : Ja.
Ja, das ist auch ein wichtiger Punkt. Verlustfrei bedeutet eben, dass ich das Originaldokument eins zu eins wieder herstellen kann. Oder wenn ich Anfragen drauf stelle, dass ich keine Verluste habe, sondern dass ich wirklich die vollständige Information bekomme. Und das ist heute unbedingt das Ziel. Das halte ich auch für wichtiger als verlustfreie Komprimation.
W.B. : Wieder sehr interessant was da aus Dagstuhl berichtet wurde. Ich glaube, wir können jetzt die Festplattenleute für ein halbes Jahr in Urlaub schicken, denn Sie komprimieren alles so stark, dass die ein bisschen Zeit haben mit ihren Gigabyte.
W.R. : Oder Terabyte.
Pr. Bö. : In dem Moment, wo der Hauptspeicher größer wird, können wir natürlich mehr im Hauptspeicher machen. Trotzdem, sind... steigt das Datenvolumen dermaßen an, dass auch der Bedarf weiter an Festplatten bestehen wird und es wird natürlich auch deswegen weiterhin einen Riesen-Bedarf geben an Kompression. Und das ist noch ein Punkt, der sehr für XML-Kompression spricht. XML ist eine gute Möglichkeit, riesengroße Datenbestände zu strukturieren. Wenn ich sonst riesengroße Datenbestände habe, habe ich keine Struktur drauf, keine Einstiegspunkte. Und gerade durch XML kann ich, durch Tags eben sehr gut Einstiegspunkte strukturieren und kann viel besser drauf suchen. Und auch das spricht dafür, dass XML-Dokumentation durch Kompression wird.
W. B.: Ist das auch so für die deutsche Nationalbibliothek?
Pr. Bö. : Ich denke, es ist für Bibliotheken sehr wichtig. Es ist für Banken extrem wichtig weil die eben mit dem Sepa-Standard jede Menge komprimierter Daten haben und zum Beispiel auch gerade diese Bankdaten das sind Massendaten und die können Sie eben erheblich besser komprimieren durch ein entsprechendes Verfahren.
W.B. : Ja, vielen Dank. Wenn man mein Bankkonto komprimieren will, da kommt nicht viel bei raus. Hat man mit einem Byte geschafft.
W.R. : Professor Stefan Böttcher von der Universität Paderborn, herzlichen Dank für diesen Einblick in eine Sache, die für den PC-Benutzer nicht normal ist. Schönen Tag noch.
Pr. Bö. : Ja, vielen Dank. Schönen Tag hier noch. Auf Wiederhören.
[Erkennungsmelodie] W.R. : Ja, der Kollege Back sitzt hier, guckt mich groß an. Ich guck ihn groß an. Wir sind schon wieder am Ende der Sendung. Haben gar nicht mehr so viel Zeit und gar nicht mehr so viel zu sagen. Was sagen wir denn?
W.B. : Haben nun mal eine eigene Meinung, würde ich sagen. Und die ist ein bisschen konträr so vom Gesprächspartner.
W.R. : Ist ja auch klar herausgekommen.
W.B. : Mir ist ganz egal, wo ich Radio höre und was dahinter für eine Technik ist. Die Hauptsache ich höre es gut und der Inhalt ist vor allem gut.
W.R. : Jetzt kann man natürlich sagen, wenn du was hörst je nachdem welches Medium du hörst, dass es kein Radio ist, obwohl es sich anhört wie Radio. Aber lassen wir das. Das haben wir W.B. : Wir haben ja auch schon was über virtuelle Realität gemacht. Dann ist es ein...
W.R. : Virtuelles Radio.
W.B. : Ein virtuelles W.R. : Um allen gerecht zu werden. Es wird ein virtuelles Realitätsradio aus der Feder des Herrn Back. Und jetzt den Daumen hoch, Herr Back, zick-zacke, hoi, hoi, hoi.
W.B. : Und... ebüpppp [Erkennungsmelodie] Das war Computerclub 2, das Technikmagazin mit Wolfgang Back und Wolfgang Rudolph. Technik: Manfred Kloiber und Arne Wohlgemut Produktion: Anja Arp Eine Internet-Sendung der VoxMundi Medienanstalt Köln 2008