Berlin
Technische Universität Berlin Gesellschaft für Informatik e.V.
41. Jahrestagung, Gesellschaft für Informatik e.V. (GI), Berlin
Informatik 2011 > Programm > Workshops > Artikel

Datenintegration im Web mit vernetzten Daten

Andreas Harth, Denny Vrandecic

Abstract: Das Tutorial gibt einen Überblick über Inhalte und Techniken von vernetzten Daten (Linked Data). Das World Wide Web entwickelt sich von einem Medium der Dokumente zu einem Medium der Daten. In den letzten Jahren werden vermehrt Daten nach den von Tim Berners-Lee postulierten "Linked Data'' Prinzipien veröffentlicht, von Organisationen wie der Deutschen Nationalbibliothek oder der New York Times bis hin zu kleinen Gruppen und Privatpersonen. In der sogenannten "Linking Open Data Cloud'' sind dutzende Datensätze verzeichnet; der gesamte Datenbestand beläuft sich auf Milliarden von Datenelementen und wächst ständig. Die Prinzipien sind begründet in der Architektur des Web, und basieren auf Standards wie dem Hypertext Transfer Protocol (HTTP), Universal Resource Identifiers (URI), dem Resource Description Framework (RDF) und (optional) der Anfragesprache SPARQL. Die Prinzipien stellen einen einheitlichen Rahmen zur Publikation von und zum Zugriff auf Daten dar. Durch die Vernetzung der Daten wird es möglich, dezentral Daten zu publizieren, und die derart publizierten Daten miteinander zu verknüpfen. Das Tutorial behandelt die Grundlagen vernetzter Daten, geht auf etablierte Praktiken zum Veröffentlichen dieser Daten ein, und zeigt anhand von Fallstudien, wie diese Daten in Anwendungen integriert, angefragt und visualisiert werden können.