Adresse und Kontakt AG Netzbasierte Informationssysteme
Königin-Luise-Straße 24-26
14195 Berlin
Tel.: +49-30-838-75221
Fax: +49-30-838-75220
|
Die Analyse der Nutzung von Webseiten stellt schon heute eine wichtige Grundlage für bedarfsorientierte Angebote im Web dar. Kommen die Technologien des Semantic Web zur Anwendung, wird diese Analyse ungleich schwieriger, weil reine HTTP-Antworten des Servers zum Beispiel keine Aussage darüber zulassen, ob und welche Daten durch eine SPARQL-Anfrage an einem Endpoint gefunden wurden. Für die Betreiber von semantischen Datenrepositories verbergen sich aber hinter ebendiesen Infomrationen interessante Rückschlüsse auf die Qualität der Daten im Bezug zu den Anforderungen der Nutzer bzw. der Anwendungen, die diese Daten nutzen. Im Rahmen eines Promotionsvorhabens wurde eine Methode zur Sammlung solcher Nutzungsinformationen entworfen und implementiert und es liegen erste Beispieldaten über die Nutzung des DBpedia 3.3 Datensets vor.
Im Rahmen dieser Arbeit sollen nun die Beispieldaten und die ihnen zugrunde liegenden Ontologien durch eine Erweiterung der quelloffenen Software SONIVIS als Netzwerk visualisiert werden. Darüberhinaus sollen, ebenfalls für das SONIVIS Tool, Metriken entworfen und implementiert werden, die unterschiedliche Sichten auf diese Netzwerke ermöglichen. Ein Beispiel hierfür wären sogenannte Heat Maps, d.h. eine Visualisierung, die anhand der Anfragehäufigkeit Konzepte der Ontologie größer oder kleiner darstellt.
Art
Bachelor- oder Studienarbeit
Voraussetzungen
Kenntnisse in Programmierung mit Java und dem Umgang mit Eclipse. Kenntnisse in RCP Entwicklung von Vorteil. Verständnis von Semantic-Web-Technologien (insbes. RDF, Ontologien)
Betreuer
Dipl.-Inform. Markus Luczak-Rösch
Die Requests for Comments, RFCs definieren die Standards des Internet. Der Korpus dieser Dokumente liegt in verarbeitbarer und weit regulierter Form vor.Dokumente sind in verschiedene Kategorien eingeordnet.
Aufgabe dieser Arbeit ist die Erfassung und Analyse des kompletten RFC Korpus als Netzwerk. Beziehungen darin umfassen die definierten und in Metadaten erfassten “Obsoletes xxx”, “Obsoleted by xxx”, “Updates xxx”, “Updated by xxx” aber auch das durch Referenzen sich ergebende Zitationsnetzwerk zu weitern RFCs einerseits und zu externen Quellen andererseits.
In der Arbeit soll eine Erfassung der vorliegenden RFC Dokumente erfolgen, eine Extraktion der Beziehungen zu anderen Dokumenten und Standards sowie eine Analyse der sich ergebenden Netzwerkstruktur mit Hilfe eines Werkzeugs wie SONIVIS erfolgen.
Art der Arbeit: Studien- oder Bachelorarbeit
Voraussetzungen: Kenntnisse in einfacher Textextraktion, Netzwerken, Statistik
Betreuer: Prof. Robert Tolksdorf
Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Der weltweite Kunstmarkt ist sehr lose organisiert. Relevante Rollen sind die Künstler mit ihren Werken und Auktionshäuser, die Werke von Künstlern auf dem sog. 2. Markt an Museen und Sammler versteigern. Kunstauktionen werden mittlerweile von umfangreichen Online-Katalogen begleitet, die Gebotsabgabe über das Internet ist möglich und auch Ergebnislisten werden online bereitgestellt. Aufgrund der individuellen Insellösungen von Auktionshäusern ist es aber kaum möglich sich einen vollständigen Überblick zu Inhalt und Struktur des Kunstauktionsmarkts zu bilden. Kommerzielle Dienste wie artprice.com oder artfacts.net sind vergleichsweise hochpreisig.
In dieser Arbeit sollen Informationen über in Auktionen gehandelte Werke und deren Künstler ermittelt und mit Hilfe einer Netzwerkanalyse Strukturen des 2. Markts identifiziert werden. Verzeichnisse von Auktionshäusern wie von kunstmarkt.com erfassen relevante Sites und liefern Ausgangspunkte für einen Crawler, der beispielsweise auf einem Rahmenwerk wie beispielsweise SMILA oder Nutch basiert und vielleicht an einen Screen Scraper wie scrapy angeschlossen ist. Aus Online-Katalogen sollen angebotene Künstler und Werke extrahiert werden und geeignet ein Netzwerk erstellt werden. Mit dem Tool SONIVIS sollen dann Analysen zu Netzwerkeigenschaften durchgeführt werden und deren Ergebnisse sowie das Werke-Künstler-Auktionshaus-Netzwerk online dargestellt werden. Sämtliche Software ist unter die BSD oder Apache Lizenz zu stellen.
Art der Arbeit: Diplom- oder Masterarbeit
Voraussetzungen: Kenntnisse in grundlegenden Web-Technologien und Netzwerken
Betreuer: Prof. Robert Tolksdorf
Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Der weltweite Kunstmarkt ist sehr lose organisiert. Relevante Rollen sind die Künstler mit ihren Werken, Galerien die die Werke von Künstlern auf dem sog. 1. Markt vermarkten sowie Museen und private Sammler die Werke ankaufen sowie weiter Intermediäre die Öffentlichkeit herstellen. Künstler, Galerien und Museen haben in den letzten Jahre erkannt, dass ihre Online-Repräsentanzen notwendig für das Funktionieren des Kunstmarkts sind. Aufgrund der sehr losen Organisation ist es aber kaum möglich sich einen vollständigen Überblick zu Inhalt und Struktur des Kunstmarkts zu bilden.
In dieser Arbeit sollen mit Hilfe einer Netzwerkanalyse solche Strukturen identifiziert werden. Als Künstler sollen dabei jene gelten die von deutschen oder deutschsprachigen Galerien vertreten werden. Dazu müssen die verteilt vorliegenden Online-Informationen geeignet analysiert werden. In der Arbeit ist dies durch einen Crawler zu automatisieren, der auf einem Rahmenwerk wie beispielsweise SMILA oder Nutch basiert und vielleicht an einen Screen Scraper wie scrapy angeschlossen ist.
Galerieverzeichnisse wie bei artfacts oder beim Bundesverband Deutscher Galerien und Editionen e.V. müssen geeignet analysiert werden um Listen mit Netzadressen von Galerien zu ermitteln. Auf den Galerie-Sites muss dann durch eine Heuristik die Liste der von der Galerie vertretenen Künstler ermittelt werden. Aus diesen Informationen – eventuell angereichert um Metainformationen wie Stilrichtung des Künstlers oder Schwerpunkt der Galerie – soll geeignet ein Netzwerk erstellt werden. Mit dem Tool SONIVIS sollen dann Analysen zu Netzwerkeigenschaften durchgeführt werden und deren Ergebnisse sowie das Künstler-Galerie-Netzwerk online dargestellt werden. Sämtliche Software ist unter die BSD oder Apache Lizenz zu stellen.
Art der Arbeit: Diplom- oder Masterarbeit
Voraussetzungen: Kenntnisse in grundlegenden Web-Technologien und Netzwerken
Betreuer: Prof. Robert Tolksdorf
Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Gesetzes- und Verordnungstexte sind von teilweise hoher Komplexität geprägt. So verlangt die Allgemeine Verwaltungsvorschrift zur Bestimmung der Formblätter nach § 46 Abs. 3 des Bundesausbildungsförderungsgesetzes (BAföG-FormblattVwV 2008): “An den mit einem Stern gekennzeichneten Stellen der Versicherung des Erklärenden in Formblatt 3 Seite 4 Spiegelstrich 5 sind die Bedarfssätze nach § 12 Abs. 1 Nr. 1 des Gesetzes, nach § 12 Abs. 2 Nr. 2 und Abs. 3 in Verbindung mit § 13a Abs. 1 und Abs. 2 des Gesetzes, nach § 13 Abs. 1 Nr. 1 in Verbindung mit Abs. 2 Nr. 1 des Gesetzes und nach § 13 Abs. 1 Nr. 2, Abs. 2 Nr. 2 und Abs. 3 in Verbindung mit § 13a Abs. 1 und Abs. 2 des Gesetzes nach dem Bundesausbildungsförderungsgesetz in der zu Beginn des Bewilligungszeitraums, für den Ausbildungsförderung beantragt wird, maßgeblichen Höhe einzusetzen.”
Bei genauerer Betrachtung lassen sich in Gesetzestexten Verweisnetzwerke zwischen Gesetzen, Paragraphen oder Absätzen feststellen. In der Arbeit soll untersucht werden ob die Eigenschaften dieses Netzwerks charakteristisch für bestimmte Klassen von Gesetzen und Verordnungen sein können.
Dazu sollen die online verfügbaren Gesetze und Verwaltungsvorschriften des Bundes (gegebenenfalls auch von Ländern) syntaktisch auf Verweise analysiert werden um sie als Netzwerke zu repräsentieren. Mit Hilfes des Werkzeugs SONIVIS sind geeignete Netzwerkmetriken zu ermitteln und zu überprüfen ob wie beschrieben aus den strukturellen Eigenschaften heraus Aussagen über die Art oder gar dem Inhalt der Vorschrift ableitbar sind. Die Resultate der Analyse sollen in einem Online-Dienst bereitgestellt werden.
Art der Arbeit: Studien- oder Bachelorarbeit
Voraussetzungen: Kenntnisse in einfacher Textextraktion, Netzwerken, Statistik
Betreuer: Prof. Robert Tolksdorf
Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Webrings sind eine sehr alte Struktur im Web mit der thematisch ähnliche Sites über ein externes Navigationselement verknüpft werden sollen. In der Arbeit soll statistisch geprüft werden ob dies erreicht wird.
Ausgehend vom Verzeichnis von Webrings bei www.webring.com soll zunächst die Strukturen von Webrings (Größe und Konnektivität) analysiert werden. Weiterhin sollen jeweils miteinander verbundene Site auf Ähnlichkeit überprüft werden (Indexierung z.B. mit Lucene und Berechnung des Dokumentenabstands) sowie die Auswirkung auf die Popularität der verbundenen Sites anhand ihres Pageranks (statischer Vergleich des Pageranks innerhalb des Webrings mit dem vondurch google als ähnlich identifizierten Sites ausserhalb des Webrings) analysiert werden.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Web Technologien, Information Retrieval, Netzwerke
Betreuer
Prof. Robert Tolksdorf
Weitere Informationen
Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Die Analyse von Netzwerken (Network Science) ist ein expandierender Wissenschaftsbereich der verschiedenste Grundlagengebiete (Physik, Mathematik), Anwendungsbereiche (Biologie, Ökonomie, Lebenswissenschaften) und die Informatik zusammenbringt. Grundlage jeder Analyse sind Netzwerke aus verschiedensten Gebieten. Dabei besteht die Hoffnung, gebietsübergreifende Erkenntnisse zu gewinnen sowie eine methodische Konvergenz zu erreichen.
Notwendig ist dafür ein leichter Zugang zu Rohdaten von Netzwerken, zu Analyseergebnissen davon sowie zu Metadaten über die Analysen. In der Arbeit soll ein Informationssystem gebaut werden, das in möglichst reicher Form eine solche Infrastruktur für Netzwerkforschung bereitstellt und über bisherige Versuche wie der Sammlung bei der Network Workbench, der Data Sources Sammlung der INSNA oder das Visual Analytics Benchmarks Repository hinaus geht.
Das zu erstellende Informationssystem soll eine Ontologie der Domäne Netzwerkanalyse verwenden, Metadaten zu weiteren Ontologien klassifizieren. Es soll möglich sein, Netzwerkdaten oder Verweise darauf einzustellen, wozu entsprechende Metadatenschemata zu entwickeln sind. Weiterhin sollen Forschungsergebnisse direkt oder als Verweis eingestellt werden können. In der Arbeit soll weiterhin ein Mechanismus zur automatischen Integration schon vorhandener Informationen realisiert werden. Schließlich soll das Informationssystem mit einer reichen Nutzerschnittstelle versehen sein um einen einfachen Zugang zu realisieren.
Art der Arbeit
Diplom- oder Masterarbeit
Voraussetzungen
Kenntnisse in Netzwerkanalyse, Netzbasierten Informationssystemen
Betreuer
Prof. Robert Tolksdorf
Weitere Informationen
Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Wordpress ist eine sehr populäres CMS für Blogs. Dabei können Inhalte mit Kategorien und Tags markiert werden um ihre inhaltliche Ausrichtung zu beschreiben. Allerdings gibt es bislang keine Systematik für diese Kategorisierung und man kann sich nicht auf externe Kategoriensysteme beziehen.
Die Arbeit soll Technologien des Semantic Web dafür nutzen. So soll man sich als Autor bei der Auswahl von Tags und Kategorien auf eine externe Ontologie nach Semantic Web Standards beziehen können oder beim Editieren semantische Microformate verwenden können. Nach außen soll eine semantische Suche für Nutzer angeboten werden sowie Metadaten zu einem Blog als RDF anfragbar sein. Weitere Einsatzmöglichkeiten zu Semantischen Technologien in Wordpress sind abzustimmen.
Zu erstellen ist ein Wordpress Plugin, dass sich in die bislang kurze Liste semantischer Wordpress Erweiterungen einreiht. Das Plugin ist unter eine LGPL Lizenz zu stellen.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Semantic Web, Web Technologien
Betreuer
Prof. Robert Tolksdorf
Weitere Informationen
Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Über auf CD veröffentlichte Musik liegen Metadaten bezüglich der Künstler und der aufgenommenen Titel vor. Die freedb ist eine quelloffene Datenbank von ca. 2,8 Millionen CDs mit ca. 42 Millionen Titeln, teilweise in 11 Genres klassifiziert.
Es ergibt sich ein Netzwerk aus Künstlern und aufgenommenen Songs. In der Arbeit soll die freedb entsprechend aufbereitet und einer Netzwerkanalyse unterzogen werden. Dabei sollen Fragen beantwortet werden wie: Welche Songs wurden von mehreren Künstlern aufgenommen, welche Künstler nehmen viele Songs auf die auch andere aufnehmen, gibt es Künstlergruppen deren Aufnahmen sich überlappen, sind diese Maße spezifisch für Genres? Weiterhin sollen anhand der unterschiedlichen Snapshots der freedb Datenbank Fragen zur Dynamik des Künstler-Song-Netzwerks beantwortet werden: Welche Songs werden zunehmend gecovered, gibt es einen signifikanten Zusammenhang mit bestehenden ähnlichen Künstlergruppen? Weitere, ähnliche Fragestellungen sollen in der Arbeit entwickelt werden.
Zur Netzwerkanalyse soll ein geeignetes Werkzeug, bevorzugt SONIVIS verwendet werden. Die Resultate der Analyse sollen in einem Online-Dienst bereitgestellt werden.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Datenbankanwendungen, Netzwerkanalyse, Netzbasierten Informationssystemen.
Betreuer
Prof. Robert Tolksdorf
Weitere Informationen
Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
Informationen über wissenschaftliche Konferenzen in der Informatik und anderen Wissenschaften sind im Netz nur schlecht erschließbar. Neben den völlig verstreut angebotenen eigentlichen Konferenzankündigungen und Aufrufen zur Beitragseinreichung gibt es verschiedene Angebote mit Sammlungen solcher Informationen. So wollen z.B. allconferences.com oder goingtomeet.com möglich alle Konferenzen erfassen, während Fachverbände wie die IEEE, die ACM oder die GI jeweils informatikspezifische Kalender anbieten.
Wissenschaftler möchten die Anfrage “Auf welchen Konferenzen kann ich meine Arbeit im Themenbereich X, Y und Z einreichen” einfach von einer Suchmaschine beantwortet bekommen. Eine solche Suchmaschine existiert bislang aber nicht.
In der Arbeit soll ein Rahmenwerk geschaffen und exemplarisch für informatische Themen realisiert werden mit dem aus unterschiedlichen Quellen erschlossene Konferenzankündigungen Informationen über die jeweils geforderten Themen ermittelt werden und auf dieser Basis die obige Anfrage präzise und umfassend beantwortet werden kann. Dabei soll eine Ontologie für die Themenklassifikation sowie eine semantische Suche genutzt werden.
Das Rahmenwerk soll exemplarisch für Konferenzen aus der Informatik realisiert werden, gleichzeitig aber so allgemein sein, dass leicht eine Suchmaschine für andere Disziplinen (z.B. Elektrotechnik, Mathematik) oder andere Veröffentlichungsarten (z.B. wissenschaftliche Zeitschriften) konfiguriert werden könnte. Die zu erstellende Software soll als LGPL lizensiert sein.
Art der Arbeit
Diplom- oder Masterarbeit
Voraussetzungen
Kenntnisse in Web-Technologien und Semantic Web
Betreuer
Prof. Robert Tolksdorf
Weitere Informationen
Sprechstundentermin bei Prof. Robert Tolksdorf nehmen
|
|