Aufgabe dieser Arbeit ist die Erfassung und Analyse des kompletten RFC Korpus als Netzwerk. Beziehungen darin umfassen die definierten und in Metadaten erfassten “Obsoletes xxx”, “Obsoleted by xxx”, “Updates xxx”, “Updated by xxx” aber auch das durch Referenzen sich ergebende Zitationsnetzwerk zu weitern RFCs einerseits und zu externen Quellen andererseits.
In der Arbeit soll eine Erfassung der vorliegenden RFC Dokumente erfolgen, eine Extraktion der Beziehungen zu anderen Dokumenten und Standards sowie eine Analyse der sich ergebenden Netzwerkstruktur mit Hilfe eines Werkzeugs wie SONIVIS erfolgen.
Art der Arbeit: Studien- oder Bachelorarbeit
Voraussetzungen: Kenntnisse in einfacher Textextraktion, Netzwerken, Statistik
Der weltweite Kunstmarkt ist sehr lose organisiert. Relevante Rollen sind die Künstler mit ihren Werken und Auktionshäuser, die Werke von Künstlern auf dem sog. 2. Markt an Museen und Sammler versteigern. Kunstauktionen werden mittlerweile von umfangreichen Online-Katalogen begleitet, die Gebotsabgabe über das Internet ist möglich und auch Ergebnislisten werden online bereitgestellt. Aufgrund der individuellen Insellösungen von Auktionshäusern ist es aber kaum möglich sich einen vollständigen Überblick zu Inhalt und Struktur des Kunstauktionsmarkts zu bilden. Kommerzielle Dienste wie artprice.com oder artfacts.net sind vergleichsweise hochpreisig.
In dieser Arbeit sollen Informationen über in Auktionen gehandelte Werke und deren Künstler ermittelt und mit Hilfe einer Netzwerkanalyse Strukturen des 2. Markts identifiziert werden. Verzeichnisse von Auktionshäusern wie von kunstmarkt.com erfassen relevante Sites und liefern Ausgangspunkte für einen Crawler, der beispielsweise auf einem Rahmenwerk wie beispielsweise SMILA oder Nutch basiert und vielleicht an einen Screen Scraper wie scrapy angeschlossen ist. Aus Online-Katalogen sollen angebotene Künstler und Werke extrahiert werden und geeignet ein Netzwerk erstellt werden. Mit dem Tool SONIVIS sollen dann Analysen zu Netzwerkeigenschaften durchgeführt werden und deren Ergebnisse sowie das Werke-Künstler-Auktionshaus-Netzwerk online dargestellt werden. Sämtliche Software ist unter die BSD oder Apache Lizenz zu stellen.
Art der Arbeit: Diplom- oder Masterarbeit
Voraussetzungen: Kenntnisse in grundlegenden Web-Technologien und Netzwerken
Der weltweite Kunstmarkt ist sehr lose organisiert. Relevante Rollen sind die Künstler mit ihren Werken, Galerien die die Werke von Künstlern auf dem sog. 1. Markt vermarkten sowie Museen und private Sammler die Werke ankaufen sowie weiter Intermediäre die Öffentlichkeit herstellen. Künstler, Galerien und Museen haben in den letzten Jahre erkannt, dass ihre Online-Repräsentanzen notwendig für das Funktionieren des Kunstmarkts sind. Aufgrund der sehr losen Organisation ist es aber kaum möglich sich einen vollständigen Überblick zu Inhalt und Struktur des Kunstmarkts zu bilden.
In dieser Arbeit sollen mit Hilfe einer Netzwerkanalyse solche Strukturen identifiziert werden. Als Künstler sollen dabei jene gelten die von deutschen oder deutschsprachigen Galerien vertreten werden. Dazu müssen die verteilt vorliegenden Online-Informationen geeignet analysiert werden. In der Arbeit ist dies durch einen Crawler zu automatisieren, der auf einem Rahmenwerk wie beispielsweise SMILA oder Nutch basiert und vielleicht an einen Screen Scraper wie scrapy angeschlossen ist.
Galerieverzeichnisse wie bei artfacts oder beim Bundesverband Deutscher Galerien und Editionen e.V. müssen geeignet analysiert werden um Listen mit Netzadressen von Galerien zu ermitteln. Auf den Galerie-Sites muss dann durch eine Heuristik die Liste der von der Galerie vertretenen Künstler ermittelt werden. Aus diesen Informationen - eventuell angereichert um Metainformationen wie Stilrichtung des Künstlers oder Schwerpunkt der Galerie - soll geeignet ein Netzwerk erstellt werden. Mit dem Tool SONIVIS sollen dann Analysen zu Netzwerkeigenschaften durchgeführt werden und deren Ergebnisse sowie das Künstler-Galerie-Netzwerk online dargestellt werden. Sämtliche Software ist unter die BSD oder Apache Lizenz zu stellen.
Art der Arbeit: Diplom- oder Masterarbeit
Voraussetzungen: Kenntnisse in grundlegenden Web-Technologien und Netzwerken
Gesetzes- und Verordnungstexte sind von teilweise hoher Komplexität geprägt. So verlangt die Allgemeine Verwaltungsvorschrift zur Bestimmung der Formblätter nach § 46 Abs. 3 des Bundesausbildungsförderungsgesetzes (BAföG-FormblattVwV 2008): “An den mit einem Stern gekennzeichneten Stellen der Versicherung des Erklärenden in Formblatt 3 Seite 4 Spiegelstrich 5 sind die Bedarfssätze nach § 12 Abs. 1 Nr. 1 des Gesetzes, nach § 12 Abs. 2 Nr. 2 und Abs. 3 in Verbindung mit § 13a Abs. 1 und Abs. 2 des Gesetzes, nach § 13 Abs. 1 Nr. 1 in Verbindung mit Abs. 2 Nr. 1 des Gesetzes und nach § 13 Abs. 1 Nr. 2, Abs. 2 Nr. 2 und Abs. 3 in Verbindung mit § 13a Abs. 1 und Abs. 2 des Gesetzes nach dem Bundesausbildungsförderungsgesetz in der zu Beginn des Bewilligungszeitraums, für den Ausbildungsförderung beantragt wird, maßgeblichen Höhe einzusetzen.”
Bei genauerer Betrachtung lassen sich in Gesetzestexten Verweisnetzwerke zwischen Gesetzen, Paragraphen oder Absätzen feststellen. In der Arbeit soll untersucht werden ob die Eigenschaften dieses Netzwerks charakteristisch für bestimmte Klassen von Gesetzen und Verordnungen sein können.
Dazu sollen die online verfügbaren Gesetze und Verwaltungsvorschriften des Bundes (gegebenenfalls auch von Ländern) syntaktisch auf Verweise analysiert werden um sie als Netzwerke zu repräsentieren. Mit Hilfes des Werkzeugs SONIVIS sind geeignete Netzwerkmetriken zu ermitteln und zu überprüfen ob wie beschrieben aus den strukturellen Eigenschaften heraus Aussagen über die Art oder gar dem Inhalt der Vorschrift ableitbar sind. Die Resultate der Analyse sollen in einem Online-Dienst bereitgestellt werden.
Art der Arbeit: Studien- oder Bachelorarbeit
Voraussetzungen: Kenntnisse in einfacher Textextraktion, Netzwerken, Statistik
Webrings sind eine sehr alte Struktur im Web mit der thematisch ähnliche Sites über ein externes Navigationselement verknüpft werden sollen. In der Arbeit soll statistisch geprüft werden ob dies erreicht wird.
Ausgehend vom Verzeichnis von Webrings bei www.webring.com soll zunächst die Strukturen von Webrings (Größe und Konnektivität) analysiert werden. Weiterhin sollen jeweils miteinander verbundene Site auf Ähnlichkeit überprüft werden (Indexierung z.B. mit Lucene und Berechnung des Dokumentenabstands) sowie die Auswirkung auf die Popularität der verbundenen Sites anhand ihres Pageranks (statischer Vergleich des Pageranks innerhalb des Webrings mit dem vondurch google als ähnlich identifizierten Sites ausserhalb des Webrings) analysiert werden.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Web Technologien, Information Retrieval, Netzwerke
Die Analyse von Netzwerken (Network Science) ist ein expandierender Wissenschaftsbereich der verschiedenste Grundlagengebiete (Physik, Mathematik), Anwendungsbereiche (Biologie, Ökonomie, Lebenswissenschaften) und die Informatik zusammenbringt. Grundlage jeder Analyse sind Netzwerke aus verschiedensten Gebieten. Dabei besteht die Hoffnung, gebietsübergreifende Erkenntnisse zu gewinnen sowie eine methodische Konvergenz zu erreichen.
Notwendig ist dafür ein leichter Zugang zu Rohdaten von Netzwerken, zu Analyseergebnissen davon sowie zu Metadaten über die Analysen. In der Arbeit soll ein Informationssystem gebaut werden, das in möglichst reicher Form eine solche Infrastruktur für Netzwerkforschung bereitstellt und über bisherige Versuche wie die Sammlung bei der Network Workbench oder das Visual Analytics Benchmarks Repository hinaus geht.
Das zu erstellende Informationssystem soll eine Ontologie der Domäne Netzwerkanalyse verwenden, Metadaten zu weiteren Ontologien klassifizieren. Es soll möglich sein, Netzwerkdaten oder Verweise darauf einzustellen, wozu entsprechende Metadatenschemata zu entwickeln sind. Weiterhin sollen Forschungsergebnisse direkt oder als Verweis eingestellt werden können. In der Arbeit soll weiterhin ein Mechanismus zur automatischen Integration schon vorhandener Informationen realisiert werden. Schließlich soll das Informationssystem mit einer reichen Nutzerschnittstelle versehen sein um einen einfachen Zugang zu realisieren.
Art der Arbeit
Diplom- oder Masterarbeit
Voraussetzungen
Kenntnisse in Netzwerkanalyse, Netzbasierten Informationssystemen
Wordpress ist eine sehr populäres CMS für Blogs. Dabei können Inhalte mit Kategorien und Tags markiert werden um ihre inhaltliche Ausrichtung zu beschreiben. Allerdings gibt es bislang keine Systematik für diese Kategorisierung und man kann sich nicht auf externe Kategoriensysteme beziehen.
Die Arbeit soll Technologien des Semantic Web dafür nutzen. So soll man sich als Autor bei der Auswahl von Tags und Kategorien auf eine externe Ontologie nach Semantic Web Standards beziehen können oder beim Editieren semantische Microformate verwenden können. Nach außen soll eine semantische Suche für Nutzer angeboten werden sowie Metadaten zu einem Blog als RDF anfragbar sein. Weitere Einsatzmöglichkeiten zu Semantischen Technologien in Wordpress sind abzustimmen.
Zu erstellen ist ein Wordpress Plugin, dass sich in die bislang kurze Liste semantischer Wordpress Erweiterungen einreiht. Das Plugin ist unter eine LGPL Lizenz zu stellen.
Über auf CD veröffentlichte Musik liegen Metadaten bezüglich der Künstler und der aufgenommenen Titel vor. Die freedb ist eine quelloffene Datenbank von ca. 2,8 Millionen CDs mit ca. 42 Millionen Titeln, teilweise in 11 Genres klassifiziert.
Es ergibt sich ein Netzwerk aus Künstlern und aufgenommenen Songs. In der Arbeit soll die freedb entsprechend aufbereitet und einer Netzwerkanalyse unterzogen werden. Dabei sollen Fragen beantwortet werden wie: Welche Songs wurden von mehreren Künstlern aufgenommen, welche Künstler nehmen viele Songs auf die auch andere aufnehmen, gibt es Künstlergruppen deren Aufnahmen sich überlappen, sind diese Maße spezifisch für Genres? Weiterhin sollen anhand der unterschiedlichen Snapshots der freedb Datenbank Fragen zur Dynamik des Künstler-Song-Netzwerks beantwortet werden: Welche Songs werden zunehmend gecovered, gibt es einen signifikanten Zusammenhang mit bestehenden ähnlichen Künstlergruppen? Weitere, ähnliche Fragestellungen sollen in der Arbeit entwickelt werden.
Zur Netzwerkanalyse soll ein geeignetes Werkzeug, bevorzugt SONIVISverwendet werden. Die Resultate der Analyse sollen in einem Online-Dienst bereitgestellt werden.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Datenbankanwendungen, Netzwerkanalyse, Netzbasierten Informationssystemen.
Quelltextverwaltungen/Versionsverwaltungen stellen die Grundlage für fast sämtliche OpenSource Software Projekte dar. Die Gemeinschaft aus Entwicklern auf der einen und Nutzern auf der anderen Seite bilden das Wesen dieser Projekte. Kenntnis um die Netzwerke, in denen sich Entwickler und Nutzer organisieren, über die sie k0mmunizieren und zusammenarbeiten, stellen oftmals essentiell wichtige Faktoren für Erfolg oder Misserfolg dieser Projekte dar. Das Netzwerk der Zusammenarbeit kann beispielsweise anhand der Versionsverwaltung rekonstruiert und analysiert werden. Aus der Kenntnis, wer mit wem zusammen arbeitet, kann so beispielsweise herausgefunden werden,
In der Arbeit soll die quelloffene Software SONIVIS um einen SubversionExtraktor erweitert werden. Dem ETL-Prinzip (Extract-Transform-Load) folgend kann mittels SONIVIS dann das Netzwerk der Zusammenarbeit generell analysiert werden. Da SONIVIS auf der RichPlatform (RCP) von Eclipse Client aufbaut, können vorhandene subversionplugins (subversive/subclipse) zum Zugriff auf Subversionrepositories genutzt bzw. erweitert werden. Zur tiefergehenden Analyse sollen domänenspezifische Metriken (beispielsweise LinesOf Code (LOC), Interface Nutzungshäufigkeit etc.) implementiert werden. Eine Analyse von beispielhaften Opensource Projekten (z.B. KDE) soll die Arbeit beschließen.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Programmierung mit Java und dem Umgang mit Eclipse. Kenntnisse in RCP Entwicklung von Vorteil.
Webseiten stellen ein Netzwerk aus Hypertexten dar, die über Hyperlinks miteinander verbunden sind. Die graphische Darstellung der Linkstruktur könnte zur schnellen Identifikation von Clustern von Webseiten, die beispielsweise einen Themenschwerpunkt darstellen, dienen. Eine vergleichende Analyse von Linkstruktur und Klickpfaden, kann zur Verbesserung der Nutzerführung genutzt werden.
In der Arbeit soll mittels bestehender Open Source Software ein Webcrawler (basierend auf Nutch) erstellt werden, welcher die gesammelten Daten für die Netzwerkanalyse und -visualisierungs software SONIVIS aufbereitet.
SONIVIS (das Wiki unter sonivis.org/wiki enthält Informationen für Entwickler) ist eine auf Eclipse basierende open source software zur Analyse und Visualisierung von Netzwerken. Sie verfügt über ein generisches Datenmodell und Erweiterungsschnittstellen (extension points), um verschiedene Informationsbestände zu extrahieren und aus diesen Netzwerke zu laden.
Nutch ist eine Open Source Web-Search Software. Sie basiert auf Lucene Java und fügt webspezifische Funktionen, wie einen Crawler, Parser für HTML und weitere Dokumenten Formate etc. hinzu.
Art der Arbeit
Studien- oder Bachelorarbeit
Voraussetzungen
Kenntnisse in Java Programmierung. Eclipse Kenntnisse sind von Vorteil, aber keine Voraussetzung.