Adresse und KontaktAG Netzbasierte Informationssysteme Königin-Luise-Straße 24-26 14195 Berlin Tel.: +49-30-838-75221 Fax: +49-30-838-75220 | Abschlussarbeiten bei NBI sind möglich indem der der/die Kandidat/in ein Thema aus den hiesigen Vorschlägen wählt oder ein eigenes Thema vorschlägt. In beiden Fällen ist es wichtig, dass die Vorkenntnisse des/der Kandidat/in für das Thema nützlich sind, der/die Kandidat/in wirkliches fachliches Interesse an dem Thema hat und das Thema für NBI interessant ist 1. Für die Anmeldung der Abschlussarbeit müssen a) ein einseitiges Exposé der Arbeit und b) eine Gliederung der Arbeit mit konkreten Überschriften und einem Mengengerüst vorliegen. Gerne können wir daraus einen Projektplan für das Schreiben der Arbeit erstellen. 2. Nach Anmeldung findet eine Betreuung statt durch regelmässige Treffen mit Diskussion und Präsentation des jeweiligen Stands, dessen Abgleich mit dem Projektplan und Detailkorrektur einiger Seiten der Arbeit. 3. Gegen Ende der Arbeit muss der/Die Kandidat/in die Verantwortung für die Arbeit selber übernehmen, es gibt also weniger Betreuung. Korrekturen und Vorbewertungen des Stands der Arbeit kurz vor Abgabe sind nicht möglich. 4.Die Arbeit muss immer auch elektronisch als PDF direkt an NBI-Gutachter per Mail oder CD übermittelt werden. Grund dafür ist einerseits dass die Arbeiten zunehmend elektronisch gelesen werden, andererseits die nur selten notwendige automatisierte Überprüfung auf Plagiate. Alles zum Ablauf des Vortrags etc. … [...Weiterlesen/more...] Wir bieten derzeit zwei Abschlussarbeiten im Kontext von Microsoft SharePoint und RDF an. - Bachelorarbeit: Erweiterung eines Middleware-Services zur Erzeugung von RDF-Daten aus Microsoft SharePoint um Mandantenfähigkeit
Die Arbeit umfasst eine Auseinandersetzung mit unterschiedlichen Möglichkeiten Mandantenfähigkeit in der Middleware zu implementieren und diese auch auf der Ebene der RDF-Datenbank (Triple Store) abzubilden (z.B. mit Named Graphs vs. getrennte Instanzen des Stores). - Master-/Diplomarbeit: Übertragung von Daten und Zugriffsrichtlinien aus Microsoft SharePoint in ein RDF-Datenmodell und Implementierung einer Authentifizierungskomponente für den Zugriff darauf
Bei Fragen vereinbaren Sie bitte einen Termin mit Markus Luczak-Rösch.… [...Weiterlesen/more...] Bei der Peer Production handelt es sich um eine offene, kollektive Zusammenarbeit bei der geographisch verteilte Personen ihre Aktivitäten so koordinieren, dass sie gemeinschaftlich ein Softwareprodukt erstellen. Der Ursprung dieser Entwicklung kann in der Free/Open Source (OOS) Entwicklung gesehen werden. Dieser Ansatz ermöglicht es, dass mittlerweile komplexe Softwaresysteme entstanden sind, deren ökonomische Bedeutung nicht zu vernachlässigen ist. Zu den bekannten Vertretern gehören Linux, Mozilla und Apache. In dieser Arbeit soll der Schwerpunkt auf dem kollektiv erstellten Produkt – dem Source Code liegen. Dieser Source Code soll in seiner Evolution untersucht werden und darüber hinaus soll festgestellt werden, welche Personen wo beigetragen haben. So hat eine Untersuchung aus dem Jahre 2010 festgestellt, dass 75 Prozent des Source Codes des Linux Kernels zwischen Dezember 2008 und Januar 2010 von bezahlten Entwicklern erstellt wurde. Zunächst sollen Ansätze zur netzwerkanalytischen Beschreibung von Softwaresystemen identifiziert werden. Das Ziel ist es, einen gerichteten Graphen (sogenannter Call Graph) aufzubauen, der eine Aufrufbeziehung (Kanten) zwischen den Funktionen (als Knoten) eines Programms aufzeigt. Beispielsweise bedeutet eine gerichtete Kante zwischen den Knoten f und g, dass die Funktion f die Funktion g aufruft. Dieses Netzwerk und seine Entwicklung soll im Zeitverlauf untersucht und die Core-Peripherie-Beziehung untersucht werden. Das Ziel ist … [...Weiterlesen/more...] Wir möchten neue Themen für Abschlussarbeiten anbieten. Bei Interesse an einem der Themen aus - Implementierung eines Werkzeugs zur graphischen Analyse von SPARQL Anfragen (BA)
kontaktieren Sie bitte luczak@inf.fu-berlin.de.… [...Weiterlesen/more...] Rechtstexte wie Gesetze, Verordnungen und Urteile werden verstärkt online publik gemacht. Die Datenbestände sind ein interessanter Korpus für Analysen von Referenzen innerhalb und zwischen diesen Texten. Innerhalb von Gesetzen wird direkt per Verweis auf andere Gesetze verwiesen. Diese Referenzen lassen sich hinreichend gut extrahieren, analysieren und visualisieren. Aber Gesetze stehen nicht nur explizit mit anderen Gesetzen in Verbindung, sondern viel häufiger auch durch die “Rechtsfolgenorm”, als die Regelung die an anderer Stelle die Folgen eines bestimmten Tatbestands festlegt. Genau diese zu beherrschen und anzuwenden ist Teil der juristischen Ausbildung und die eigentliche Herausforderung dabei. Nachvollziehbar wird die Rechtsfolgenorm in der Praxis durch Urteile, die auf die in der Urteilsfindung angewandten Gesetze verweisen. Führt man diese Verweise mit den expliziten Verweisen in Gesetzestexten zusammen, erhält man ein riesiges Netzwerk aus Gesetzen und ihren Verweisen, das ohne sinnvolle Unterstützung kaum überschaubar ist, inhaltlich aber einen hohen Wert hat. Die Analyse von Netzwerken ist ein verbreitetes Instrument um den Aufbau, bestehende Abhängigkeiten und Entwicklungen in Informationsstrukturen offenzulegen. Bekannte Studien basieren auf Beziehungen zwischen Webseiten im World Wide Web, auf Referenzen zwischen akademischen Artikeln aber auch auf juristischen Referenzen bei Urteilen. In der Arbeit soll ein Rahmen konzipiert und implementiert werden mit dem sich … [...Weiterlesen/more...] Der Erfolg der Wikipedia als Community-organisiertes Projekt ist mittlerweile unbestritten und es wurde bereits viele Forschungsarbeiten erstellt, die unter anderem erklärenden Charakter haben oder sich aus aggregierten Analysen zusammensetzen. Zu der ersten Gruppe an Studien gehört beispielsweise [1]; hier wird die Bedeutung sogenannter „privileged users“ für die Inhalteerstellung gerade nach der Gründung der Wikipedia herausgestellt, wobei sich diese Bedeutung hin zu „ordinary authors“ verschiebt. In [2] wird das Editierverhalten unterschiedlicher Systemrollen in den unterschiedlichen Sprachversionen der Wikipedia verglichen (z.B. Admin, Sysop). In [3] wiederum wird der Einfluss des Editierverhaltens der Autoren auf die Artikelqualität untersucht. In der zweiten Gruppe von Studien wird Wikipedia als Netzwerk interpretiert und beispielsweise die zeitliche Entwicklung [4], preferential attachment [5] und ausgewählte Eigenschaften komplexer System [6] untersucht. Außerdem wurde unter Zuhilfenahme von sogenannten revert graphs verborgene soziale Muster identifiziert [7]. In dieser Bachelorarbeit soll die Entwicklung der Community-Struktur in Abhängigkeit von der Artikelqualität untersucht werden. Es soll dazu ein temporales Kollaborationsnetzwerk aufgebaut werden. Die Struktur dieses Netzwerkes soll in Abhängigkeit von jeweiligen Artikelstatus analysiert werden. Bei der Bewertung der Artikelqualität, kann auf das Wikipedia interne Bewertungsschema zurückgegriffen werden. Zur Analyse der Netzwerke können bestehende Werkzeuge wie beispielsweise visone [8] oder gephi [9] eingesetzt werden. Selbstverständlich … [...Weiterlesen/more...] Der im öffentlichen Web erfolgreichste Einsatzbereich von Ontologien ist im Moment das Web of Linked Data. Spätestens seit auch der öffentliche Sektor damit begonnen hat RDF Informationen zu veröffentlichen (z.B. data.gov.uk und data.gov) ist dieser Trend auch außerhalb der wissenschaftlichen Community bestätigt. Damit beginnt auch die Nutzung dieser Daten für produktive Zwecke und es entstehen neue Forschungsfragen für den Bereich des Web Usage Mining. Im Rahmen unserer Forschung zu Ontologiewartung haben wir Nutzungsdaten von SPARQL-Schnittstellen und Linked Data Endpoints gesammelt. Ziel dieser Arbeit ist es die bekannte Methode der Sequenzanalyse auf diesen Daten auszuführen und damit Assoziatonspatterns in der Datennutzung zu erkennen. Es soll ein Algorithmus zur Berechnung von G-Sequenz-Patterns auf die Daten angewandt und das Ergebnis geeignet visualisiert werden (z.B. mit Hilfe von R). Art der Arbeit: Bachelor- oder Studienarbeit Voraussetzungen: Kenntnisse in Data Mining, RDF, SPARQL Betreuer: Markus Luczak-Rösch Weitere Informationen: Sprechstundentermin bei Markus Luczak-Rösch nehmen… [...Weiterlesen/more...] loomp ist ein benutzerfreundliches System zu semantischen Annotation von Internetinhalten. Derzeit können Textfragmente mit RDFa annotiert werden, das System speichert dann Text und RDF-Graphen separat und veröffentlicht einerseits den Text als klassischen Internetinhalt inklusive RDFa und den RDF-Graphen als Linked Data. Die Annotation orientiert sich dabei an Nutzungsparadigmen, die aus der klassischen Textverarbeitung bekannt sind. Ziel dieser Arbeit ist es nun zusätzlich zum Annotieren von Texten auch das Annotieren von Bildern und Videos zu implementieren. Dafür müssen räumliche und bei Videos zusätzlich auch zeitliche Regionen markiert und diesen eine URI zugewiesen werden. Im Anschluss muss es einfach möglich sein über diese Definierte und per URI referenzierte Region RDF-Aussagen anlegen zu können (z.B. <uri_zum_bildausschnitt> ex:zeigt <uri_zur_person>). Art der Arbeit: Studien- oder Bachelorarbeit Voraussetzungen: Kenntnisse im Bereich RDF, Linked Data, Semantic Web Betreuer: Markus Luczak-Rösch Weitere Informationen: Bitte E-Mail an Markus Luczak-Rösch zwecks Vereinbarung eines Sprechstundentermins.… [...Weiterlesen/more...] Online Production Systems wie beispielsweise die Flickr, del.ious.us und BibSonomy bieten Nutzern die Möglichkeit Ressourcen wie beispielsweise Webseiten, Bilder oder Artikel in persönlichen Informationssammlungen zu verwalten und gleichzeitig auch für jeden zugänglich sowie teilweise auch wieder verwendbar anzubieten. Um die Auffindbarkeit der Ressourcen sicherzustellen, werden diese Ressourcen annotiert, d.h. mit Tags versehen. Die dadurch entstehenden Inhaltsstrukturen können unter anderem mit Hilfe von Informationsnetzwerken beschrieben werden. Die Frage die in dieser Arbeit verfolgt werden soll, lautet inwieweit die Qualität der Annotationen bereits aufgrund bestimmter Strukturgrößen der Netzwerken beschrieben werden kann. Dazu ist es notwendig, sich einerseits mit Qualitätskriterien in Tagging-Systemen auseinanderzusetzen und andererseits, die bestehenden Strukturen, beispielsweise Modularität, von Informationsnetzwerken in Abhängigkeit von der Zeit offenzulegen. Literaturreferenzen: - Christo Dichev and Jinsheng Xu and Darina Dicheva and Jinghua Zhang. A Study on Community Formation in Collaborative Tagging Systems. IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, 2008. 13-16.
- Halpin, Harry and Robu, Valentin and Shepherd, Hana. The complex dynamics of collaborative tagging. WWW ’07: Proceedings of the 16th international conference on World Wide Web. 2007. 211-220.
Zugrunde liegender Datensatz: Bibsonomy Art der Arbeit: Diplom- oder Masterarbeit Voraussetzungen: Kenntnisse im Bereich Netzwerkanalyse, Statistik, Programmierung (bevorzugt Java), GNU R Betreuer: Dr. Claudia Müller-Birn… [...Weiterlesen/more...] Normen und Standards sind Voraussetzung für erfolgreiche vernetzte Systeme aller Art. Dies reicht von naheliegenden offenen Systemen wie dem Web bis zu Alltäglichkeiten wie einer europaweit einheitlichen Stromsteckdosenform. Die Standards und Normen selber sind zumeist sehr strukturierte Dokumente, da oft über ihre Form eine Norm oder ein Standard existiert. Elektronische Dokumentensammlungen wie die W3C Standards, die Standards der ECMA oder die wenigen frei zugänglichen ISO Standards stellen Normen und Standards kostenlos bereit. Interessant ist jeweils die Analyse der Verweisstruktur beispielsweise auf den Ebenen der Referenzierung oder der Erweiterung oder Neuformulierung von Standards und Normen. Die Bachelorarbeit Normennetzwerke: RFCs an der FU Berlin hat dies exemplarisch für die RFC-Standards gezeigt. In der ausgeschriebenen Arbeit soll dieser Vorgehensweise verallgemeinert und ein Analysewerkzeug für Normennetzwerke erstellt werden. Algorithmen und Werkzeuge sollen konfigurierbar sein in Bezug auf: - Startpunkt der Analyse im Web und deren Struktur zum Auffinden einzelner Standards
- Dokumentenstruktur und Extraktionskonfiguration
- Charakteristische Referenzierungsweise anderer Normen
- Charakteristische Markierung von Überarbeitungen
- Ermittlung von Netzwerkmetriken
Art der Arbeit: Diplom- oder Masterarbeit Voraussetzungen: Kenntnisse in Textextraktion, Crawling, Netzwerkanalyse, Statistik Betreuer: Prof. Robert Tolksdorf Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen… [...Weiterlesen/more...] | |