Adresse und KontaktAG Netzbasierte Informationssysteme Königin-Luise-Straße 24-26 14195 Berlin Tel.: +49-30-838-75221 Fax: +49-30-838-75220 | Abschlussarbeiten bei NBI sind möglich indem der der/die Kandidat/in ein Thema aus den hiesigen Vorschlägen wählt oder ein eigenes Thema vorschlägt. In beiden Fällen ist es wichtig, dass die Vorkenntnisse des/der Kandidat/in für das Thema nützlich sind, der/die Kandidat/in wirkliches fachliches Interesse an dem Thema hat und das Thema für NBI interessant ist 1. Für die Anmeldung der Abschlussarbeit müssen a) ein einseitiges Exposé der Arbeit und b) eine Gliederung der Arbeit mit konkreten Überschriften und einem Mengengerüst vorliegen. Gerne können wir daraus einen Projektplan für das Schreiben der Arbeit erstellen. 2. Nach Anmeldung findet eine Betreuung statt durch regelmässige Treffen mit Diskussion und Präsentation des jeweiligen Stands, dessen Abgleich mit dem Projektplan und Detailkorrektur einiger Seiten der Arbeit. 3. Gegen Ende der Arbeit muss der/Die Kandidat/in die Verantwortung für die Arbeit selber übernehmen, es gibt also weniger Betreuung. Korrekturen und Vorbewertungen des Stands der Arbeit kurz vor Abgabe sind nicht möglich. 4.Die Arbeit muss immer auch elektronisch als PDF direkt an NBI-Gutachter per Mail oder CD übermittelt werden. Grund dafür ist einerseits dass die Arbeiten zunehmend elektronisch gelesen werden, andererseits die nur selten notwendige automatisierte Überprüfung auf Plagiate. Alles zum Ablauf des Vortrags etc. … [...Weiterlesen/more...] Auf dem fünften nationalen IT-Gipfel im Dezember 2010 vereinbarten die Teilnehmer des Gipfels aus Politik, Wissenschaft und Wirtschaft bis zum Jahr 2013 „[den] Aufbau einer zentral zugänglichen, den Interessen der Nutzer an einem einheitlichen, leichten und benutzerfreundlichen Zugriff gerecht werdenden Open-Data-Plattform“. Dieses Ziel hat längst prominente Vorbilder, insbesondere im angelsächsischen Raum (z.B. [1], [2]). In Deutschland existieren auch erste Projekte (z.B. [3]), offene Verwaltungsdaten frei und öffentlich anzubieten. Der erste Schritt ist es die Daten anzubieten, aber der nun folgende Schritt ist es, das Verwertungspotential der Daten aufzuzeigen. Um dieses Verwertungspotential zu evaluieren, wurde unter anderem die Initiative Apps4Deuschland [4] ins Leben gerufen, die bereits im ersten Durchgang interessante Ergebnisse lieferte. In dieser Bachelorarbeit sollen Kriterien aus bestehenden formalen Spezifikationen für Grafiken (Bertin’s Semiologie von Graphiken, Mackinlay’s APT System, Polari) analysiert und daraufhin untersucht werden, inwieweit sie für den vorliegenden Anwendungsbereich geeignet sind. Das übergeordnete Ziel soll es sein, den Nutzer bei dem Prozess der Datenanalyse visuell zu unterstützen. Es sollen dazu Daten, aus unterschiedlichen Datenquellen verknüpft werden. Das Ergebnis der Verknüpfung und die darauf aufbauende Visualisierung soll auch anderen Nutzern zur Verfügung gestellt werden. Die theoretischen erarbeiteten Kriterien sollen auf vorhandene Webtechnologien übertragen (was ist überhaupt möglich?) und danach innerhalb … [...Weiterlesen/more...] Webapplikationen wie Twitter, Google, Facebook und Wikipedia ermöglichen, dass riesige Datenmengen analysiert werden können, um Entitäten wie Personen, Inhalte und deren Interaktionen zu untersuchen. Zur Analyse dieser digitalen Spuren finden vor allem Prinzipien aus dem Bereich der Parallelen Programmierung Anwendung. In dieser Bachelorarbeit soll das MapReduce Software-Framework bzw. deren Open Source Implementierung Hadoop eingesetzt werden, um eine Webapplikation aufzubauen, die für die Analyse von komplexen Netzwerken genutzt werden kann. Innerhalb der wissenschaftlichen Analyse von Datensätzen ist es notwendig, eine bestehende, häufig komplexe Fragestellung in Teilanalyseschritte zu zerlegen. Gerade bei großen Netzwerken kann die Berechnung von Metriken viel Zeit in Anspruch nehmen, daher soll in dieser Bachelorarbeit, der Nutzer bei der Analyse von großen Netzwerken unterstützt werden. Durch den Aufbau einer Webapplikation soll der analytische Prozess in Teilschritte zerlegt werden. Als Input sollen grundsätzlich alle Daten dienen, die in einem bestimmten Format (z.B. graphml, csv) vorliegen. (*) Mit Hilfe der Webapplikation soll eine Analyse der Daten in einzelnen, durch den Nutzer definierten Schritten möglich sein. In jedem Teilschritt soll bestimmt werden, ob und wie das Ergebnis weiterbearbeitet wird. So kann eine einzelne Berechnung bereits das finale Ergebnis darstellen oder aber als Input für einen weiteren Analyseschritt genutzt werden. Die Berechnung der … [...Weiterlesen/more...] Open Government Data sind frei verfügbare Verwaltungsdaten des öffentlichen Sektors, die im Interesse der Allgemeinheit stehen. Derzeit existieren vielfältige Bestrebungen, öffentliche Daten dem Bürger, Unternehmen aber auch anderen Verwaltungen einfacher verfügbar zu machen. Der Schwerpunkt liegt dabei auf der Standardisierung des Datenformats und der einfachen Bereitstellung der Daten. Es gibt mittlerweile eine Vielzahl von solchen Angeboten in Form von Datenkatalogen (z.B. Offene Daten Berlin). Dabei werden potentielle Nutzer als reine Datenkonsumenten verstanden. Sie verarbeiten diese Daten, um beispielsweise mit Webanwendungen oder mobilen Anwendungen einen Mehrwert zu erzeugen. Das Nutzer auch potentieller Wissensträger wird vernachlässigt. Das vorhandene Wissen kann aber zur Verbesserung der offenen Daten z.B. in Form der Prüfung der Aktualität, der Anreicherung der Daten basierend auf Erfahrungswerten, der Ergänzung von geographischen Information genutzt werden. Eine zentrale Frage lautet: Wie können Nutzer gewonnen werden, um vorhandene offene Daten mit ihrem Wissen zu ergänzen. Welche Funktionen sind dabei erfolgversprechend? In dieser Arbeit geht es darum in einen bestehenden Datenkatalog oder in eine eigene, prototypisch umgesetzte Open-Data-Anwendung Funktionen einzubringen, die den Nutzern erlauben, vorhandene offene Daten, um ihr eigenes, vorhandenes Wissen zu ergänzen und diese angereicherten Daten dann wieder der Allgemeinheit zur Verfügung zu stellen. Anhand von Nutzerstudien sollen implementierte Funktionen bewertet werden. Literaturempfehlungen:… [...Weiterlesen/more...] Vielfältige Möglichkeiten existieren im World Wide Web, sich über bestehende Entwicklungen im zu informieren. Da das Angebot häufig unübersichtlich ist und die Informationen auf unterschiedlichen Webseiten verteilt sind, werden insbesondere im Blogbereich sogenannte Aggregatoren verwendet. Es handelt sich dabei zumeist um eine Software, die Inhalte zu einem bestimmten Thema sammelt und diese Inhalte für den Nutzer aufbereitet. Ein wichtiges Konzept, welches hier Anwendung findet ist die Syndication von Inhalten. Aggregatoren existieren mittlerweile in einer vielfältigen Formen, so kann der Nutzer sich beispielsweise seine Inhalte selbst zusammenstellen (z.B. Pulse) oder aber es werden ihm Informationen aus einem bestimmten Bereich automatisiert angeboten (z.B. HackerNews). Andere Services ermöglichen es wiederum dem Nutzer, sich sein persönliches Magazin zusammenzustellen (z.B. Flipboard). Bei vielen Angeboten, werden die ausgewählten Inhalte zwar zusammengefasst und angeboten, aber zumeist ist es nicht möglich, diese Angebote auf seine spezifischen Interessen weiter einzuschränken. In dieser Bachelorarbeit soll beispielhaft anhand eines Newsaggregators (http://www.r-bloggers.com/) ein Service aufgebaut werden, der es dem Nutzer ermöglicht, die über den Newsaggregator bereitgestellten Inhalte weiter auf sein Interessengebiet einzuschränken. Diese Einschränkung kann über die textuelle Analyse der Blogeinträge erfolgen, über einen Klassifikator, der über die Bewertung und Auswahl des Nutzers seine Interessen lernt oder über beide Ansätze … [...Weiterlesen/more...] Peer Production, als offene und kollektive Form der Zusammenarbeit, hat im letzten Jahrzehnt an Bedeutung gewonnen. Beispiele dafür sind unter anderem Wikipedia, als gemeinschaftlich erstellte Online Enzyklopädie, sowie YouTube.com oder Del.icio.us als umfassende Informationssammlungen mit nutzergenerierten Inhalten. Dabei koordinieren geographisch verteilte Personen ihre Aktivitäten durch den Einsatz von Informations- und Kommunikationssystemen. Diese digitalen Archive ermöglichen wiederum, dass die dabei entstehenden Ereignisdaten transparent und nachvollziehbar sind. Das teilweise nur implizite Ziel dieser Zusammenarbeit ist die Erstellung eines digitalen Produkts. Die Aufgabe in dieser Master- bzw. Diplomarbeit ist es zu untersuchen, wie die offene Gemeinschaft sich bezüglich der unterschiedlich anfallenden Aufgaben zur Produkterstellung koordiniert. Als Anwendungsfall soll dabei die Wikipedia dienen. Nach einem umfassenden Literaturstudium, sollen in der Arbeit vorhandene Aktivitäten, die während des Lebenszyklus eines Artikels erfolgen, identifiziert werden. Als Entwicklungszyklus wird der Entwicklungsstand eines Artikels in Bezug auf das Qualitätsbewertungssystem der Wikipedia-Community definiert. Das Ziel ist es zu untersuchen, ob Unterschiede bei den Aktivitätstypen und dem Aktivitätsumfang in Abhängigkeit von der qualitativen Bewertung des Artikels bestehen. Aufbauend auf den Ergebnissen soll ein Empfehlungssystem entworfen werden, das diese Daten nutzt, um einerseits Nutzer die in der Vergangenheit bestimmte Aktivitäten ausgeführt haben, Artikel zu empfehlen, bei denen diese Aktivitäten noch nicht … [...Weiterlesen/more...] Im Rahmen des vom Bundesministerium für Bildung und Forschung geförderten Verbundprojekts “DigiPolis” entwickelt die AG NBI einen verteilten selbst-organisierenden semantischen Speicherdienst (S4) auf der Basis von naturinspirierten Algorithmen und Schwarmintelligenz. Im Zuge dieser Entwicklung sind verschiedene, für Abschlussarbeiten passende Themen zu bearbeiten: - Erstellung einer vergleichenden Studie zwischen unterschiedlichen Organisationsprinzipien (Hash Tables, Lookup Trees,..) für verteilte Systeme mit dem Ziel, für S4 passende Einsatzszenarien zu identifizieren und zu beschreiben.
Entwurf, Implementierung und Analyse eines integrierten Evaluationswerkzeuges, mit dem S4 für verschiedene Konfigurationen und Datensets getestet werden kann. Wichtiger Punkt ist die Aufzeichnung von Testresultaten für nachgelagerte Untersuchungen.Untersuchung und Umsetzung eines Verfahrens zur Vermeidung von Überlast auf den Netzwerkverbindungen zwischen den verschiedenen Knoten (“Overpathing”) für S4.Untersuchung, Erstellung und Implementierung von Heuristiken für die Einstellungen verschiedene Parameter des selbstorganisierenden Systems.Untersuchung und Umsetzung eines Verfahrens zur Behandlung von Ausfällen und Wiedereingliederung einzelner Knoten des verteilten Systems.
Sollten Sie an einem dieser Themen Interesse haben, wenden Sie sich bitte an einen der unten genannten Betreuuer. Art Bachelorarbeit Wichtig: Wegen der begrenzten Projektlaufzeit können leider keine weiteren Master- oder Diplomarbeiten zu diesen Themen vergeben werden. Bacheloararbeiten müssen spätestens Ende August angemeldet werden. Voraussetzungen Kenntnisse in Programmierung mit Java, Vorkenntnisse in Verteilten … [...Weiterlesen/more...] Mittlerweile existieren eine Vielzahl von unterschiedlichen Ansätzen, in denen die Qualität von Autorenbeiträgen oder die Qualität von Artikeln untersucht wird. Innerhalb dieser Studien werden zumeist bestimmte Aspekte untersucht und visualisiert, wie beispielsweise die Editieraktivität von Autoren in der Wikipedia mit sogenannten Chromograms [1], Änderungen auf Diskussionsseiten mit History Flow Diagrams [2] oder aber auch die Ko-Autorenschaft zwischen Artikeln basierend auf Netzwerken [3]. Ebenfalls werden Nutzeränderungen direkt im Wiki angezeigt wie bei Wiki–Dashboard [4]. Daneben existieren aber auch Visualisierungen, in denen der rein visuelle Aspekt im Mittelpunkt steht, wie beispielsweise in [5]. Die Frage der in dieser Diplomarbeit nachgegangen werden soll ist aber, wie durch Visualisierungen zur Artikelqualität bzw. zum Editierverhalten die dem Nutzer direkt zur Verfügung gestellt werden, das Nutzerverhalten indirekt beeinflusst wird oder indirekt beeinflusst werden kann. Dazu soll zunächst ein Überblick über bestehende Ansätze zur Nutzeraktivität und Artikelqualität erfolgen. Diese Ansätze sollen auf ihre Nutzbarkeit bzw. Erweiterbarkeit hinsichtlich der Verwendung in dieser Forschung untersucht werden. Dabei geht es vor allem darum, Kriterien zu ermitteln, die eine solche vergleichende Bewertung erlauben. Dazu sollte auf bestehende Literatur aus den Bereichen der Informationsvisualisierung (z.B. [6], [7]) und Visual Analytics [8] zurückgegriffen werden. Die Ergebnisse sollen genutzt werden, um eine eigene Visualisierung … [...Weiterlesen/more...] Die Analyse der Nutzung von Webseiten stellt schon heute eine wichtige Grundlage für bedarfsorientierte Angebote im Web dar. Kommen die Technologien des Semantic Web zur Anwendung, wird diese Analyse ungleich schwieriger, weil reine HTTP-Antworten des Servers zum Beispiel keine Aussage darüber zulassen, ob und welche Daten durch eine SPARQL-Anfrage an einem Endpoint gefunden wurden. Für die Betreiber von semantischen Datenrepositories verbergen sich aber hinter ebendiesen Infomrationen interessante Rückschlüsse auf die Qualität der Daten im Bezug zu den Anforderungen der Nutzer bzw. der Anwendungen, die diese Daten nutzen. Im Rahmen eines Promotionsvorhabens wurde eine Methode zur Sammlung solcher Nutzungsinformationen entworfen und implementiert und es liegen erste Beispieldaten über die Nutzung des DBpedia 3.3 Datensets vor. Im Rahmen dieser Arbeit sollen nun die Beispieldaten und die ihnen zugrunde liegenden Ontologien durch eine Erweiterung der quelloffenen Software SONIVIS als Netzwerk visualisiert werden. Darüberhinaus sollen, ebenfalls für das SONIVIS Tool, Metriken entworfen und implementiert werden, die unterschiedliche Sichten auf diese Netzwerke ermöglichen. Ein Beispiel hierfür wären sogenannte Heat Maps, d.h. eine Visualisierung, die anhand der Anfragehäufigkeit Konzepte der Ontologie größer oder kleiner darstellt. Art Bachelor- oder Studienarbeit Voraussetzungen Kenntnisse in Programmierung mit Java und dem Umgang mit Eclipse. Kenntnisse in RCP Entwicklung von … [...Weiterlesen/more...] Der weltweite Kunstmarkt ist sehr lose organisiert. Relevante Rollen sind die Künstler mit ihren Werken und Auktionshäuser, die Werke von Künstlern auf dem sog. 2. Markt an Museen und Sammler versteigern. Kunstauktionen werden mittlerweile von umfangreichen Online-Katalogen begleitet, die Gebotsabgabe über das Internet ist möglich und auch Ergebnislisten werden online bereitgestellt. Aufgrund der individuellen Insellösungen von Auktionshäusern ist es aber kaum möglich sich einen vollständigen Überblick zu Inhalt und Struktur des Kunstauktionsmarkts zu bilden. Kommerzielle Dienste wie artprice.com oder artfacts.net sind vergleichsweise hochpreisig. In dieser Arbeit sollen Informationen über in Auktionen gehandelte Werke und deren Künstler ermittelt und mit Hilfe einer Netzwerkanalyse Strukturen des 2. Markts identifiziert werden. Verzeichnisse von Auktionshäusern wie von kunstmarkt.com erfassen relevante Sites und liefern Ausgangspunkte für einen Crawler, der beispielsweise auf einem Rahmenwerk wie beispielsweise SMILA oder Nutch basiert und vielleicht an einen Screen Scraper wie scrapy angeschlossen ist. Aus Online-Katalogen sollen angebotene Künstler und Werke extrahiert werden und geeignet ein Netzwerk erstellt werden. Mit dem Tool SONIVIS sollen dann Analysen zu Netzwerkeigenschaften durchgeführt werden und deren Ergebnisse sowie das Werke-Künstler-Auktionshaus-Netzwerk online dargestellt werden. Sämtliche Software ist unter die BSD oder Apache Lizenz zu stellen. Art der Arbeit: Diplom- oder Masterarbeit Voraussetzungen: Kenntnisse in grundlegenden … [...Weiterlesen/more...] | |