Adresse und KontaktAG Netzbasierte Informationssysteme Königin-Luise-Straße 24-26 14195 Berlin Tel.: +49-30-838-75221 Fax: +49-30-838-75220 | Abschlussarbeiten bei NBI sind möglich indem der der/die Kandidat/in ein Thema aus den hiesigen Vorschlägen wählt oder ein eigenes Thema vorschlägt. In beiden Fällen ist es wichtig, dass die Vorkenntnisse des/der Kandidat/in für das Thema nützlich sind, der/die Kandidat/in wirkliches fachliches Interesse an dem Thema hat und das Thema für NBI interessant ist 1. Für die Anmeldung der Abschlussarbeit müssen a) ein einseitiges Exposé der Arbeit und b) eine Gliederung der Arbeit mit konkreten Überschriften und einem Mengengerüst vorliegen. Gerne können wir daraus einen Projektplan für das Schreiben der Arbeit erstellen. 2. Nach Anmeldung findet eine Betreuung statt durch regelmässige Treffen mit Diskussion und Präsentation des jeweiligen Stands, dessen Abgleich mit dem Projektplan und Detailkorrektur einiger Seiten der Arbeit. 3. Gegen Ende der Arbeit muss der/Die Kandidat/in die Verantwortung für die Arbeit selber übernehmen, es gibt also weniger Betreuung. Korrekturen und Vorbewertungen des Stands der Arbeit kurz vor Abgabe sind nicht möglich. 4.Die Arbeit muss immer auch elektronisch als PDF direkt an NBI-Gutachter per Mail oder CD übermittelt werden. Grund dafür ist einerseits dass die Arbeiten zunehmend elektronisch gelesen werden, andererseits die nur selten notwendige automatisierte Überprüfung auf Plagiate. Alles zum Ablauf des Vortrags etc. … [...Weiterlesen/more...] Wir bieten derzeit zwei Abschlussarbeiten im Kontext von Microsoft SharePoint und RDF an. - Bachelorarbeit: Erweiterung eines Middleware-Services zur Erzeugung von RDF-Daten aus Microsoft SharePoint um Mandantenfähigkeit
Die Arbeit umfasst eine Auseinandersetzung mit unterschiedlichen Möglichkeiten Mandantenfähigkeit in der Middleware zu implementieren und diese auch auf der Ebene der RDF-Datenbank (Triple Store) abzubilden (z.B. mit Named Graphs vs. getrennte Instanzen des Stores). - Master-/Diplomarbeit: Übertragung von Daten und Zugriffsrichtlinien aus Microsoft SharePoint in ein RDF-Datenmodell und Implementierung einer Authentifizierungskomponente für den Zugriff darauf
Bei Fragen vereinbaren Sie bitte einen Termin mit Markus Luczak-Rösch.… [...Weiterlesen/more...] Auf dem fünften nationalen IT-Gipfel im Dezember 2010 vereinbarten die Teilnehmer des Gipfels aus Politik, Wissenschaft und Wirtschaft bis zum Jahr 2013 „[den] Aufbau einer zentral zugänglichen, den Interessen der Nutzer an einem einheitlichen, leichten und benutzerfreundlichen Zugriff gerecht werdenden Open-Data-Plattform“. Dieses Ziel hat längst prominente Vorbilder, insbesondere im angelsächsischen Raum (z.B. [1], [2]). In Deutschland existieren auch erste Projekte (z.B. [3]), offene Verwaltungsdaten frei und öffentlich anzubieten. Der erste Schritt ist es die Daten anzubieten, aber der nun folgende Schritt ist es, das Verwertungspotential der Daten aufzuzeigen. Um dieses Verwertungspotential zu evaluieren, wurde unter anderem die Initiative Apps4Deuschland [4] ins Leben gerufen, die bereits im ersten Durchgang interessante Ergebnisse lieferte. In dieser Bachelorarbeit sollen Kriterien aus bestehenden formalen Spezifikationen für Grafiken (Bertin’s Semiologie von Graphiken, Mackinlay’s APT System, Polari) analysiert und daraufhin untersucht werden, inwieweit sie für den vorliegenden Anwendungsbereich geeignet sind. Das übergeordnete Ziel soll es sein, den Nutzer bei dem Prozess der Datenanalyse visuell zu unterstützen. Es sollen dazu Daten, aus unterschiedlichen Datenquellen verknüpft werden. Das Ergebnis der Verknüpfung und die darauf aufbauende Visualisierung soll auch anderen Nutzern zur Verfügung gestellt werden. Die theoretischen erarbeiteten Kriterien sollen auf vorhandene Webtechnologien übertragen (was ist überhaupt möglich?) und danach innerhalb … [...Weiterlesen/more...] Webapplikationen wie Twitter, Google, Facebook und Wikipedia ermöglichen, dass riesige Datenmengen analysiert werden können, um Entitäten wie Personen, Inhalte und deren Interaktionen zu untersuchen. Zur Analyse dieser digitalen Spuren finden vor allem Prinzipien aus dem Bereich der Parallelen Programmierung Anwendung. In dieser Bachelorarbeit soll das MapReduce Software-Framework bzw. deren Open Source Implementierung Hadoop eingesetzt werden, um eine Webapplikation aufzubauen, die für die Analyse von komplexen Netzwerken genutzt werden kann. Innerhalb der wissenschaftlichen Analyse von Datensätzen ist es notwendig, eine bestehende, häufig komplexe Fragestellung in Teilanalyseschritte zu zerlegen. Gerade bei großen Netzwerken kann die Berechnung von Metriken viel Zeit in Anspruch nehmen, daher soll in dieser Bachelorarbeit, der Nutzer bei der Analyse von großen Netzwerken unterstützt werden. Durch den Aufbau einer Webapplikation soll der analytische Prozess in Teilschritte zerlegt werden. Als Input sollen grundsätzlich alle Daten dienen, die in einem bestimmten Format (z.B. graphml, csv) vorliegen. (*) Mit Hilfe der Webapplikation soll eine Analyse der Daten in einzelnen, durch den Nutzer definierten Schritten möglich sein. In jedem Teilschritt soll bestimmt werden, ob und wie das Ergebnis weiterbearbeitet wird. So kann eine einzelne Berechnung bereits das finale Ergebnis darstellen oder aber als Input für einen weiteren Analyseschritt genutzt werden. Die Berechnung der … [...Weiterlesen/more...] Open Government Data sind frei verfügbare Verwaltungsdaten des öffentlichen Sektors, die im Interesse der Allgemeinheit stehen. Derzeit existieren vielfältige Bestrebungen, öffentliche Daten dem Bürger, Unternehmen aber auch anderen Verwaltungen einfacher verfügbar zu machen. Der Schwerpunkt liegt dabei auf der Standardisierung des Datenformats und der einfachen Bereitstellung der Daten. Es gibt mittlerweile eine Vielzahl von solchen Angeboten in Form von Datenkatalogen (z.B. Offene Daten Berlin). Dabei werden potentielle Nutzer als reine Datenkonsumenten verstanden. Sie verarbeiten diese Daten, um beispielsweise mit Webanwendungen oder mobilen Anwendungen einen Mehrwert zu erzeugen. Das Nutzer auch potentieller Wissensträger wird vernachlässigt. Das vorhandene Wissen kann aber zur Verbesserung der offenen Daten z.B. in Form der Prüfung der Aktualität, der Anreicherung der Daten basierend auf Erfahrungswerten, der Ergänzung von geographischen Information genutzt werden. Eine zentrale Frage lautet: Wie können Nutzer gewonnen werden, um vorhandene offene Daten mit ihrem Wissen zu ergänzen. Welche Funktionen sind dabei erfolgversprechend? In dieser Arbeit geht es darum in einen bestehenden Datenkatalog oder in eine eigene, prototypisch umgesetzte Open-Data-Anwendung Funktionen einzubringen, die den Nutzern erlauben, vorhandene offene Daten, um ihr eigenes, vorhandenes Wissen zu ergänzen und diese angereicherten Daten dann wieder der Allgemeinheit zur Verfügung zu stellen. Anhand von Nutzerstudien sollen implementierte Funktionen bewertet werden. Literaturempfehlungen:… [...Weiterlesen/more...] Bei der Peer Production handelt es sich um eine offene, kollektive Zusammenarbeit bei der geographisch verteilte Personen ihre Aktivitäten so koordinieren, dass sie gemeinschaftlich ein Softwareprodukt erstellen. Der Ursprung dieser Entwicklung kann in der Free/Open Source (OOS) Entwicklung gesehen werden. Dieser Ansatz ermöglicht es, dass mittlerweile komplexe Softwaresysteme entstanden sind, deren ökonomische Bedeutung nicht zu vernachlässigen ist. Zu den bekannten Vertretern gehören Linux, Mozilla und Apache. In dieser Arbeit soll der Schwerpunkt auf dem kollektiv erstellten Produkt – dem Source Code liegen. Dieser Source Code soll in seiner Evolution untersucht werden und darüber hinaus soll festgestellt werden, welche Personen wo beigetragen haben. So hat eine Untersuchung aus dem Jahre 2010 festgestellt, dass 75 Prozent des Source Codes des Linux Kernels zwischen Dezember 2008 und Januar 2010 von bezahlten Entwicklern erstellt wurde. Zunächst sollen Ansätze zur netzwerkanalytischen Beschreibung von Softwaresystemen identifiziert werden. Das Ziel ist es, einen gerichteten Graphen (sogenannter Call Graph) aufzubauen, der eine Aufrufbeziehung (Kanten) zwischen den Funktionen (als Knoten) eines Programms aufzeigt. Beispielsweise bedeutet eine gerichtete Kante zwischen den Knoten f und g, dass die Funktion f die Funktion g aufruft. Dieses Netzwerk und seine Entwicklung soll im Zeitverlauf untersucht und die Core-Peripherie-Beziehung untersucht werden. Das Ziel ist … [...Weiterlesen/more...] Vielfältige Möglichkeiten existieren im World Wide Web, sich über bestehende Entwicklungen im zu informieren. Da das Angebot häufig unübersichtlich ist und die Informationen auf unterschiedlichen Webseiten verteilt sind, werden insbesondere im Blogbereich sogenannte Aggregatoren verwendet. Es handelt sich dabei zumeist um eine Software, die Inhalte zu einem bestimmten Thema sammelt und diese Inhalte für den Nutzer aufbereitet. Ein wichtiges Konzept, welches hier Anwendung findet ist die Syndication von Inhalten. Aggregatoren existieren mittlerweile in einer vielfältigen Formen, so kann der Nutzer sich beispielsweise seine Inhalte selbst zusammenstellen (z.B. Pulse) oder aber es werden ihm Informationen aus einem bestimmten Bereich automatisiert angeboten (z.B. HackerNews). Andere Services ermöglichen es wiederum dem Nutzer, sich sein persönliches Magazin zusammenzustellen (z.B. Flipboard). Bei vielen Angeboten, werden die ausgewählten Inhalte zwar zusammengefasst und angeboten, aber zumeist ist es nicht möglich, diese Angebote auf seine spezifischen Interessen weiter einzuschränken. In dieser Bachelorarbeit soll beispielhaft anhand eines Newsaggregators (http://www.r-bloggers.com/) ein Service aufgebaut werden, der es dem Nutzer ermöglicht, die über den Newsaggregator bereitgestellten Inhalte weiter auf sein Interessengebiet einzuschränken. Diese Einschränkung kann über die textuelle Analyse der Blogeinträge erfolgen, über einen Klassifikator, der über die Bewertung und Auswahl des Nutzers seine Interessen lernt oder über beide Ansätze … [...Weiterlesen/more...] Peer Production hat als offene, kollektive Form der Zusammenarbeit mittlerweile zu umfassenden Informationssammlungen von nutzergenierten Inhalten geführt. Ein bekanntes Beispiel ist die Wikipedia, eine gemeinschaftlich erstellte Online Enzyklopädie. Geographisch verteilte Personen koordinieren ihre Aktivitäten bei der Erstellung der Artikel transparent und nachvollziehbar sind. Zunehmend finden bei dem Prozess der Artikelerstellung, der Artikelpflege, aber auch der Artikeladministration Bots Verwendung. Es handelt sich dabei um Software, welche algorithmisch definierte Aufgaben übernehmen. Die Zahl der aktiven Bots in der Wikipedia liegt mittlerweile bei über 200 und über 15 Prozent aller Edits ist bereits auf sie zurückzuführen (Geiger and Ribes, 2010). Die Aufgabe in dieser Bachelorarbeit ist es, die Arbeit von Bots in der Wikipedia zu untersuchen. Zunächst muss dazu ermittelt werden, nach welchen Regeln Bots in der Wikipedia eingesetzt werden dürfen und Dabei soll untersucht werden, welche Aufgaben, in welchen Namensräumen Bots in der Wikipedia erfüllen. Können die unterschiedlichen Aufgaben in Aufgabenbereiche zusammengefasst werden? Welche Personen haben diese Programme erstellt und wie regelmäßig werden sie eingesetzt? In welchen Programmiersprachen wurden zur Entwicklung genutzt? Wie komplex sind diese Programme? Haben sich die Aufgaben dieser Programme im Zeitverlauf geändert? Ale gesammelten Daten sollen in einer Datenbank ablegt werden. Nach einer allgemeinen Analyse sollen vor allem … [...Weiterlesen/more...] Wir möchten neue Themen für Abschlussarbeiten anbieten. Bei Interesse an einem der Themen aus - Implementierung eines Werkzeugs zur graphischen Analyse von SPARQL Anfragen (BA)
kontaktieren Sie bitte luczak@inf.fu-berlin.de.… [...Weiterlesen/more...] Peer Production, als offene und kollektive Form der Zusammenarbeit, hat im letzten Jahrzehnt an Bedeutung gewonnen. Beispiele dafür sind unter anderem Wikipedia, als gemeinschaftlich erstellte Online Enzyklopädie, sowie YouTube.com oder Del.icio.us als umfassende Informationssammlungen mit nutzergenerierten Inhalten. Dabei koordinieren geographisch verteilte Personen ihre Aktivitäten durch den Einsatz von Informations- und Kommunikationssystemen. Diese digitalen Archive ermöglichen wiederum, dass die dabei entstehenden Ereignisdaten transparent und nachvollziehbar sind. Das teilweise nur implizite Ziel dieser Zusammenarbeit ist die Erstellung eines digitalen Produkts. Die Aufgabe in dieser Master- bzw. Diplomarbeit ist es zu untersuchen, wie die offene Gemeinschaft sich bezüglich der unterschiedlich anfallenden Aufgaben zur Produkterstellung koordiniert. Als Anwendungsfall soll dabei die Wikipedia dienen. Nach einem umfassenden Literaturstudium, sollen in der Arbeit vorhandene Aktivitäten, die während des Lebenszyklus eines Artikels erfolgen, identifiziert werden. Als Entwicklungszyklus wird der Entwicklungsstand eines Artikels in Bezug auf das Qualitätsbewertungssystem der Wikipedia-Community definiert. Das Ziel ist es zu untersuchen, ob Unterschiede bei den Aktivitätstypen und dem Aktivitätsumfang in Abhängigkeit von der qualitativen Bewertung des Artikels bestehen. Aufbauend auf den Ergebnissen soll ein Empfehlungssystem entworfen werden, das diese Daten nutzt, um einerseits Nutzer die in der Vergangenheit bestimmte Aktivitäten ausgeführt haben, Artikel zu empfehlen, bei denen diese Aktivitäten noch nicht … [...Weiterlesen/more...] | |