Adresse und KontaktAG Netzbasierte Informationssysteme Königin-Luise-Straße 24-26 14195 Berlin Tel.: +49-30-838-75221 Fax: +49-30-838-75220 | Abschlussarbeiten bei NBI sind möglich indem der der/die Kandidat/in ein Thema aus den hiesigen Vorschlägen wählt oder ein eigenes Thema vorschlägt. In beiden Fällen ist es wichtig, dass die Vorkenntnisse des/der Kandidat/in für das Thema nützlich sind, der/die Kandidat/in wirkliches fachliches Interesse an dem Thema hat und das Thema für NBI interessant ist 1. Für die Anmeldung der Abschlussarbeit müssen a) ein einseitiges Exposé der Arbeit und b) eine Gliederung der Arbeit mit konkreten Überschriften und einem Mengengerüst vorliegen. Gerne können wir daraus einen Projektplan für das Schreiben der Arbeit erstellen. 2. Nach Anmeldung findet eine Betreuung statt durch regelmässige Treffen mit Diskussion und Präsentation des jeweiligen Stands, dessen Abgleich mit dem Projektplan und Detailkorrektur einiger Seiten der Arbeit. 3. Gegen Ende der Arbeit muss der/Die Kandidat/in die Verantwortung für die Arbeit selber übernehmen, es gibt also weniger Betreuung. Korrekturen und Vorbewertungen des Stands der Arbeit kurz vor Abgabe sind nicht möglich. 4.Die Arbeit muss immer auch elektronisch als PDF direkt an NBI-Gutachter per Mail oder CD übermittelt werden. Grund dafür ist einerseits dass die Arbeiten zunehmend elektronisch gelesen werden, andererseits die nur selten notwendige automatisierte Überprüfung auf Plagiate. Alles zum Ablauf des Vortrags etc. … [...Weiterlesen/more...] Peer Production hat als offene, kollektive Form der Zusammenarbeit mittlerweile zu umfassenden Informationssammlungen von nutzergenierten Inhalten geführt. Ein bekanntes Beispiel ist die Wikipedia, eine gemeinschaftlich erstellte Online Enzyklopädie. Geographisch verteilte Personen koordinieren ihre Aktivitäten bei der Erstellung der Artikel transparent und nachvollziehbar sind. Zunehmend finden bei dem Prozess der Artikelerstellung, der Artikelpflege, aber auch der Artikeladministration Bots Verwendung. Es handelt sich dabei um Software, welche algorithmisch definierte Aufgaben übernehmen. Die Zahl der aktiven Bots in der Wikipedia liegt mittlerweile bei über 200 und über 15 Prozent aller Edits ist bereits auf sie zurückzuführen (Geiger and Ribes, 2010). Die Aufgabe in dieser Bachelorarbeit ist es, die Arbeit von Bots in der Wikipedia zu untersuchen. Zunächst muss dazu ermittelt werden, nach welchen Regeln Bots in der Wikipedia eingesetzt werden dürfen und Dabei soll untersucht werden, welche Aufgaben, in welchen Namensräumen Bots in der Wikipedia erfüllen. Können die unterschiedlichen Aufgaben in Aufgabenbereiche zusammengefasst werden? Welche Personen haben diese Programme erstellt und wie regelmäßig werden sie eingesetzt? In welchen Programmiersprachen wurden zur Entwicklung genutzt? Wie komplex sind diese Programme? Haben sich die Aufgaben dieser Programme im Zeitverlauf geändert? Ale gesammelten Daten sollen in einer Datenbank ablegt werden. Nach einer allgemeinen Analyse sollen vor allem … [...Weiterlesen/more...] Bei der Entwicklung von Open Source Software ist der Chat ein wichtiges Instrument der synchronen Kommunikation. Es werden aktuelle Änderungen am Source Code dokumentiert, Probleme bei der Softwareentwicklung diskutiert, Nutzerfragen beantwortet oder aber auch Diskussionen zu den unterschiedlichsten Themen geführt. Die Frage ist, was für Personen beteiligen sich an den Gesprächen? Wie viele sind aktiv oder hören einfach nur zu? Wie lang “hören” nicht aktive Nutzer zu, bevor sie aktiv werden? Ist es möglich, bei den aktiven Nutzern bestimmte Kommunikationsrollen zu identifizieren? Welche Formen der Partizipation existieren innerhalb des Chats? An welchen Themen beteiligen sich die Nutzer an der Diskussion? Beteiligen sich Nutzer in Abhängigkeit von der Art des Thema an der Diskussion? Um diese Frage beantworten zu können, ist es notwendig, bestehende Kommunikationsstrukturen im Zeitverlauf zu untersuchen und die Beteiligung der einzelnen Nutzer zu analysieren. Im Rahmen dieser Arbeit sollen bestehende Kommunikationsstrukturen im open source software Projekt MediaWiki untersucht werden. Bestehende IRC (Internet Relay Protocol) Logdaten (Übersicht über Channels) sollen programmatisch in eine Netzwerkbeschreibung überführt, beteiligte Personen und ihre Interaktionen beschrieben und analysiert werden. Eine Analyse der Netzwerke kann mit Hilfe bestehender Werkzeuge/Bibliotheken wie beispielsweise visone, gephi oder igraph erfolgen. Ebenfalls werden Werkzeuge, wie beispielsweise PieSpy … [...Weiterlesen/more...] Die Wikipedia ist nun mittlerweile 10 Jahre alt und noch immer helfen viele Freiwillige bei deren weiteren Auf- und Ausbau. Ein häufig genannte These ist, dass Wikipedia nicht die Arbeit Vieler ist, sondern vor allem von einer Kerngruppe geschrieben wurde. Dazu bestehen bereits vielfältige Untersuchungen, mit teilweise recht unterschiedlichen Ergebnissen. Wie dem auch sei, die Frage ist, ob die Art der Beiträge sich nicht von der bestehenden Qualität der Beiträge unterscheidet und das ganz bestimmte Personen zu ganz bestimmten Zeitpunkten an der Erstellung der Artikel beteiligen. Ein erster Ansatzpunkt der Qualitätsbeurteilung der Beiträge ist das vorhandene Kategorisierungssystem in der Wikipedia. Hier werden Beiträge nach vordefinierten Kriterien bestimmten Qualitätsstufen zugeordnet. Diese Arbeit kann helfen, ein verbessertes Verständnis für vorhandene Artikelerstellungsprozesse in der Wikipedia zu erlangen. Zugrunde liegender Datensatz: Wikipedia Literatur: Die Bedeutung von open-source Softwareprojekten ist mittlerweile unbestritten. Es existieren eine Reihe sehr erfolgreicher und bekannter Projekte, wie beispielsweise Linux. In einer aktuellen Studie der Linux Foundation wurde zwischen Dezember 2008 und Januar 2010 der zum Linux-Kernel zugefügte Quellcode untersucht. Ergebnis dieser Analyse war, dass 75% des Quellcodes von Personen beigetragen wurde, die in Unternehmen angestellt sind, während nur 18% der Beiträge auf Personen zurückgeführt werden konnten, die sich ehrenamtlich beteiligt haben [1]. In dieser Arbeit soll der Frage nachgegangen werden, wo und wie sich Unternehmen bei der Entwicklung von open-source Software beteiligen. Ersteres soll mit Hilfe der Analyse vorhandener Kommunikationsdaten der Mailinglists, aus Commit-Daten aus Source-Code-Management-Systemen und Fehlermeldungen aus der genutzten Bug Tracking Software erfolgen. Die unterschiedlichen Repositories sollen in einer Datenbank zusammengeführt werden, was neben anderen bestehenden Herausforderungen eine Entity Resolution [2] erfordert, da Nutzer sich oft mit unterschiedlichen E-Mail-Adressen und abweichenden Namen in den verschiedenen Systemen angemeldet haben. Um die Frage nach dem „wie“ zu beantworten, sollen die gewonnenen Erkenntnisse aus dem ersten Teil der Arbeit genutzt werden und mit vorhandenen Ansätzen aus der Literatur verglichen werden. Beispielsweise werden unterschiedliche Modell der Unternehmensbeteilung unterschieden, wie das Coding Model, das Support Model und das Management Model [3]. Innerhalb … [...Weiterlesen/more...] Websites wie deutsche-startups.de oder gruenderszene.de listen regelmäßige Neuigkeiten zu Finanzierungen, Beteiligungen, Übernahmen und auch Insolvenzen zu deutschen Startups. Weiterhin sind Verzeichnisse von Startups und Investoren vorhanden. Unternehmen und Investoren bilden durch die Verbindung über Investments in einem Netzwerk. Im Rahmen dieser Arbeit soll dieses Netzwerk ermittelt und analysiert werden. Dazu müssen die verteilt vorliegenden Online-Informationen geeignet analysiert werden. In der Arbeit sind die Informationen von den genannten Sites zu extrahieren (z.B. durch einen Crawler, einen Screen Scraper wie scrapy oder geeignete eigene Scripte). Nach der Extraktion des genannten Netzwerks mit mehreren Kanten- und Knotentypen ist eine Analyse der sich ergebenden Netzwerkstruktur und dessen temporale Entwicklung mit Hilfe eines geeigneten Werkzeugs durchzuführen. Insgesamt sollen Aussagen über die Struktur des deutschen Beteiligungsmarktes für IT-Startups gemacht werden. Art der Arbeit: Studien- oder Bachelorarbeit Voraussetzungen: Kenntnisse in einfacher Textextraktion, Netzwerken, Statistik Betreuer: Prof. Robert Tolksdorf Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen… [...Weiterlesen/more...] Douglas Adams, Per Anhalter durch die Galaxis: Roman (Werbung), um S.186: “Die Geschichte jeder bedeutenderen galaktischen Zivilisation macht drei klar und deutlich voneinander getrennte Phasen durch – das bare Überleben, die Wissensgier und die letzte Verfeinerung, allgemein auch als Wie-, Warum- und Wo-Phasen bekannt. Die erste Phase zum Beispiel ist durch die Frage gekennzeichnet: Wie kriegen wir was zu essen?, die zweite durch die Frage: Warum essen wir?, und die dritte durch die Frage: Wo kriegen wir die besten Wiener Schnitzel?” Heute sind Restaurants online, teilweise sind Speisekarten verfügbar. Es gibt einige Web-Dienste, die diese sammeln (http://www.gourmetclassic.de/sitemap/speisekarten.html, http://www.speisekarte.de oder http://www.mister-wong.de/tags/speisekarte ). Die Eintragung von Seiten durch Nutzer oder Betreiber füllt diese Datenbanken. In der Abschlussarbeit soll themenspezifisch versucht werden, automatisiert ein suchbares Verzeichnis möglichst vieler Speisekarten deutscher Restaurants zu erstellen. Es soll also ein Crawler entstehen, der durch Heuristik Restaurant Homepages ermittelt, die Geoinformationen des Restaurants herausfindet, auf der Site Speisekarten auswählt und deren Inhalt extrahiert. Die Ergebnisse sollen in eine Datenbank eingestellt und über einen Suchdienst anfragbar gemacht werden. Schließlich muss ein Wartungsprozess definiert und möglichst weit implementiert werden. Rahmenwerke wie beispielsweise SMILA oder Nutch und Screen Scraper wie scrapy sollen benutzt werden. Sämtliche Software ist unter … [...Weiterlesen/more...] Die Requests for Comments, RFCs definieren die Standards des Internet. Der Korpus dieser Dokumente liegt in verarbeitbarer und weit regulierter Form vor.Dokumente sind in verschiedene Kategorien eingeordnet. Aufgabe dieser Arbeit ist die Erfassung und Analyse des kompletten RFC Korpus als Netzwerk. Beziehungen darin umfassen die definierten und in Metadaten erfassten “Obsoletes xxx”, “Obsoleted by xxx”, “Updates xxx”, “Updated by xxx” aber auch das durch Referenzen sich ergebende Zitationsnetzwerk zu weitern RFCs einerseits und zu externen Quellen andererseits. In der Arbeit soll eine Erfassung der vorliegenden RFC Dokumente erfolgen, eine Extraktion der Beziehungen zu anderen Dokumenten und Standards sowie eine Analyse der sich ergebenden Netzwerkstruktur mit Hilfe eines Werkzeugs wie SONIVIS erfolgen. Die Arbeit wurde von Maciej Wienszczak bearbeitet und liegt als PDF vor: “Analyse des Normennetzwerks der Internet Requests for Comments“.… [...Weiterlesen/more...] Webrings sind eine sehr alte Struktur im Web mit der thematisch ähnliche Sites über ein externes Navigationselement verknüpft werden sollen. In der Arbeit soll statistisch geprüft werden ob dies erreicht wird. Ausgehend vom Verzeichnis von Webrings bei www.webring.com soll zunächst die Strukturen von Webrings (Größe und Konnektivität) analysiert werden. Weiterhin sollen jeweils miteinander verbundene Site auf Ähnlichkeit überprüft werden (Indexierung z.B. mit Lucene und Berechnung des Dokumentenabstands) sowie die Auswirkung auf die Popularität der verbundenen Sites anhand ihres Pageranks (statischer Vergleich des Pageranks innerhalb des Webrings mit dem vondurch google als ähnlich identifizierten Sites ausserhalb des Webrings) analysiert werden. Art der Arbeit Studien- oder Bachelorarbeit Voraussetzungen Kenntnisse in Web Technologien, Information Retrieval, Netzwerke Betreuer Prof. Robert Tolksdorf Weitere Informationen Sprechstundentermin bei Prof. Robert Tolksdorf nehmen… [...Weiterlesen/more...] Informationen über wissenschaftliche Konferenzen in der Informatik und anderen Wissenschaften sind im Netz nur schlecht erschließbar. Neben den völlig verstreut angebotenen eigentlichen Konferenzankündigungen und Aufrufen zur Beitragseinreichung gibt es verschiedene Angebote mit Sammlungen solcher Informationen. So wollen z.B. allconferences.com oder goingtomeet.com möglich alle Konferenzen erfassen, während Fachverbände wie die IEEE, die ACM oder die GI jeweils informatikspezifische Kalender anbieten. Wissenschaftler möchten die Anfrage “Auf welchen Konferenzen kann ich meine Arbeit im Themenbereich X, Y und Z einreichen” einfach von einer Suchmaschine beantwortet bekommen. Eine solche Suchmaschine existiert bislang aber nicht. In der Arbeit soll ein Rahmenwerk geschaffen und exemplarisch für informatische Themen realisiert werden mit dem aus unterschiedlichen Quellen erschlossene Konferenzankündigungen Informationen über die jeweils geforderten Themen ermittelt werden und auf dieser Basis die obige Anfrage präzise und umfassend beantwortet werden kann. Dabei soll eine Ontologie für die Themenklassifikation sowie eine semantische Suche genutzt werden. Das Rahmenwerk soll exemplarisch für Konferenzen aus der Informatik realisiert werden, gleichzeitig aber so allgemein sein, dass leicht eine Suchmaschine für andere Disziplinen (z.B. Elektrotechnik, Mathematik) oder andere Veröffentlichungsarten (z.B. wissenschaftliche Zeitschriften) konfiguriert werden könnte. Die zu erstellende Software soll als LGPL lizensiert sein. Art der Arbeit Diplom- oder Masterarbeit Voraussetzungen Kenntnisse in Web-Technologien … [...Weiterlesen/more...] | |