CiviCRM ist ein auf die Belange von Non-Profit-Organisationen (NPO) zugeschnittenes Constituent Relationship Management (CRM) System. Es wird als Open Source Software entwickelt und ist seit 2010 von der Free Software Foundation zur Kontaktverwaltung für NPOs empfohlen. In den USA wird die Software bereits von mehreren tausend Organisationen eingesetzt. Seit 2012 arbeitet der Verein „Software für Engagierte e.V.“ an einer Deutschen Lokalisierung. Ein erstes Treffen der Berliner Community fand im Februar 2013 statt.
Phonetische Suche erlaubt einem Anwender, auch mit einer ungefähren Schreibweise eines Wortes einen Datenbanktreffer zu erzielen. Das ist vor allem für die Suche nach Eigennamen wichtig. Wenn beispielsweise ein Nutzer in der Adressdatenbank nach „Christoph Meyer“ sucht, sollen auch „Christoph Meier“ oder „Kristof Mair“ als mögliche Treffer angezeigt werden. Es funktioniert also ähnlich, wie wenn man sich beim Googlen vertippt und Google einem mit „meinten Sie: …“ antwortet. Hierzu werden Approximate String Matching-Algorithmen verwendet, auch als Fuzzy-String-Suche bezeichnet. Als Distanzmaß kann der Levenshtein-Abstand (ähnlich wie der Hamming-Abstand, aber auch für Wörter verschiedener Länge) genutzt werden, oder auch differenzierte Metriken, die sich auf die phonetische Gestalt des Wortes stützen (z.B. Kölner Phonetik, Phonet-Verfahren).
In der Arbeit soll CiviCRM (auf der Basis von Drupal) aufgesetzt werden und um die Funktion einer phonetischen Suche erweitert werden. Als Anwendungsfall steht die Adressverwaltung der Menschenrechtsorganisation Peace Brigades International (pbi) zur Verfügung, die auf CiviCRM umgestellt wird. Für die phonetische Suche sollen mehrere Verfahren (vgl. Wilz 2005) implementiert und bei pbi installiert werden. Zur Bestimmung des geeignetsten Verfahrens soll bei jeder Suche ein Verfahren zufällig gewählt und gezählt werden, ob der Anwender statt des wörtlichen einen der phonetischen Treffer wählt. Abschließend soll der Code als CiviCRM-Extension in das Open-Source Projekt zurückfließen.
Inhalte der Arbeit und empfohlene Arbeitsschritte:
- Installation von CiviCRM
- Identifizierung der Anwendungsfälle, für die phonetische Suche in Frage kommen (z.B. Familienname, Rufname, Name einer Organisation, Straße, Ort)
- Implementierung der Algorithmen zur phonetischen Suche
- Einbindung in CiviCRM und Installation bei pbi
- Auswertung der Nutzerakzeptanz (Anzahl gewählter Phonetischer Treffer je Verfahren)
- Dokumentation und Integration in das CiviCRM Repository
Weiterführende Informationen
- Projekthomepage von CiviCRM http://civicrm.org/
- Software für Engagierte e.V. http://sfe-ev.org/
- Wikipedia-Seite zur Phonetischen Suche http://de.wikipedia.org/wiki/Phonetische_Suche
- Martin Wilz: Aspekte der Kodierung phonetischer Ähnlichkeiten in deutschen Eigennamen, Köln 2005 http://uni-koeln.de/phil-fak/phonetik/Lehre/MA-Arbeiten/Martin_Wilz.pdf
- Peace Brigades International http://www.pbideutschland.de/
Art der Arbeit: Bachelorarbeit
Voraussetzungen:
- Programmierkenntnisse in PHP
- wünschenswert sind Erfahrungen mit CMS, speziell Drupal
- Interesse an Computerlinguistik und an Open Source
Betreuung: Till Zoppke, Prof. Dr. C. Müller-Birn
Bei Interesse, weiteren Fragen oder zwecks Vereinbarung eines Sprechstundentermins bitte senden Sie eine E-Mail an Prof. C. Müller-Birn.