Adresse und Kontakt

AG Netzbasierte Informationssysteme
FU Berlin
Königin-Luise-Straße 24-26
14195 Berlin

Tel.: +49-30-838-75221
Fax: +49-30-838-75220

This site is no longer maintained. You see a static copy as of April 1 2016.

Phonetische Suche in CiviCRM

CiviCRM ist ein auf die Belange von Non-Profit-Organisationen (NPO) zugeschnittenes Constituent Relationship Management (CRM) System. Es wird als Open Source Software entwickelt und ist seit 2010 von der Free Software Foundation zur Kontaktverwaltung für NPOs empfohlen. In den USA wird die Software bereits von mehreren tausend Organisationen eingesetzt. Seit 2012 arbeitet der Verein „Software für Engagierte e.V.“ an einer Deutschen Lokalisierung. Ein erstes Treffen der Berliner Community fand im Februar 2013 statt.

Phonetische Suche erlaubt einem Anwender, auch mit einer ungefähren Schreibweise eines Wortes einen Datenbanktreffer zu erzielen. Das ist vor allem für die Suche nach Eigennamen wichtig. Wenn beispielsweise ein Nutzer in der Adressdatenbank nach „Christoph Meyer“ sucht, sollen auch „Christoph Meier“ oder „Kristof Mair“ als mögliche Treffer angezeigt werden. Es funktioniert also ähnlich, wie wenn man sich beim Googlen vertippt und Google einem mit „meinten Sie: …“ antwortet. Hierzu werden Approximate String Matching-Algorithmen verwendet, auch als Fuzzy-String-Suche bezeichnet. Als Distanzmaß kann der Levenshtein-Abstand (ähnlich wie der Hamming-Abstand, aber auch für Wörter verschiedener Länge) genutzt werden, oder auch differenzierte Metriken, die sich auf die phonetische Gestalt des Wortes stützen (z.B. Kölner Phonetik, Phonet-Verfahren).

In der Arbeit soll CiviCRM (auf der Basis von Drupal) aufgesetzt werden und um die Funktion einer phonetischen Suche erweitert werden. Als Anwendungsfall steht die Adressverwaltung der Menschenrechtsorganisation Peace Brigades International (pbi) zur Verfügung, die auf CiviCRM umgestellt wird. Für die phonetische Suche sollen mehrere Verfahren (vgl. Wilz 2005) implementiert und bei pbi installiert werden. Zur Bestimmung des geeignetsten Verfahrens soll bei jeder Suche ein Verfahren zufällig gewählt und gezählt werden, ob der Anwender statt des wörtlichen einen der phonetischen Treffer wählt. Abschließend soll der Code als CiviCRM-Extension in das Open-Source Projekt zurückfließen.

Inhalte der Arbeit und empfohlene Arbeitsschritte:

  • Installation von CiviCRM
  • Identifizierung der Anwendungsfälle, für die phonetische Suche in Frage kommen (z.B. Familienname, Rufname, Name einer Organisation, Straße, Ort)
  • Implementierung der Algorithmen zur phonetischen Suche
  • Einbindung in CiviCRM und Installation bei pbi
  • Auswertung der Nutzerakzeptanz (Anzahl gewählter Phonetischer Treffer je Verfahren)
  • Dokumentation und Integration in das CiviCRM Repository

Weiterführende Informationen

Art der Arbeit: Bachelorarbeit

Voraussetzungen:

  • Programmierkenntnisse in PHP
  • wünschenswert sind Erfahrungen mit CMS, speziell Drupal
  • Interesse an Computerlinguistik und an Open Source

Betreuung: Till Zoppke, Prof. Dr. C. Müller-Birn

Bei Interesse, weiteren Fragen oder zwecks Vereinbarung eines Sprechstundentermins bitte senden Sie eine E-Mail an Prof. C. Müller-Birn.

 

AG Netzbasierte Informationssysteme, http://www.ag-nbi.de
Königin-Luise-Straße 24-26, 14195 Berlin, Tel.: +49-30-838-75221, Fax: +49-30-838-75220