Wissenswertes
Als Doublette, bzw. Dublette, bezeichnet man einen redundanten (doppelten, mehrfach vorhandenen) Datensatz in einer Datenbank. Die Problematik besteht hier meist darin, dass die Dopplung aufgrund einer differenzierenden Schreibweise, oder einer anderen minimalen Veränderung (Tippfehler, Zahlen- bzw. Buchstabendreher etc.) nicht von einer Prüfung erkannt wird.
Definition
Der Begriff Doublette stammt aus der Informationstechnologie. Dubletten sind redundante Kundendaten, welche oft Folge verschiedener Kommunikationswege sind. Sie verursachen oft hohe und vor allem unnötige Kosten, bspw. durch Mehrfachversandt. Zudem können sie sich negativ auf das Image eines Unternehmens auswirken (z.B. dadurch, dass Dubletten den Effekt von Spam hervorrufen können)
Wie entstehen Doubletten?
Oftmals erscheinen sie in Adressdatenbanken. Häufig entstehen sie, weil dieselbe Person bzw. Gesellschaft mit unterschiedlichen Eingangsinformationen erfasst wird, mehrere Adressbestände vereinigt werden oder sich die Daten im Laufe der Zeit schlichtweg ändern. Die Bereinigung dieser Fehler nennt sich Deduplikation.