Skaleninvarianz
und Benford Gesetz
Es lassen sich in
der realen Welt alle möglichen Daten finden, die das Benford Gesetz befolgen. Aus
diesem Grund muss das Benford Gesetz skaleninvariant
sein.
Begründung
Daten
können in verschiedenen Skalen angegeben sein:
Geldbeträge
in € oder in DM, Volumina in Gallonen oder in Litern.
Wenn das Benford
Gesetz in einer Skala gilt, dann muss es auch für alle anderen Skalen gelten.
Die
Verteilung des Vorkommens der ersten Ziffer darf sich also nicht ändern, wenn
die Zahlen (bei
der Umrechnung auf eine andere Skala) mit einem
beliebigen konstanten Faktor multipliziert werden.
Gleichförmige
Verteilung und Benford-Gesetz
Angenommen die
Ziffern 1,...,9 kommen gleichhäufig als erste Ziffer
Was passiert dann mit der Anfangsziffer einer Anzahl von Geldbeträgen die von € in DM umgerechnet werden?
(Faktor 2)
Schreibe zunächst jede Zahl in der Form
.
Beispiele
,
Ist nur die erste
Ziffer von Bedeutung, dann kann man sich mit dieser Schreibweise auf das
Intervall [1,10] beschränken.
Alle Zahlen aus
[5;10) beginnen nach Multiplikation mit dem Faktor 2 mit 1.
Alle Zahlen aus
[1;1,5) beginnen nach Multiplikation mit dem Faktor 2 mit 2 usw.
Wenn die
Skaleninvarianz gelten soll, dann ist eine Gleichverteilung für die erste
Ziffer nicht möglich!
Gesucht
ist eine Verteilung für die erste Ziffer, die sich nicht ändert, wenn die
Zahlen mit einem bel. konstanten Faktor multipliziert werden.
Transformation
der Problemstellung
Die Zahlen xÎ[1;10) werden betrachtet. Diese können durch
die Logarithmusfunktion zur Basis 10 auf die Zahlen y=log10(x) des
Intervalls [0;1) abgebildet werden:
Wenn die
Verteilung für die Zahlen x skaleninvariant sein soll, dann darf sich die
Verteilung der Zahlen y nicht ändern wenn eine beliebige Zahl zum Wert von y
addiert wird:
y+c=y+ log10(a)= log10(x)+ log10(a)=log(x
a)
.
Nach Voraussetzung
sind die Verteilungen der Zahlen x und x*a gleich, woraus die Behauptung folgt.
Welche
Verteilung der Zahlen y auf [0,1) ändert sich nicht, wenn eine beliebige Zahl
zu y addiert wird?
Verschiebungen modulo 1:
Nur eine konstante
Funktion verändert bei einer beliebigen Verschiebung modulo 1 ihr Aussehen
nicht.
Die Verteilung der
Zahlen y muss also die Wahrscheinlichkeitsdichtefunktion f(x)=1 auf [0,1)
besitzen:
mit
Das
Benford Gesetz
Wahrscheinlichkeit,
dass die erste Ziffer d einer Zahl gleich 1 ist:
P(d=1) = P(1£x<2) = P(0£y< log10(2)) =
.
Wahrscheinlichkeit,
dass die erste Ziffer d einer Zahl gleich n ist:
P(d=n) = P(n£x<n+1) = P(log10(n)£x< log10(n+1))
=
Die
Wahrscheinlichkeit, dass eine Zahl mit der Ziffer n beginnt ist
log10((n+1)/n).
Diese
Beziehung heißt Benford-Gesetz
Graphische Darstellung des Benford-Gesetzes: