5. Die statistische Analyse

5.1. Bewertende Statistik mittels Z-Werten

Hier eine kurze Darstellung der Rechenoperationen für die Bestimmung der Z-Werte nach MULLER (1972):

Man kann sagen, daß bei streng zufälliger Verteilung der Belege eines Namentyps auf die Zeitabschnitte ein genau zu definierender Erwartungswert erreicht wird. Er wird berechnet, indem die relative Häufigkeit der Belege an allen Siedlungsnamen (S.95) mit der Anzahl der Siedlungsnamen des betreffenden Zeitabschnitts multipliziert wird (S.55).
Von der tatsächlichen Belegzahl des Namentyps während dieses Zeitabschnitts wird nun der berechnete Erwartungswert abgezogen. Die Differenz ist die absolute oder tatsächliche Abweichung (S.55).
Aus der relativen Häufigkeit ist eine theoretische Standardabweichung (S.95) zu berechnen.
Zur Bewertung der Abweichung (S.103) kann dann das Verhältnis zwischen tatsächlicher Abweichung und theoretischer Standardabweichung berechnet werden. Diese Division ergibt als relative Abweichung den Z-Wert (S.103), für den MULLER die entsprechende Tabelle bietet. Demnach sind Z-Werte von /2/ signifikant, solche ab /2,5/ bereits hochsignifikant.
Vice versa wurde diese bewertende Statistik mittels Z- Werten auch für die Beleghäufigkeit der Siedlungsnamen in den einzelnen hessischen Teillandschaften{16} verwendet. Dabei tritt ein Phänomen auf, das die Grenzen der statistischen Methode aufzeigt. Erscheint nämlich nur ein Beleg für einen Namentyp, der insgesamt im Untersuchungsgebiet nur wenige (20 bis 25) Vertreter hat, in einem Gebiet mit insgesamt nur 5 Siedlungsnamen, dann führt dies bereits zu einer Signifikanz. Diese ist dann allerdings sozusagen rein rechnerischer Natur und darf nicht berücksichtigt werden. Für solche Verhältnisse hat die Methode der Z-Wert-Berechnung keinen Aussagewert mehr.

Da diese statistische Methode von grundlegender Bedeutung für die Untersuchung ist, folgt nun eine genaue Darstellung des Ganges der Berechnung:

Zuerst berechnet man den Erwartungswert (E): Die Häufigkeit eines Namentyps wird durch die Gesamtzahl der Namen geteilt. Das Ergebnis (die relative Häufigkeit) wird mit der Anzahl sämtlicher Namen im zu untersuchenden Zeitraum multipliziert. Das Produkt ist der Erwartungswert (E).

Nun eruiert man die absolute Abweichung (AA), indem man von den tatsächlich gezählten Namen eines Typs im untersuchten Zeitraum den Erwartungswert abzieht. Dabei können sowohl positive wie negative Werte auftreten.

Anschließend muß die theoretische Standardabweichung (th. Stabw.) ermittelt werden. Sie ergibt sich aus der Quadratwurzel folgenden Produktes: (sämtliche Namen im Untersuchungszeitraum * relative Häufigkeit * (|relative Häufigkeit - 1|)).

Nun ist die relative Abweichung zu berechnen. Sie ergibt sich aus der Division von absoluter Abweichung und theoretischer Standardabweichung und wird als Z-Wert bezeichnet: Absolute Abweichung : Theoretische Standardabweichung = Z-Wert.


{11} Näheres dazu ist in den Beschreibungen der einzelnen Namentypen in Kap. B. dieser Arbeit erwähnt.

{12} Zur Auswertung wurde die Datierung des Originals - auch bei kopialer Überlieferung - zugrunde gelegt. Bei Fälschungen galt das Datum der Fälschung, nicht die gefälschte Jahreszahl. Ein Beleg aus einer Fälschung zählt also nur dann als Erstbeleg, wenn der Ort zur Zeit der Abfassung dieser Fälschung noch nicht anderweitig urkundlich erwähnt wurde. Dies beruht auf der Annahme, daß der betreffende Ort zur Zeit der Fälschung auf jeden Fall bestanden haben dürfte.

{13} vgl. DNK (Bd.2, §§657-689) und Bach (1957).

{14} Das Buch erschien posthum.

{15} Diese Analysemethode ist dargestellt in Muller (1972).

{16} s. Beschreibungen der einzelnen Namentypen in Kapitel B dieser Arbeit.