5. Die statistische Analyse

Bevor die Siedlungsnamen aus dem Untersuchungsmaterial kartographisch aufbereitet werden konnten, war die statistische Beschreibung notwendig. Zuerst galt sie der Frage, ob sich die einzelnen Namentypen durch ihre Erstbelegzeiten signifikant voneinander unterscheiden. Anschließend sollte sie zeigen, ob es innerhalb der durch die Zweitglieder gebildeten Namengruppen weitere spezifische Merkmale (Qualität der Erstglieder; Muster der Wortbildung) gibt, die in bezug auf die Entfaltung in Zeit und Raum die Bestimmung von Untergruppen ermöglichen. So konnte etwa die vielfach geäußerte Vermutung, daß Siedlungsnamen bestimmter Grundworttypen mit sachbezogenem Bestimmungsglied älter sind als jene mit personalem, am Beispiel der hessischen Namen überprüft werden. Allerdings ergaben sich dabei insgesamt gesehen keine statistisch signifikanten Erscheinungen{11}. Weiterhin wurde die statistische Analyse herangezogen, um die Namentypen mit der naturräumlichen Gliederung Hessens zu korrellieren.

Bereits die wortbildungsmäige Deutung hatte zur Unterscheidung sprachlich definierter Gruppen von Siedlungsnamen (Typen) geführt. Für die vorliegende Untersuchung sind die Zusammensetzungen, Ableitungen und genitivischen Namen von besonderer Bedeutung, da sie den gröten Anteil des Gesamtnamenschatzes ausmachen. Außerdem weisen sie deutliche Gruppenmerkmale auf. Der Aspekt der Gruppenbildung lät auf sprachliche Hintergründe schließen, die steuernd oder mindestens beeinflussend auf die Herausbildung des Namenschatzes einwirkten.

Wenn auch die Untersuchung über die in der Forschung beschriebenen Motive hinaus (DNK Bd.2, §§415-689) wohl kaum neue eruieren kann, so setzt sie sich doch zum Ziel, über die räumliche und/oder zeitliche Fixierung dieser Ereignisse Aufschluß zu bekommen. Es ist daher Aufgabe der statistischen Analyse, räumliche und zeitliche Gemeinsamkeiten unter den Namentypen zu bestimmen - wenn sie denn vorhanden sind.

Aus der statistischen Beschreibung des Namenmaterials ergibt sich, daß sechzehn Namengruppen (dabei sind -inghausen und -sen zu -hausen gestellt, sowie -ingheim und -sem zu -heim) 74 Prozent aller untersuchten Siedlungsnamen enthalten. Diese Namentypen dürfen daher mit Fug und Recht als kennzeichnend für die Namenlandschaft im Untersuchungsgebiet gelten - soweit die urkundliche Überlieferung mit der historischen Wirklichkeit kongruent ist.

Vom Einsetzen der Überlieferung im achten Jahrhundert bis zum Ende des Untersuchungszeitraums a.1200 wurden für die statistische Untersuchung die Erstbelegdaten{12} in Jahrhundert- Intervalle aufgeteilt (dabei bildeten das achte und das zwölfte Jahrhundert offene Intervalle).

Es stellte sich nun die Frage, ob in den Zeitabschnitten einzelne Namentypen besonders häufig belegt sind oder auffällig selten. Damit verbunden war die Vermutung, daß sich zeitlich begrenzte Namenmoden{13} durch einen deutlichen Anteil an den Erstbelegen eines oder mehrerer Zeitabschnitte erkennen lassen. Ein auffällig geringer Anteil hätte hingegen auf die Unüblichkeit des Namentyps im entsprechenden Zeitabschnitt schließen lassen.

In einigen namenkundlichen Arbeiten (BACH 1927; DITTMAIER 1956; DITTMAIER 1979) sind auch Zeitstatistiken aufgestellt worden. Die Autoren versprachen sich davon Hinweise auf die relative Chronologie der diversen Namentypen. BACH formulierte: "Wenn auch niemand die erhebliche Lückenhaftigkeit des aus den Urkunden gewonnenen Namenmaterials bezweifeln kann ..., wenn ein Ort auch lange bestanden haben mag, ehe er urkundlich nachzuweisen ist, so dürfen wir doch dem Zufall die Tücke nicht zuschreiben, daß er ganze umfangreiche Gruppen mit typischen Namen benannter Orte durch Jahrhunderte hindurch der Überlieferung fern gehalten hätte. Diese Orte bestanden eben vorher (oder lange vorher) überhaupt nicht. Im allgemeinen wird ein Typ umso besser überliefert sein, je älter er ist." (BACH 1927, S.169; vgl. auch DNK Bd.2, §466.5). Bei der zahlenmäigen Auswertung kam man jedoch über eine beschreibende Statistik nicht hinaus und war infolgedessen nicht in der Lage, die gefundene statistische Verteilung exakt zu bewerten.

DITTMAIER meinte: "Die Tradition sagt über den einzelnen Ort oder Namen gar nichts oder nur sehr wenig aus, weil seine Nennung ja auf reinem Zufall beruht. Auch gegenüber der Gesamtüberlieferung ganzer ON-Typen ist noch Vorsicht geboten; wesentlich ist hierbei eigentlich nur die Zeit des ersten Erscheinens. Einen gewissen Aussagewert kann man ferner noch den Zahlen - und Verhältniswerten der Zeit bis 1100, bevor also im 12. Jh. der große Traditionssprung einsetzt, zubilligen. .... Auf diese Weise gewinnen wir einen einigermaßen zuverlässigen imaginären Sicherheitskoeffizienten" (DITTMAIER 1979, S.137). Hier irrte DITTMAIER, wenn diese Formulierungen die seinen sind{14}, weil gerade die geringe Menge der Belege eine prozentuale Angabe ad absurdum führt. Sinnvoll wäre diese in der Tat erst dann, wenn das Korpus eine stattliche Gröe erreicht hat. Überdies sind Verhältnis- oder Prozentangaben eine recht ungenaue Angelegenheit.

Aus heutiger Sicht ist es sicherlich dem Spiel des Zufalls überlassen, wann und wo ein Schenker einem Kloster welchen Besitz in welchem Ort überlät. Damit, so die Konsequenz, ist es das Auftreten des betreffenden Siedlungsnamens in der Überlieferung natürlich auch.

Gerade dieses Faktum bildet jedoch die Grundlage für folgende statistische Überlegung. Da das Auftreten eines Namens in der Überlieferung zufällig ist, ist der aus dieser Überlieferung gewonnene Namenschatz als eine Zufallsstichprobe zu beschreiben. Das Verhältnis dieser Stichprobe zur Grundgesamtheit, aus der sie gewonnen wurde, ist nicht näher zu beschreiben, da die Grundgesamtheit der Siedlungsnamen im Untersuchungsgebiet als unbekannte Gröe definiert werden muß.

Allerdings ist es sehr wahrscheinlich anzunehmen, daß diese Gröe nicht ein Vielfaches der Stichprobe ausmacht. Schon ein Blick auf die Grundkarte (Nr.1) beweist, daß die belegten Siedlungsnamen geographisch keine Lücken aufweisen. Außerdem spricht es für die Vermutung, daß die heutige Zahl der Orte (vor der "Ortsnamenbereinigung" im Zuge der Verwaltungsreform in den 70er Jahren) nur etwa das 1,5-fache der Stichprobe ausmacht. Aus Gründen der statistischen Theorie ist daraus zu folgern, daß sich das Untersuchungsmaterial (die Stichprobe) sehr ähnlich verteilt, wie die Grundgesamtheit (alle tatsächlich im Untersuchungszeitraum existierenden Siedlungen).

Die besonders in Hessen sehr vielfältige Wüstungsforschung (PLETSCH 1989, S.97ff) hat sich intensiv mit dem Problem auseinandergesetzt, warum und wie Siedlungen aufgegeben worden sind. Die Nachrichten über wüste Siedlungen noch im Untersuchungszeitraum sind indes äußerst spärlich. Außerdem sind im Rahmen der vorliegenden Untersuchung die Wüstungserscheinungen nicht von Bedeutung. Sie haben praktisch keinen Zusammenhang mit der räumlichen und zeitlichen Entfaltung der typischen Siedlungsnamen, die sich ja implizit auf den Vorgang der Namengebung, nicht auf des Schicksal der benannten Orte bezieht. Der sogenannte Wüstungsquotient ist verschiedentlich zur Altersbestimmung von Namentypen herangezogen worden, da die wirtschaftlichen Gründe für das Wüstfallen von Orten nicht zuletzt in der naturräumlichen Ungunstlage zu sehen sind. So ließ sich die These aufstellen, daß jener Namentyp der jüngere sei, der einen höheren Wüstungsanteil hat (DNK Bd.2. §466.7).

 

Die Arbeitshypothese

Man kann nun die Hypothese aufstellen, daß die Belege der Siedlungsnamen in den Zeitintervallen rein zufällig auftreten. Dies lät sich anhand einer statistischen Testmethode überprüfen. In der Regel ist diese Methode der Chi2-Test, der für das vorliegende Material nicht zu verwenden ist, weil die Erwartungswerte oft geringer als 5 sind. Daher wurde ein anderes Verfahren angewandt, das jedoch im wesentlichen nach demselben Muster abläuft. Für jeden Beobachtungswert wurde ein theoretischer Erwartungswert errechnet. Die Differenz zwischen dem Beobachtungswert und dem Erwartungswert (absolute Abweichung) wurde dann durch die theoretische Standardabweichung dividiert. Das Ergebnis, die relative Abweichung, kann nach der Z-Werte- Tabelle (MULLER 1972, S.287) in seiner Wahrscheinlichkeit bestimmt werden. Das Ergebnis des Tests führt zur exakten Bestimmung zufälliger Beleghäufigkeiten ebenso wie zum Nachweis von Häufigkeiten, die anderen Gesetzmäigkeiten als denen des Zufalls gehorchen.

Zwar ist das Ergebnis nicht absolut zu definieren. Es gibt aber an, mit welchem Sicherheitsgrad die Entscheidung richtig ist. Im Rahmen der vorliegenden Untersuchung wurde zunächst ein Sicherheitsniveau von fünf Prozent gewählt. Das bedeutet, daß in fünf von hundert Fällen die Entscheidung falsch sein kann. Bei der Berechnung stellte sich jedoch heraus, daß für einen großen Teil der Angaben tatsächlich ein Sicherheitsniveau von weniger als einem Prozent gilt!

Zur Beurteilung der Z-Werte sei erwähnt, daß Z-Werte von |2| dem Fünf-Prozent-Niveau der Sicherheit und solche von |2,5| dem Ein- Prozent-Niveau entsprechen.

Der statistische Test ergab, daß von den betrachteten Namengruppen 16 bei einer Irrtumswahrscheinlichkeit von höchstens fünf Prozent (Z>=2) im achten bis zwölften Jahrhundert nicht zufällig auftreten. Bei einer Irrtumswahrscheinlichkeit von maximal einem Prozent (Z>=2,5) sind es immerhin noch elf Namentypen! Diese müssen also als zeitlich begrenzte Massenerscheinung betrachtet werden, wobei die Aussage natürlich nur für den Untersuchungszeitraum gilt.

Ob die solcherart definierten Massenerscheinungen Namenmoden widerspiegeln, ist zumindest für den ersten Abschnitt des Untersuchungszeitraums noch nicht zu entscheiden. Für diese Zeit bis Ende des achten Jahrhunderts ist es wahrscheinlicher anzunehmen, daß zunächst ein Reservoir bestehender Namen in den Quellen auftaucht, dessen Entstehung mehr oder weniger weit in die Frühzeit zurückreicht. Dagegen ist bei den späteren Massenerscheinungen mit gröter Wahrscheinlichkeit eine Namenmode als Ursache zu vermuten.

Nachdem auf diese Art für mehr als die Hälfte der für das Untersuchungsgebiet als kennzeichnend anzunehmenden Namentypen eine deutliche Abhängigkeit der Beleghäufigkeiten von einzelnen Zeitabschnitten des Beobachtungszeitraums festgestellt wurde, war zu eruieren, ob die bisher durch Grundwort, Suffix und Genitivmorphem definierten Namentypen in einzelnen Zeitintervallen bestimmte Wortqualitäten der Erstglieder aufweisen. Diese Einzelheiten sind in den Abschnitten über die einzelnen Namentypen behandelt.

Das Mittel zu all diesen Untersuchungen war eine spezielle Form der statistischen Analyse, die darüber Auskunft geben kann, ob bestimmte Zusammenhänge durch Zufall entstanden sein dürften oder ob hinter ihnen eine - wie auch immer beschaffene - Regelhaftigkeit zu erwarten ist. Es handelt sich dabei um die bewertende Statistik mittels Z-Werten{15}, die im Folgenden kurz erläutert wird.


{11} Näheres dazu ist in den Beschreibungen der einzelnen Namentypen in Kap. B. dieser Arbeit erwähnt.

{12} Zur Auswertung wurde die Datierung des Originals - auch bei kopialer Überlieferung - zugrunde gelegt. Bei Fälschungen galt das Datum der Fälschung, nicht die gefälschte Jahreszahl. Ein Beleg aus einer Fälschung zählt also nur dann als Erstbeleg, wenn der Ort zur Zeit der Abfassung dieser Fälschung noch nicht anderweitig urkundlich erwähnt wurde. Dies beruht auf der Annahme, daß der betreffende Ort zur Zeit der Fälschung auf jeden Fall bestanden haben dürfte.

{13} vgl. DNK (Bd.2, §§657-689) und Bach (1957).

{14} Das Buch erschien posthum.

{15} Diese Analysemethode ist dargestellt in Muller (1972).

{16} s. Beschreibungen der einzelnen Namentypen in Kapitel B dieser Arbeit.