Thesen zur Morphologie

- Harald Schweizer, Tübingen -

 
letzte Aktualisierung: 14. September 2010
 

Das folgende Papier ist noch im Entstehen. Diskussionsbeiträge sind erwünscht unter
harald.schweizer@uni-tuebingen.de .
Im übrigen gelten die gleichen Regeln wie sonst auch über den Umgang mit geistigem Eigentum: Wer das Papier ganz oder teilweise wiederverwendet, zitiert es ordnungsgemäß (am besten mit Versions- = Datumsangabe).
 

1. Notwendigkeit einer Neu-Definition?

1.1 Das Bedürfnis, "Morphologie" (neu) zu definieren, hat nur, wer Unzufriedenheit verspürt, etwa weil das traditionelle Morphologie-Verständnis nicht mit der Grundlage der modernen Sprachwissenschaft im Einklang steht, oder weil die bisherige Morphologie nicht gut mit den weiteren Feldern der Sprachbeschreibung abgestimmt ist. - Ich vermute, daß derzeit erst wenige ein solches Bedürfnis verspüren.

1.2 Wenn der Aufwand groß genug ist, lassen sich viele Fragestellungen für die Verarbeitung im Computer programmieren, auch solche, die theoretisch nicht durchdacht sind. Aber eigentlich ist die "Dummheit" des Computers eine Chance: Sie erzwingt eine theoretische Klärung der Fragestellung weit stärker, als dies ohne Computer der Fall war / ist.

1.3 Irritation: Morphologie soll üblicherweise auch Ausdrucksbeobachtung sein (vgl. z.B. die äußeren Veränderungen eines Wortes bei Konjugation, Deklination). Daneben begegnen Kategorien wie "Plural", "Determination", also Quantoren, die auch in der Logik eine Rolle spielen, von dorther aber auf die semantische Funktionsbeschreibung verweisen. Was ist also "Morphologie" üblicherweise für ein inkonsistentes Mischgebilde?

1.4 Desintegration: Die Morphologie als Teilgebiet der Linguistik beschäftigt sich mit Veränderungen von Ausdrücken. Die Rhetorik als Teilgebiet der Literaturwissenschaft kennt Stilfiguren, die exklusiv Strukturen der Ausdrucksseite beschreiben (z.B. Alliteration, Assonanz, Reim u.ä. ). Sollte beides nicht zusammengeführt werden - im Rahmen einer Aufhebung der unseligen Trennung von Linguistik / Literaturwissenschaft?

1.5 Desorientierung: "Morphologie" als sprachwissenschaftliche Disziplin (nicht: als Terminus für diese Disziplin) ist alt. Jede Grammatik einer Einzelsprache beginnt damit zu zeigen, wie die Wörter verändert (konjugiert, dekliniert) werden können und welche Bedeutungsunterschiede sich damit ergeben. "Semantik" als explizite sprachwissenschaftliche Disziplin dagegen ist jung: nennenswert kann davon wohl erst nach 1966 (Greimas, "Sémantique structurale", 'Generative Semantik' in USA) die Rede sein. Wie verhält sich nun die traditionelle Morphologie mit ihren Bedeutungsanteilen zur expliziten Bedeutungsanalyse der neuen Semantik? Kann / soll man eine neue wissenschaftliche Disziplin lediglich zur alten Struktur hinzuaddieren, ohne daß dies Rückwirkungen auf diese Struktur hätte? Oder ignoriert man nicht besser "Semantik", um weiterhin ungestört die alte "Morphologie" treiben zu können?

2. Zu den Defiziten

2.1 Ausdruck und Bedeutung sind - etwa nach de Saussures Zeichen-Definition - klar getrennt. Wie wird dem eine Morphologie gerecht, die traditionell Ausdrucks- und Bedeutungsbeschreibungen wie selbstverständlich vermischt, also die fundamentalste und zugleich banalste Unterscheidung der modernen Linguistik mißachtet? - Bezogen auf diesen Punkt ist nicht zu sehen, daß das alte Morphologie-Verständnis unter dem Einfluß von de Saussure einen nennenswerten Wandel vollzogen hätte.

2.2 Die traditionelle Morphologie teilt ihren Zwittercharakter mit dem Begriff der Syntax. Auch der wird - ob generativ oder nicht - als Vermischung der beiden Ebenen realisiert: Konkrete Wortfolgen (=Ausdrücke) sind mit Bedeutungsfunktionen verbunden (Subjekt, Prädikat, Objekt usw.).

2.3 Wahrscheinlich profitiert das alte Morphologie-Verständnis von tiefsitzenden und oft wenig reflektierten Annahmen: (a) Der Zweck sprachlicher Äußerungen sei ein inhaltlicher. - Dagegen ist meist nichts einzuwenden; nur darf nicht im Umkehrschluß gefolgert werden, die Ausdrucksebene, als vermittelnde Zwischeninstanz, dürfe man als eigenständige Größe mißachten. - (b) Form und Inhalt könne bzw. dürfe man nicht trennen. - Die Aussage (b) hat den Charakter eines Glaubensbekenntnisses und ist mit Reflexionen zur Zeichentheorie nicht zu vereinbaren.

2.4 Bei traditioneller Morphologie sind Standardprobleme vorhersagbar, weil sie lediglich die theoretische Unklarheit im Hintergrund widerspiegeln. So wird - wer einen bevorzugt semantik-basierten - Ansatz pflegt, einen extensiven Allomorph-Begriff favorisieren müssen, weil er sich gezwungen fühlt, die Variationen auf Ausdrucksebene (z.B. flektierte Formen von "SEIN", "to be") gleichzeitig einfangen zu müssen. Ein solcher Allomorph-Begriff ist aber wissenschaftlich wertlos.

3. Alternativer semiotischer Ansatz

3.1 Es gibt aus den letzten Jahren verschiedene Ansätze für eine neue Morphologie. Sie sind auch nicht einfach kompatibel. Diese Neuansätze betreffen überwiegend nicht den Unterschied zwischen Ausdruck und Bedeutung.

3.2 Ein Neuansatz, der die qualitative Differenz zwischen Ausdruck und Bedeutung berücksichtigt, würde in der Linguistik einführen, was für die Informatik selbstverständlich ist und was diese - paradoxerweise - letztlich von der Linguistik übernommen hat. Auch dies zeigt, daß die Linguistik nicht die eigenen Kenntnisse ernstnimmt.

3.3 Wenn sich somit eine methodische Separierung von Ausdrucksbeschreibung und Bedeutungsanalyse abzeichnet, so hat in diesem Kontext die übliche Definition von Morphem ("kleinste bedeutungstragende Einheit") keinen Platz mehr. "Bedeutung" soll ja im Rahmen der Beschreibung des Ausdrucksinventars einer Sprache gerade kein Kriterium mehr sein.

3.4 Der Terminus Morphem läßt sich in der neuen Konzeption aber durchaus sinnvoll verwenden, nun in folgender Definition: Morphem meint das abstrakte Muster hinter allen individuellen grafischen / phonetischen Ausdrucksrealisierungen (Morph). Morphologie auf dieser Linie nimmt also die physikalisch gebotenen Ausdrücke (z.B. auf akustischem, optischem, taktilem Kanal) zum Ausgangspunkt und integriert das Wissen, ob der jeweilige Ausdruck einem Muster im Ausdrucksrepertoire der Sprachgemeinschaft entspricht. Wenn ja, dann besteht die Möglichkeit, daß der Ausdruck einer sinnvollen Kommunikation dient (vorbehaltlich der semantisch/pragmatischen Prüfung). Wenn nein, dann liegt keine Äußerung in der betreffenden Sprache vor.

3.5 Der Verweis auf Zeichentheorie und Semiotik als notwendiger Korrekturgrundlage gilt nur in engem und strengem Rahmen und kann durch folgende Positionen charakterisiert werden: Carnap verstand die (logische) Syntaktik als das Analysefeld, in dem lediglich die Relationen zwischen Ausdrücken betrachtet werden, aber von ihrer Bedeutung (Semantik) und ihrer Funktion für die Sprachbenutzer (Pragmatik) abgesehen wird. Morris akzeptierte diesen Ansatz (auch für Semantik und Pragmatik) unter der Voraussetzung, daß er nicht nur auf logische Syntax formaler Sprachen, sondern viel weiter auf alle Sprachtypen bezogen wird. Folglich sind auch die Felder Phonologie und Morphologie betroffen. Bei de Saussure ist "Syntagmatik" ursprünglich bezogen auf die lineare Anordnung von "Zeichen" i.S.v. "Ausdrücken" in Texten.

3.6 Nicht akzeptiert wird hier dagegen ein Syntax/Syntaktik-Verständnis, das angesichts der klaren Definition (vgl. 3.5) doch wieder schwach wird, also semantische (womöglich auch pragmatische) Einträge in der Syntax akzeptiert, sich also - vielleicht auf höherem Niveau - wieder dem alten Syntax-Verständnis angleicht.

3.7 In der Sprachpraxis, in der "parole", sind selbstverständlich immer alle 3 Dimensionen zugleich im Spiel. Uns geht es hier aber um eine theoretisch klare Unterscheidung mit methodisch-algorithmisch klaren Folgerungen. Beide levels dürfen nicht verwechselt werden.

3.8 Wenn hier "Morphologie" im Kontext von "Syntax/Syntaktik" angegangen wird, dann in dem ganz ursprünglichen Sinn von "Syn-tax" = "Zusammen-Stellung". Wenn die Zeichendefinition lehrt, daß Zeichen von bipolarer Natur sind, dann muß gewählt werden: Syn-tax als Zusammen-Stellung wovon? Der Ausdrücke oder der Bedeutungen? Beides gleichzeitig zu untersuchen, verbietet sich nun. Also untersucht unsere Syn-Tax/Syntagmatik die Zusammenstellung der Ausdrücke (die Bedeutungen werden von der Semantik untersucht). In dieser Ausdrucksanalyse = Syn-Tax neuer Definition bildet die Morphologie ein Teilgebiet.

3.9 Ohne den Rang moderner Semiotik zu schmälern: das Wissen um die qualitative Differenz zwischen "Ausdruck" und "Bedeutung" findet sich in der griechischen Antike und dann im Mittelalter in der islamischen und hebräischen Sprachwissenschaft vielfach.

4. Systemtheoretische Begründung

4.1 Was oben auf semiotischer Basis ausgeführt wurde, kann - mit gleichem Ergebnis - auch systemtheoretisch hergeleitet werden. Befremdlich ist nur, wie unbeeindruckt die herrschende Praxis an diesen banalen Grundeinsichten vorbeiagiert.

4.2 Eine Einzelsprache bildet ihr Repertoire an Ausdrücken / Wortformen (100.000 - 300.000?) unter starken Restriktionen.

4.3 In Alphabet-basierten Sprachen / Schriften stehen nur ca. 25-30 Bildeelemente zur Verfügung.

4.4 Aus der Vielzahl der an sich möglichen Kombinationen von Buchstaben wird in der Einzelsprache nur ein sehr begrenztes Korpus ausgewählt (ansonsten gäbe es die Verschiedenheit der Einzelsprachen nicht). - Nachfolgend interessiert also nicht die mathematisch-logische Kombinierbarkeit von Elementen = Buchstaben, stattdessen ist immer die Rückversicherung nötig: welche Kombinationen sind in der betr. Sprachgemeinschaft tatsächlich in Gebrauch (aus oft unableitbaren Gründen).

4.5 Sprachgebrauch und kognitive Kompetenz der Sprachbenutzer verhindern, daß die Wortformen allzu lang sind. Das Gros der Wortkerne liegt bei einer Länge von 2-8 Buchstaben (das Thema compounds noch ausgeklammert).

4.6 Es ist also trivial, daß die Schaffung neuer Wortformen / Kerne dadurch geschehen muß, daß entweder "kreativ" eine Wortform geschaffen wird, deren Einzelelemente (bei beibehaltener Abfolge) keine andere Wortform ergeben (eben), oder dadurch, daß eine bestehende Wortform an einer Stelle erweitert wird (fort => f+ort).

4.7 Im letzteren Fall liegt also noch nicht das Problem: Kern + Prä- / Suffix vor, sondern zunächst nur die Schaffung weiterer Wortformen. Das Problem wird sein, diesen normalen und legitimen Vorgang (f+ort, h+aus) von der Modifikation einer Wortform durch Hinzufügung gängiger Prä- / In- / Suffixe (haus+e+s) zu unterscheiden.

4.8 Die Wortformen einer Einzelsprache bilden ein System. Es ist selbstreferentiell insofern, als jede Wortform dadurch Bestand hat, daß sie sich von einer benachbarten (d.h. ähnlichen) abgrenzt (zumindest in einem Merkmal unterscheidet). Es ist autopoietisch, weil etwa durch Sprachwandel nur Elemente derselben Art, also Buchstabenkombinationen, gebildet / neu aufgenommen werden können.

4.9 Nirgendwo ist bei dieser Sichtweise das Hereinwirken einer qualitativ ganz anderen Ebene (Bedeutung) nötig. Das System "Ausdrucksinventar" konstituiert sich selber.

4.10 Bei einem morphologischen Neuansatz kann folglich nicht mit dem Wertungsschema: Regel vs. Ausnahme operiert werden. Alles, was im Sprachgebrauch als Wortform / Bildeelement akzeptiert ist und verwendet wird, ist legitim, selbst wenn ein Einzelphänomen für sich allein eine Klasse bildet.

4.11 Noch unerwähnt ist die systemtheoretische bzw. konstruktivistische Grunderkenntnis, wonach bei Kommunikationen nicht Bedeutungen, sondern lediglich physikalische Impulse übertragen werden. Die Zuschreibung einer Bedeutung erfolgt auf ganz anderem Weg: das erkennende System vergleicht die Impulse mit gespeicherten, zurückliegenden Erfahrungen. Das Bild eines Baumes auf der Netzhaut wird nicht als solches zum Gehirn transportiert, sondern löst einen Typ von Aktivität der Neuronen aus, während das Bild eines Autos andere Aktivitäten provoziert. Insofern ist das System der Neuronen geschlossen und von ganz anderer Qualtität als die Fragen der Optik.

5. Definitionsrahmen für eine neue Morphologie

5.1 Auch Terminologien, Metasprachen bilden ein System - oder sollten es wenigstens anstreben. Wenn ein einzelner Begriff neu definiert werden soll, kann das nicht isoliert geschehen. Sondern es muß der Begriffsumfang der Nachbarbegriffe berücksichtigt bzw. ebenso geklärt werden. Dann erst entsteht ein schlüssiges Ganzes, ein konsistentes Konzept.

5.2 Ein Negativ-Beispiel: Man kann nicht den alten Syntax-Begriff beibehalten (s.o. Ziff. 2.2) und dann etwa ab den späten 60ern Semantik und ab den späten 70ern Pragmatik lediglich addieren, ohne gleichzeitig den alten, überdimensionierten Syntax-Begriff zu revidieren.

5.3 Ich favorisiere als Rahmen die Trias in der von Fillmore stammenden Kurzdefinition. Sie ist semiotisch wohlbegründet:

Syntax untersucht die form. Dabei verstehe ich unter dem schillernden Begriff "Form" die Ausdrucksebene. Es soll untersucht werden, wie das Wortformeninventar einer Einzelsprache einschließlich seiner möglichen Veränderungen strukturiert ist. In dieser (Ausdrucks-) Syntax bildet die neu zu konzipierende Morphologie einen Teilbereich.

Semantik untersucht (form), function. Nun kommt zur Ausdrucksseite - qualitativ neu - Bedeutungswissen unterschiedlicher Art hinzu: man muß wissen, was etwa die einzelnen selbständigen Bedeutungselemente für sich bedeuten können / sollen (Wortsemantik); und es ist zu erarbeiten, in welcher Funktion sie im aktuellen Satz verwendet werden (=Domäne der alten Syntax). Beschrieben wird die wörtliche Bedeutung der Äußerung.

Pragmatik untersucht (form, function), setting. Die Mechanismen, die eine zweite gemeinte Bedeutungsebene erschließen lassen, werden beschrieben. Ebenso die Funktion der Äußerung in der anzunehmenden Kommunikation (und deren Struktur).

5.4 Ohne daß man sich den theoretischen Gesamtrahmen mitteilt, in dem ein Einzelbegriff seinen bestimmten Platz hat, bleibt die Debatte nur zu diesem Einzelbegriff sinnlos. Sie verhärtet sich, weil für einen der Partner anscheinend die Zumutung in Raum steht, auf einen liebgewordenen Begriff bzw. sein Verständnis verzichten zu sollen.

5.5 Es wäre also konsequent und notwendig, theoretisch und praktisch hier zugleich zu erläutern, wie im Verbund mit einer solcherart restriktiven Syntax / Morphologie die Ebenen Semantik / Pragmatik konzipiert sind.

5.6 Grafische Zusammenschau des thesenhaft skizzierten Perspektivenwechsels.

6. Distribution der Zeichenformen - ohne Beachtung einer Bedeutungsfunktion

6.1 Völlig homogenes Untersuchungsmaterial: Die in einer Einzelsprache (auf einer synchronen Ebene) in Gebrauch befindlichen Ausdrücke = Mengen über dem geltenden Grundalphabet. Dazu gehört auch die Berücksichtigung, in welchen Umgebungen die Ausdrücke je begegnen.

6.2 Die Homogenität führt dazu, daß der Computer extensiv eingesetzt werden kann. Dies ist nicht nur für die Praxis relevant, sondern verweist auch auf theoretische Klarheit und Einfachheit.

6.3 Erarbeitet werden kann die Struktur des gesamten Ausdrucksrepertoires der betr. Einzelsprache, also nicht lediglich der Bereich z.B. der Prä-, In- Suffixe. Die Ergebnisse schließen ein: Wortkerne (ob selbständig oder unselbständig), unselbständige Bildeelemente (isoliert oder in Kombination), selbständige Wortformen, Komposita, Gruppen von Wortformen (vor dem Haus), darunter auch Auffälligkeiten der Ausdrucksstruktur (Alliteration, u.ä.), standardisierte Folgen von Wortformen (z.B. Formeln).

6.4 Da die Koppelung an Bedeutungsfunktionen entfällt, sind die erzielbaren Ergebnisse autonom und werden oft von Segmentierungen abweichen, die wir aufgrund unseres Bedeutungswissens vornehmen würden.

6.5 Die Anschlußfragestellungen, die sich also immer noch auf der Ebene der Untersuchung nur der Zeichenformen bewegen, ergeben sich dann, wenn vorab die Grenzen eines Textes definiert wurden. Nun kann - (a) - textintern differenziert die Struktur des Wortformeninventars dieses Textes erhoben werden (Gliederungen, Leitwörter, Verlauf des - ausdrucksformalen! - Informationswertes, Binnenwortschatz, usw.). Es kann dann - (b) - textextern das Wortformeninventar dieses einen Textes in Beziehung gesetzt werden zum umgebenden Korpus (Gemeinsamkeiten im Sprachgebrauch mit anderen Texten bzw. isolierte Bezugnahmen werden erkennbar). Beide Schritte sind voll automatisiert durchführbar.

6.6 Es geht nachfolgend also nicht darum, aus der Grammatik bekannte morphologische Regeln in Programmbefehle umzusetzen. Vielmehr soll durch gleichbleibende, einfache algorithmische Prozeduren das Wortformeninventar seine Struktur freigeben.

7. Merkmale des Algorithmus

7.1 Vorbereitende Analyse: Konstituierung des Textkorpus. Fremdsprachige Ausdrücke, Abkürzungen werden entfernt. Es ist auch darauf zu achten, daß das Korpus nicht Material unterschiedlicher synchroner Schichten enthält. Entscheidung, ob Groß- / Kleinschreibung und Satzzeichen beachtet werden sollen. Wir entschieden uns je dagegen.

7.2 Es wird z.B. eine Wortform genommen, die in der Einzelsprache bzw. meinem Textkorpus in Gebrauch ist. Darin liegt eine erste, trivial erscheinende, dennoch wichtige Erkenntnis: Gegenüber jeglicher abstrakten Kombinatorik, die etwa eine Wortform über dem Grundalphabet mittels Zufallsgenerator erzeugt, haben wir es mit einer in der betr. Sprachgemeinschaft nachgewiesenen, weil gebräuchlichen Wortform zu tun.

7.3 Die nächste Frage ist, ob sich diese eine Wortform komplett aus anderen selbständigen Wortformen dieser Sprachgemeinschaft erklären läßt (z.B. hausdach => haus + dach). Im positiven Fall ist damit - ausdrucksformal - eine erste Gruppe von Komposita erkannt.

7.4 Wichtig ist bei solchen Zerlegungen, daß alle zunächst hypothetisch entstehenden Teile daraufhin überprüft werden, ob sie im Gesamtkorpus als selbständige Wortform vorkommen.

7.5 Reste innen: Die vollständige Zerlegung gelingt bis auf kleine überschießende Elemente, vgl. mädchen+handel+s+schule, blume+n+topf. Wenn bei anderen Wortformen ebenfalls vollständige Zerlegungen möglich sind, bei gleichem überschießendem Element in vergleichbarer Innenposition, ist damit ein Infix distributionell nachgewiesen.

7.6 Reste rechts: Wenn links (bei Schreibrichtung: links => rechts), am Wortanfang, eine vollständige Wortform abgezogen werden konnte, kann der verbleibende Rest eine echte oder vermeintliche Endung sein. Über quantitative Sortierung wird vorläufig sichtbar, welche unselbständigen Elemente in dieser Einzelsprache gebräuchliche und bevorzugte Endungselemente darstellen.

7.7 Differenzierung beim Thema "Endung": Durch Vergleich der Positionen ergeben sich folgende Möglichkeiten:

7.7.1 Eine als selbständig bekannte Wortform kann auch erweitert begegnen. In diesem Fall reden wir von Kern und meinen damit die Wortform in ihrem noch nicht erweiterten Bestand.

7.7.2 Die Erweiterung kann in einer Kernerweiterung bestehen: wahr => wahr&heit. Es handelt sich dabei um unselbständige, komplexe und unveränderliche Endungseinheiten, die als Fortführung ganz unterschiedlicher Kerne nachweisbar sind.

7.7.3 An diese Kernerweiterung können dann noch die eigentlichen Endungen antreten: wahr&heit+e+n. Darunter werden einzelne Buchstaben verstanden, die in variabler Distribution im Endungsbereich nachweisbar sind. Komplexe Endungsausdrücke sind in diesem Fall reduzierbar auf die sie bildenden Einzelelemente: redest => red+est => red+e+s+t

7.7.4 Die eigentlichen Endungen können auch unmittelbar am Kern hängen. Wenn eine Kernerweiterung belegt ist, ist die Reihenfolge meist nicht umkehrbar: Die Endungen folgen danach: wahr+e+n bzw. wahr&haft&ig+e+n aber nicht: wahr+e+n&haft&ig.

7.7.5 Die Einschränkung zielt auf Fälle wie bursch+e+n&schaft, volk+s&tum, kind+e+r&lein. Es wird zu prüfen sein, ob diese Fälle mithilfe der inzwischen erkannten Gruppe der Infixe (s.o. 7.5) erklärt werden kann. Dann könnte das Phänomen im Rahmen der Infixe beschrieben werden.

7.7.6 Jedenfalls zeichnet sich ab, daß die Differenzierungen im Endungsbereich - wie sonst auch - nicht von bloßen Quantitäten/Wahrscheinlichkeiten abhängen, sondern von den Verbindungsmöglichkeiten, die mit den jeweiligen Elementen gegeben sind.

7.8 Hat man - erst mit selbständigen Wortformen arbeitend - erste wahrscheinliche Ergebnisse gewonnen, lassen sich diese auf noch unbefriedigend analysiertes Material anwenden. Die hypothetische Trennung grün+dlich (= selbständige Wortform + unanalysierter Rest) bekommt dann, wenn inzwischen &lich als wohlbekannte Kernerweiterung eingesetzt wird, eine Alternative: gründ&lich. In dieser Lösung hat aber gründ erst hypothetischen Charakter. Es würde sich um einen Kern handeln, der nicht auch als selbständige Wortform vorkommt, also unselbständig ist. Der Nachweis der Korrektheit erfolgt dadurch, daß zu diesem hypothetischen gründ aufgezeigt wird, daß er sich auch mit anderen inzwischen bekannten Kernerweiterungen / Endungen zu einer kompletten Wortform verbinden kann: gründ&ung, gründ+e+n.

7.9 Es ist also mit distributionellen Homographen zu rechnen. gründer kann hergeleitet sein aus zwei selbständigen Wortformen (grün, der), oder aus einem unselbständigen Kern (gründ) und gängigen Endungselementen (+er).

7.10 Weitere Spezifizierung: Kernerweiterungen (in sich nicht zerlegbar) können addiert sein: lust&ig&keit. - Komplexe Endungen können analog zur Analyse der Komposita (s.o.) in sich zerlegt werden: lach+ender => lach+e+n+d+e+r, sofern zuvor nachgewiesen wurde, daß die Einzelelemente zu den gängigen Endungen jener Einzelsprache gehören. Etwas präziser - nach 7.7 - dürfte das Ergebnis so aussehen: => lach&end+e+r, d.h. es interessiert angesichts mehrerer Zerlegungsmöglichkeiten jeweils die längste Kette. - Von "Endung" kann auch nicht unmittelbar dann gesprochen werden, wenn im Bereich des Wortauslautes ein Buchstabe belegt ist, der auch in der Liste der häufigen Endungen auftritt. Zusätzlich ist verlangt, daß an genau dieser Position ein Wechsel von gängigen Endungselementen vorkommt.

7.11 Präfixe: Offensichtlich gibt es solche, die unselbständig sind, d.h. nicht als separate Wortform nachweisbar (be-, ver-, un-), und solche, die auch als selbständiges Wort fungieren (vor und vor-laut). Letztere können von uns bereits bei den "Komposita" erkannt werden. Erstere stellen Neuerkenntnisse innerhalb der bisherigen Schritte dar.

7.12 Verfahrensweise analog zu der bei den Endungen, d.h. Kombinierbarkeit (vor+zu+be-hand&el+n) und Reihenfolge betreffend. Wenn unselbständiges Präfix involviert ist, steht es unmittelbar vor dem Wortkern. - Die Analogie zur Erarbeitung der Endungen zeigt sich darin, daß derselbe Algorithmus bzw. dasselbe Programm eingesetzt werden können (s.o. 7.3 und 7.6), nur daß zuvor die einzelnen Wortformen in sich umgedreht werden: erleben, verleben, leben (im gleichen Korpus) => nebelre abgezogen von nebelrev wirft die Frage auf, ob v- unselbständiges Präfix ist. Diesen Wechsel zwischen er- in der Funktion als Präfix (Homograph) und v-er- kann man noch an vielen anderen Kernen beobachten, - womit dieses Ergebnis abgesichert ist.

7.13 Die bislang erkannten Verbindbarkeiten sind rekursiv auf die früheren Ergebnisse anzuwenden, diese also dem erreichten Erkenntnisstand anzupassen.

7.14 Klassenbildung für jedes algorithmisch isolierbare Sprachelement. In die Klasse werden die Elemente aufgenommen, die die gleichen distributionellen Eigenschaften aufweisen.

7.15 Wortgruppen 1: Nur auf der Basis der Wortformen wird durch Sortierung gefragt, welche Verbindung (2 - n-Wortformen) im Korpus noch häufiger vorkommt, vielleicht sogar auffallend oft. Im weitesten Sinn, d.h. grammatische Phänomene einschließend, lassen sich damit Idiome der Einzelsprache erfassen.

7.16 Wortgruppen 2: Nur auf der Basis der Wortformen wird nach Ähnlichkeiten gefragt, vgl. Alliteration, Assonanz, Reim u.ä.

7.17 Wortgruppen 3: Untersuchung der Verbindung von Wortformen unter Beiziehung der zuvor definierten Klassen. Es werden Interdependenzen sichtbar, damit neue Klassen (z.B. "Präpositionalverbindung": vor dem Haus).

8. Typen von Ergebnissen

8.1 Zunächst negativ: Es kann nicht erwartet werden, daß - wenn auch mit verändertem theoretischen Hintergrund - im wesentlich dieselben Ergebnisse erreicht werden wie bei bisheriger Morphologie. Stattdessen ist wegen des Wegfalls der semantischen Perspektive mit deutlichen Verschiebungen bisheriger Ergebnisse / Gewohnheiten zu rechnen.

8.2 Vor einer Nennung praktischer Zwecke, die das Ziel dieser Art Morphologie sein sollen / könnten, steht das Interesse, den Objektbereich "Ausdrucksebene" (bezogen auf schriftliche Realisierungen) angemessener und konsequenter zu beschreiben, als dies bislang der Fall war. Insofern ist das Ziel ein wissenschaftliches, nicht auf konkrete Zwecke ausgerichtetes.

8.3 Eine Erkenntnis wird sein, daß detailliert ausdrucksformal belegt werden kann, worin sich alphabet-basierte Sprachen / Schriften unterscheiden. Von der Wortbildung, über die Veränderbarkeit der Wörter bis zu ihrer komplexeren Verkettung läßt sich die Verschiedenartigkeit der Einzelsprachen erläutern. Vgl. als Bild für das Gemeinte: Die atomaren Bestandteile der verschiedenen chemischen Elemente sind je die gleichen (Neutronen, Elektronen, Protonen). Die Elemente - z.B. Wasserstoff oder Uran - unterscheiden sich durch unterschiedliche Anzahl und Distribution dieser Bestandteile.

8.4 Eine ausdrucksformale Morphologie besteht in einer kontrollierten Reduktion der zunächst sehr vielfältigen Wortformen. Die Reduktion der zunächst sehr großen Zahl von Einzelformen geht einher mit dem Erkennen von gut bezeugten Verbindungsmöglichkeiten, dem Explizit-Machen von Einzelwortformen als Kombinationsphänomenen. Das Ergebnis besteht also in einer recht geringen Anzahl von Wortstämmen (Kernen), unselbständigen Bildeelementen und einigen Positionsregeln. - Stellt man dieser Ausdruckssyntax eine analog elaborierte Semantik/Pragmatik gegenüber, mit der differenziert beschreibbar ist, was - direkt oder indirekt - inhaltlich aussagbar ist, so wird sehr viel stärker bewußt als in traditioneller Grammatik, wie breit die Kluft zwischen dem verfügbaren Ausdrucksrepertoire und der vielfältigen inhaltlichen Ebene ist.

8.5 Das fördert das Bewußtsein, wie mehr- und vieldeutig die Ausdrucksebene von Haus aus sein muß, wie stark stattdessen die Rekonstruktionsleistung des Rezipienten ist, wenn es um die Herausbildung von Sinn und Bedeutung geht. Über der vergleichsweise dürren distributionellen Struktur der Ausdrücke einer Einzelsprache sind es viele pragmatische Faktoren (Isotopieen; Redundanzen; Dialogsteuerungen - auch bezogen auf Sender/Empfänger eines Textes, nicht nur auf Akteure im Text; ein letztlich durchschaubares Spiel mit Gliederung/Spannung/Überraschung), die die semantisch korrekte Entzifferung einer Ausdruckssequenz gewährleisten.

8.6 Realisiert werden könnte auf dieser Basis eine Grammatik, die die Kluft zwischen Ausdrucks- und Bedeutungsebene konsequent realisiert und in Verweisbüscheln abbildet: Frage ich von einem Morph her nach den damit verbundenen Inhaltsfunktionen, bekomme ich andere Antworten, als wenn ich eine dieser Inhaltsfunktionen nehme, und nach den Morphen frage, mit denen in der Einzelsprache diese Inhaltsfunktion realisiert werden kann. - Damit wäre die traditionelle Grammatik definitiv überwunden, die z.B. bei den Begriffen "Morphologie", "Lexem", "Syntax" immer zugleich nach Ausdruck und Bedeutung fragt (und dabei aber doch oft einen semantischen Standpunkt einnimmt).

8.7 Spracherwerb: Wer eine neue Sprache erlernt oder mittels einer Grammatik die eigene Sprache analysieren will, wird nach dem neuen Konzept nicht mehr verwirrt durch den fundamentalen Fehler von Standardgrammatiken, daß Phänomene der Ausdrucksseite durch semantische Termini beschrieben werden. So sei es schwierig, den SchülerInnen/Studierenden zu erklären, daß das deutsche aktive Perfekt durch eine Passiv-Form gebildet werde (z.B. ich habe geworfen. Mindestens 3 Fehler machen in diesem Fall die Didaktiker und Grammatiker, die Begriffsstutzigkeit der SchülerInnen/Studierenden dagegen ist berechtigt: (1) Ein Sachverhalt der Ausdrucksebene (geworfen) wird durch eine semantische Funktion erklärt. (2) Im Rahmen mehrerer semantischer Funktionen, die der eine Ausdruck übernehmen kann, wird eine einzelne (passiv privilegiert, wodurch die andere (aktiv als irregulär erscheint. (3) Das - sprichwörtliche - Operieren mit dem Denkmuster: Regel vs. Ausnahme ist schon im Ansatz verfehlt: Jede verstehbare, im engen grammatischen Sinn sogar falsche, dem Verwendungszusammenhang aber angepaßte Äußerung ist legitim, zu akzeptieren und nicht negativ (Ausnahme!) zu bewerten.

8.8 Maschinelle Übersetzung: Solch ein Projekt ist nun nicht mehr beschnitten durch altehrwürdige, aber unreflektierte grammatische Kategorien. Die Ausdrucksebene jeder Einzelsprache kann automatisch analysiert werden, durch denselben Algorithmus. Die scharfe Trennung zwischen Ausdrücken und Bedeutungen führt - bezogen auf die Bedeutungen - zu einem INTERLINGUA-Konzept, das zur Bedeutungsbeschreibung vieler Einzelsprachen taugt.

9. Stand der Entwicklung

9.1 Erfahrungen und Reflexionen zur "Konstituierung des Textkorpus" (vgl. 7.1) liegen vor.

9.2 Die Programmierung der Erfassung der selbständigen Wortformen, die vollständige Zerlegung in selbständige Wortformen, Erarbeitung der gängigsten Kernerweiterungen / Endungen, Erarbeitung der Infixe ist durchgeführt.

9.3 Die Anschlußfragestellungen - vgl. 6.5 - sind praktisch erprobt.

9.4 Ziel dieses Papieres ist es, theoretisch fundiert einerseits Kritik an der herrschenden Praxis zu üben, andererseits eine schlüssige alternative Sichtweise vorzustellen. Ziel ist es in praktischer Hinsicht, den benötigten Algorithmus so weit vorzustellen, daß begründete Zweifel an seiner Realisierbarkeit nicht mehr möglich sind. Unbeschadet der noch ausstehenden Arbeit sollte auf beiden Ebenen ein "point of no return" erreicht werden.

ad 1.: Vgl. J. W. Goethe: "Was ist das schwerste von allem? - Was dir das leichteste dünket: Mit den Augen zu sehen, was vor den Augen dir liegt." (XENION)

ad 1.1: Der dominierende Eindruck ist, daß allenfalls die praktische Durchführung der Morphologie zu Variationen und Diskussionen führt, nicht aber das prinzipielle Verständnis von Morphologie. Das Verständnis von "Morphem" als "kleinster bedeutungstragender Einheit" hat längst den Status eines Glaubensartikels erreicht, der als solcher natürlich nicht hinterfragt wird, auch nicht hinterfragt werden darf und soll.

ad 1.2: Vgl. Roland Hausser (ed.), Linguistische Verifikation. Dokumentation zur Ersten Morpholympics 1994. Sprache und Information 34. Tübingen 1996. Der Band schildert, wie unter Wettkampfbedingungen 8 Morphologie-Programme gegeneinander "antraten" und wie eine Jury nach diversen Tests den Sieger ermittelte (GERTWOL aus Finnland). Das Morphologie-Verständnis ist bei einem solchen Spiel kein Problem, darf es auch nicht sein, weil sonst der ganze Spaß verdorben wäre. Und die Durchsicht der Programmkonzeptionen zeigt, daß ganz selbstverständlich von einer traditionellen Morphologie ausgegangen wird. Die hauptsächliche Leistung des jeweiligen Programms besteht darin, möglichst schnell aus den vorgegebenen Informationen die passenden Erkenntnisse zur zu untersuchenden Wortform beizuziehen. Die Informationsquellen sind ganz unterschiedlicher Art, reichen von phonetisch / phonologischer Information (langer / kurzer Vokal) bis zu Bestimmungen der semantischen Funktion: "diminutiv, singular, plural, feminin, NOM, GEN, DAT, AKK, subst".

ad 1.3: Hierfür wären vielfältige Illustrationen möglich. Wir müssen uns beschränken:

ad 1.3.1: Hier sei die Behauptung angedeutet (die sich bei Bedarf ausführlich illustrieren ließe), daß die traditionelle Verquickung von Ausdrucks- und Bedeutungsgesichtspunkten beide Ebenen verkürzt. Weil sich die unterschiedlichen Perspektiven gegenseitig blockieren, entsteht keine Ausdrucksbeschreibung, wie sie notwendig und möglich ist (das ist Thema dieser Thesen), aber auch keine semantische Analyse im erforderlichen Maß. Wenn man sich z.B. mit dem Oppositionspaar sg. / pl. begnügt, bleibt unberücksichtigt, daß etwa pl. semantisch differenziert und mit der Frage der Determination verbunden werden müßte. Außerdem kann es dann nicht mehr nur um die Betrachtung einer einzelnen Wortform gehen, weil die pl.--Information womöglich in einem benachbarten Wort steckt. Spiel würde man traditionell als sg. qualifizieren. Heißt der Ausdruck aber: jedes Spiel, dann liegt ein definiter, distributiver Plural vor, insofern ausnahmslos jedes Element der Klasse Spiel gemeint ist. Eine solche differenzierte Analyse wird aber von der traditionellen Morphologie trotz ihres Bedeutungs-Standbeins nicht erreicht.

ad 1.3.2: Die behauptete Irritation ist Anlaß und Ausgangspunkt des Artikels von Dieter Wunderlich, Ray Fabri, Minimalist Morphology: An Approach to Inflection. Zeitschrift für Sprachwissenschaft 14,2 (1995) 236-294. Ein morphologischer "Kasus" (! - eine semantische Funktionsbeschreibung) ziele auf syntaktische Konstituenten. Die Realisierung in Form von Affixen (! - Kategorie der Ausdrucksebene) schaffe jedoch eine Verbindung zur Phonologie. Daher: "The proper place of inflectional morphology within the main components of grammar is still a matter of debate" (236).

ad 1.5: Eine gängige, aber - wie ich finde - unzulässige Aufhebung des Dilemmas besteht darin, daß man die "Semantik" degradiert zu einer "Logischen Form", einer abstrakten Notation der Erkenntnisse, die man in einer extensiven Syntax (die wiederum die Morphologie einschließt) bereits hat, s.u. ad 3.1.2; zur Kritik an diesem Syntax-Begriff s.u. ad 2.2.3. Der überzeugendere Weg wäre, die "Semantik" als eigenständige Bedeutungsanalyse ernstzunehmen, angemessene Beschreibungsverfahren zu entwickeln, und im Gegenzug die heterogenen Auffassungen von Morphologie und Syntax zu entlasten. Alle beteiligten Kategorien würden an Homogenität und Konsistenz gewinnen.

ad 2.1: In aller Regel wird in der gleichzeitigen Abhandlung / Darstellung zweier ganz unterschiedlich organisierter Objektbereiche kein Problem gesehen. Selten gibt es Ausnahmen:

ad 2.1.1: Vgl. Laurie Bauer, Introducing Linguistic Morphology. Edinburgh 1988: Edinburgh University Press. Das Buch steht für die vielen Fälle, die sich ein Nachdenken über das eigene Arbeitsfeld ersparen. Vgl. die Besprechung in: Harald Schweizer, Zur Zwiespältigkeit traditioneller Morphologie: H.S., Sprachkritik als Ideologiekritik. Zur Grammatikrevision am Beispiel von QRB. THLI 1. Tübingen 1991. S. 168-172.

ad 2.1.2: Auffallend und erfreulich: Angelika Linke, Markus Nussbaumer, Paul R. Portmann: Studienbuch Linguistik. Tübingen 1994. Die AutorInnen sehen sehr klar (vgl. S.60ff) die Doppelnatur des traditionellen Morphem-Begriffs: "Ein Morphem ist primär eine signifiant-Einheit; ihren Status als solche signifiant-Einheit bekommt sie aufgrund ihrer Eigenschaft, eine signifié-Einheit zu 'tragen'" (60). Sie sehen auch differenziert, daß es zwischen der Ausdrucks- und der Bedeutungsebene keine Isomorphie gibt. Vor diesem Hintergrund sind zwei Strategien denkbar: Man verstärkt das semantische Gewicht in der Morphologie - was etwa zu einem exzessiven Allomorph-Begriff führen würde (äußere Wortformen, die auf dieser Ebene nichts miteinander zu tun haben, werden - wegen gleicher Bedeutung - doch zusammengefaßt). Oder man findet "zurück zu einer konsequenten Verankerung des Morphem-Begriffs auf der signifiant-Ebene" (71). Für diese Position plädieren die AutorInnen. Es wird theoretisch auch gesehen, daß etwa "gebundene Morpheme", die man nur auf Ausdrucksebene untersucht, eine ganz eigene Distribution hätten gegenüber den damit verbundenen Bedeutungen / Funktionen. - Es bleibt aber insgesamt noch beim Plädoyer. Ein Weg zu einer solchen restriktiven Morphologie wird nicht gezeigt.

ad 2.1.3: Erfreulich ist in anderer Hinsicht M.A.K. Halliday, An Introduction to Functional Grammar. London (2. Aufl.) 1994. Das Positive liegt einerseits in dem klaren Blick dafür, daß Morphologie kein ausgeprägtes Interesse seines Buches darstellt (vgl. 19), andererseits in der Erkenntnis, daß sein Standpunkt ein semantischer ist, demgegenüber der expression level sich als qualitativ anders und eigenständig abhebt. Den Terminus Syntax vermeidet H. bewußt, weil der zu belastet sei. - Wenn sich H. zwischendurch doch zu morphologischen Fragen äußert (vgl. 18), zeigt sich seine Unerfahrenheit: "kindness consists of kind+ness ... There is nothing in the writing to show this structure; but we know - because we understand English - that this is how these words are built up out of smaller pieces". - Genau diesen Nachweis wollen wir hier führen: kind+ness kann segmentiert werden, ohne daß man inhaltlich den Ausdruck versteht. Nicht die Schreibung (writing) legitimiert uns dazu, aber die Beiziehung des weiteren Ausdrucksinventars des Englischen.

ad 2.1.4: Von einem aus unserer Sicht überfälligen Umschwenken der Systemtheorie berichtet GUMBRECHT, H U, Interpretation versus Verstehen von Systemen, in: BERG, H de; PRANGEL, M (eds.), Differenzen. Systemtheorie zwischen Dekonstruktion und Konstruktivismus. Tübingen 1995. S. 173f: "Schließlich modelliert unser gängiger Interpretationsbegriff Texte als komplexe Zeichen, bei denen in einer Oberflächenschicht von Signifikanten eine Tiefenschicht von Bedeutung(en) artikuliert wird. Interpretation gilt vor allem dann als 'Kunst', wenn es ihr gelingt, in der Oberflächenstruktur gründende Doppeldeutigkeiten und Unklarheiten des Textes (! - also Fragen der Bedeutung, H.S.) zu überwinden. In einigen seiner jüngeren Beiträge hat Luhmann jedoch das, was wir üblicherweise als Oberflächenschicht des Textes betrachten, von der Dimension der Bedeutung (bzw. des Sinnes) getrennt. Indem die Strukturen der Oberflächenschicht vom Bezeichneten abgelöst werden und so ihre Funktion als Bezeichnendes verlieren, werden sie zur Schaltstelle, über welche die Kopplung von sozialen und psychischen Systemen erleichtert wird. Mit dieser Hypothese von Sprache und Texten gelangt genau jene strukturelle Ebene zum Verschwinden, an der Interpretation gewöhnlich ansetzte."

ad 2.2: Beispiele:

ad 2.2.1: Vgl. LEWANDOWSKI, T, Linguistisches Wörterbuch 2. UTB 201. Heidelberg (5. Aufl.) 1990: Quelle&Meyer. S.721f. "Monem. Kleinste Zeichen (doppelseitige Einheiten, die ein Signifikat und einen Signifikanten haben), die sich unter der Bedingung der konstanten Bedeutungsleistung nicht weiter in eine Folge von Zeichen zerlegen lassen;... das kleinste Redesegment, dem man einen Sinn zuerkennen kann (Martinet). Habe z.B. besteht aus dem M. hab- und -e, in mir sind die M. ich und Dativ enthalten. M., die ihren Platz im Wörterbuch haben, sind Lexeme oder lexikalische M. (hab); solche die in Grammatiken erscheinen (-e), sind Morpheme oder grammatische M. Lexikalische M. (reich-, geh-) gehören einer offenen Liste an, grammatikalische M. (von, für, mit) sind in der Anzahl begrenzt, jedoch von weit höherer durchschnittlicher Häufigkeit. ... 2) Eine Einheit der Ausdrucksebene, die kleinste bedeutungstragende Formeinheit..., der ein oder mehrere Sememe zugeordnet sind; diese konstituieren den Bedeutungsumfang der M."

ad 2.2.2: Die These wird schön illustriert durch den Beitrag von Wunderlich / Fabri - s.o. ad 1.3: Die "minimalist morphology" greift auf semantische / ontologische Kategorien zurück (z.B. person > number > gender > mood > tense > aspect > voice(>verb) - neben dem Bestreben, auch der (phonologischen) Ausdrucksebene gerecht zu werden.

ad 2.2.3: Zur Kritik am überdimensionierten und semiotisch undifferenzierten Syntax-Begriff Chomskys vgl. H. Schweizer, Constructive contradictions. Linguistics, textual linguistics and hermeneutics reexamined from the perspective of systems theory. In: Koch,W; Altmann,G (eds.), Systems: New Paradigms for the Human Sciences. Berlin, New York 1998. 356-382, hier: 357-363.

ad 2.2.4: Wegen des in der These behaupteten "Zwittercharakters" traditioneller Syntax muß dann, wenn der Zwittercharakter nicht erkannt wird, eine Verhältnisbestimmung zwischen dieser Syntax und dem, was man sich als Semantik vorstellen könnte, scheitern oder katastrophal ausfallen. Vgl. als Beispiel: FANSELOW, G; FELIX, SW: Sprachtheorie. 1 Grundlagen und Zielsetzungen. 2 Die Rektions- und Bindungstheorie. UTB 1441/2. Tübingen 1987. Bd.1 S.86.

ad 2.3: Im Prinzip die gleichen Abwehrhaltungen begegneten mir häufig, wenn es darum ging, Einzeltexte zunächst nur nach ihrer Struktur auf Ausdrucksebene zu beschreiben, unter Absehung von jeglichem Inhaltswissen. Vgl. Schweizer, H, Die Sprache der Zeichenkörper. Textinterne (Ausdrucks-)Syntax zu Dan 8. in: Bader,W (ed.), "Und die Wahrheit wurde hinweggefegt". Linguistische Analysen von Daniel 8. THLI 9. Tübingen 1993. S. 17-30, bes. 17-19.

ad 2.4: Nachfolgend wird lediglich versucht, aus der vielfach vorhandenen Einsicht, zwischen grammatischer Funktion und der Realisierung auf Ausdrucksebene bestehe eine "many-to-many"-Relation, die gebotene praktische Konsequenz zu ziehen. - J. LYONS, Linguistic Semantics. An introduction. Cambridge 1997. 49f, hält mit Hilfe der Oppositionen: type / token bzw. form / expression klar die Aspekte "äußere Form" bzw. "Bedeutungskomponente" auseinander (es ist nur zu beachten, daß "expression" bei ihm für "Bedeutungskomponente" steht!). Unter Beiziehung beider, gegensätzlicher Aspekte entsteht die Einheit "Wort" als Mischgebilde. L.s Interesse ist "Semantik", also ist es Standard bei ihm, daß er Wort = "expression" setzt (also unter Benutzung eines weiten Allomorphbegriffs), und sich für Wort = "form" oder Wort = Mischgebilde nicht interessiert. - Die hier kritisierte Asymmetrie beschreibt korrekt (ohne sie aber als Problem zu empfinden) M.T.ROLLAND, Ein semantikorientierter Ansatz im Bereich der Sprachverarbeitung, in: HITZENBERGER,L, Sprache und Computer. Hildesheim 1995. 195-209, hier: 197: "Jedes Wort ist eine Ganzheit aus Lautform und Inhalt, wobei der Inhalt maßgebend ist für die Bestimmtheit des Sprachmittels."

ad 3.1: Einzelne Ansätze werden je für sich vorgestellt:

ad 3.1.1: "Two level morphology": Vgl. die gleichnamige Publikation von Kimmo Koskenniemi, Untertitel: A General Computational Model for Word-Form Recognition and Production: Publication No.11 University of Helsinki: Helsinki 1983. Die "zwei Ebenen" lassen von vornherein vermuten, daß es Koskenniemi nicht um eine "eindimensionale" Morphologie geht, wie von uns propagiert. Der Eindruck bestätigt sich schnell: K. entwickelt ein linguistisches Modell zur morphologischen Analyse und Synthese von Wortformen. Hauptkomponenten sind ein Lexikon und "Two-level-Regeln". Mit letzteren bringt er Wortformen der Oberflächenebene mit solchen der Lexikon-Ebene in Beziehung, wo die Wortformen an semantisch motivierten Morphemgrenzen Trennzeichen bereits enthalten. Informatisch gedacht ist das vorgestellte Programm zweifellos originell; in linguistischer Hinsicht ist jedoch klar, daß Koskienniemis morphologisches Modell stark semantisches Wissen einbezieht. Erkenntnisse, die wir erst gewinnen wollen, sind in seinen (semantischen) Vorgaben schon enthalten. - Vgl. zur weiteren Bestätigung dieses Eindrucks: ALEGRIA, I (et. al.), Automatic Morphological Analysis of Basque: Literary and Linguistic Computing 11 (1996) 193-203.

ad 3.1.2: Morris Halle, Alec Marantz, Distributed Morphology and the Pieces of Inflection, in: K. Hale, S.J. Keyser (eds.), The View from Building 20. Essays in Linguistics in Honor of Sylvain Bromberger. Cambridge / Mass. 1993. S. 111-176, erkennen "the fact that the machinery of what traditionally has been called morphology is not concentrated in a single component of the grammar, but rather is distributed among several different components" (111f). Dazu gehören neben der eigentlichen morphologischen (abgeleitet: phonologischen) Struktur noch: DS (Deep Structure), SS (Surface Structure), LF (Logical Form). So gesehen bestätigen Halle / Marantz wunderschön unsere Behauptung, "Morphologie" sei üblicherweise ein Mischbegriff. Sie stellen auch fest, daß die Bereiche fundamental verschieden strukturiert sind: LF, SS, DS hierarchisch, Morphologie in ihrem Kern dagegen sequentiell. Folglich besteht zwischen beiden Teilen keine Isomorphie (vgl. 115).

Die Folgerung daraus ist für Halle / Marantz naheliegenderweise nicht, die Erforschung der Bereiche zu trennen (und sie erst nachträglich wieder zusammenzuführen), sondern es wird unmittelbar ein Interface gesucht (und in Chomskys "Checking Theory" gefunden, vgl. 166ff), das hilft, die heterogenen Komponenten in Relation zueinander zu bringen. "Distributed" meint also: Man sieht, daß ganz unterschiedliche Betrachtungsweisen und Kriterien vorliegen. Statt aber die Komplexität zu reduzieren, wird sie erhöht. - Vgl. zum gleichen Problem: Hagen Langer, Sven Naumann, Syntaktische Hierarchie und lineare Abfolge, in: Ursula Klenk (ed.), Computatio Linguae. Stuttgart 1982. S. 125-145.

In "Distributed Morphology: Impoverishment and Fission" (Pre-publication version 1/97) bringt M. Halle einleitend sehr klar zum Ausdruck, daß (traditionelle) Morphologie zwei qualitativ völlig verschiedene Bereiche zusammenspannt: einerseits universale morphologische Kategorien (wie Tempus, Numerus, Kasus), - ich selber nenne diese Ebene "Semantik"; andererseits das, was er "phonetic exponent" nennt, also die von Einzelsprache zu Einzelsprache unterschiedliche Repräsentierung der universalen Kategorien. Dazu gehören nicht nur positive Buchstabenfolgen (z.B. als Anzeiger von "Vergangenheit"), sondern auch "phonetic NULL": die äußerliche Nichtrealisierung kann für eine bestimmte inhaltliche Funktion stehen. "the relationship between the grammatical features of a morpheme and its phonetic exponent is many-to-many". - Es ist ein zentrales Anliegen von Halle, die erkannte Vermischung der Ebenen zu vermeiden. Insofern decken sich unsere Interessen. Konkret siedelt er "Morphologie" auf Seiten von "Grammatik/Semantik/Syntax" an (die Termini sind nicht klar getrennt), was in seiner Sicht die Phonetik ausschließt. Letztere bildet ein ganz eigenständiges Arbeitsfeld.

Im Vergleich mit unserem Vorgehen darf man sich vom unterschiedlichen Gebrauch der Begriffe nicht täuschen lassen. Halles Morphologie gehört bei uns zu einer - dann allerdings wesentlich breiter gefaßten - Semantik. Unsere Ausdruckssyntax/Morphologie beschäftigt sich mit der graphischen Repräsentierung dieser universalen Kategorien in einer Einzelsprache. Halles Rede vom "phonetic exponent" verkürzt die beiden klar zu unterscheidenden Kanäle der Ausdrucksebene. Hinter diesen Differenzen gilt aber die Gemeinsamkeit, daß Halle - wie wir - der üblichen Vermischung der Ebenen zu entkommen sucht.

ad 3.1.3: Ursula Klenk hat ihre Morphologievorstellung und Programmkonzeption in verschiedenen Beiträgen vorgestellt und - mit anderen - an verschiedenen Sprachen exemplifiziert. Zu dem relativ frühen Beitrag: "Ein nicht-lexikalisches Verfahren zur Erkennung spanischer Wortstämme", in: Ursula Klenk (ed.), Strukturen und Verfahren in der maschinellen Sprachverarbeitung. Sprachwissenschaft und Computerlinguistik 12. 1985. S.47-65, erläutert sie ihren Ansatz so: Klassische Segmentierungsverfahren werden als lexikalisch qualifiziert, d.h. sie "benutzen Listen von lexikalischen und morphologischen Formativen". Klenk bevorzugt ein nicht-lexikalisches Verfahren, d.h. es werden "die Formativgrenzen auf Grund von in den Wortformen erscheinenden Indizien festgestellt" (47), unter Verwendung - wenn es um Endungen geht - einer Liste der in der Einzelsprache möglichen Endungen. Auch hier wird das Ergebnis, das wir erst finden wollen, bereits vorgegeben. Der Algorithmus prüft unter Einsatz von Segmentierungsregeln, die im Grund ebenfalls schon Ergebnis der morphologischen Untersuchung der Einzelsprache sind, inwiefern bei einer gegebenen Wortform reguläre Endungen abgetrennt und damit ein KOST (= komplexer Stamm) freigelegt werden kann. - Demgegenüber suchen wir nach einem Verfahren, das ohne vorgegebenes Morphologiewissen auskommt, dieses vielmehr selber erst "erbrütet".

ad 3.1.4: Dressler, W et.al. (eds.), Contemporary Morphology. Trends in Linguistics 49. Berlin 1990. - Im Beitrag Dressler / Kiefer (69ff) wird eingangs erläutert, bei "Morphologie" müsse man 4 Ebenen unterscheiden: Morphosemantics, Lexical semantics of morphology, Lexical pragmatics of morphology, Morphopragmatics. Man beachte: Es ist keine Ebene vorgesehen, die - ohne Einbeziehung des Bedeutungswissens - nur die Struktur der Ausdrucksebene untersucht. Insofern ist der Beitrag repräsentativ für sämtliche weiteren in dem Sammelband. R. Beard (159ff) spricht zwar von "Separationist morphologies" und davon: "Morphology comprises autonomous phonological 'spelling-out' operations such as affixation, reduplication, revocalization, or autosegmental recombination". Sein Standpunkt bleibt aber ein semantischer und er untersucht Fälle, wo "gender, agency, diminutive specification" sich nicht in einem besonderen Affix niederschlagen.

ad 3.2: Man denke an den Unterschied zwischen der Syntax eines Programms und seiner Semantik oder an den zwischen Terminalsymbolen und Nichtterminalsymbolen. - Hierzu gehört auch die Debatte, die J.R.Searle mit der "Künstlichen Intelligenz" (v.a. der "harten") geführt hat mit der These, daß Computerprogramme ausschließlich "syntaktisch" arbeiten, d.h. Ausdrücke verarbeiten, wogegen der menschliche Geist immer auch um die dazugehörige Semantik weiß. Daher werden Computer nie Konkurrenten der menschlichen Intelligenz sein können. Vgl. zusammenfassend: J.R. Searle, Ist der menschliche Geist ein Computerprogramm? Spektrum der Wissenschaft (1990/März) 40-47. Im selben Heft auch die Positionen der Debattengegner.

ad 3.3: Zur ausführlichen Diskussion dieser Problematik vgl.: H. Schweizer, Computerunterstützte Textinterpretation. THLI 7. Tübingen 1995. Bd.iii, 5-8. - Eine Annäherung an die hier vertretene Position ist in der Literatur immer mehr beobachtbar - noch aber mit einer nicht akzeptablen Hintertür: Vgl. M. Neef, Wortdesign: Das Lexembildungsmuster Gehopse und die Kopflosigkeit von 'Ableitungen': ZS 15.1 (1996) 61-91. Neef lehnt mit aller wünschenswerten Klarheit den üblichen Mischbegriff "Morphem" ab. Stattdessen will er seine Morphologie exklusiv an der Oberfläche, an der Ausdrucksseite entwickeln. So weit, so konvergent. Neef rekurriert aber bei einem schriftlich vorliegenden "Grammatischen Wort" explizit auf die Ebene der Phonologie und gewinnt von dorther weitere Kriterien der Beschreibung. Zweifellos ist die Phonologie der Ausdrucksseite zuzurechnen. Aber Sprache und Schrift können keinesfalls zu einem homogenen Untersuchungsfeld zusammengezogen werden. Das geht systemtheoretisch nicht (s.u.); das weist überzeugend und ironischerweise im gleichen Heft S. Krämer, Sprache und Schrift oder: Ist Schrift verschriftete Sprache? 92-112 nach.

ad 3.4: Ein kompetenter Sprachbenutzer kann die individuell verschieden realisierten Morphe: baum, Baum, bAum alle auf das abstrakte Morphem: / BAUM / zurückführen. Vgl. den Verweis auf THLI 7/iii 5-8 unter: ad 3.3.

ad 3.5: Die Nachweise finden sich in: R. Posner, "1. Semiotics and its presentation in this Handbook" (1-14) bzw. R. Posner, K. Robering, "2. Syntactics" (14-83): R. Posner, K. Robering, T.A. Seboek (eds.), Semiotik: ein Handbuch zu den zeichentheoretischen Grundlagen von Natur und Kultur. HSK 13/I. Berlin, New York 1997.

ad 3.6: Solche 'Aufweichungstendenzen' lassen sich eben auch von Carnap und Morris berichten (vgl. Posner 6). Ein pauschaler Verweis auf Übersichtsartikel wie unter Ziff. 3.5 zitiert, ohne die dort ebenfalls ausgeführte Selektion und theoretische Klärung würde für unsere Zwecke nichts bringen, da unter "Semiotik" viele Schulen existieren und darunter - sofern sprachwissenschaftliche Richtungen angesprochen sind - unterschiedslos auch Ansätze aufgeführt werden, die "Syntax" oder "Morphologie" in der hier kritisierten Vermischung der Ebenen praktizieren.

ad 3.9: Vgl. VERSTEEGH, K; et.al.: The emergence of semantics in four linguistic traditions: Hebrew, Sanskrit, Greek, Arabic. Studies in the history of the language science 82. Amsterdam 1996: Benjamins. In dem Buch wird z.B. auf den Grammatiker Apollonius Dyscolus (2.Jhd. n. Chr.) verwiesen, der ganz der stoischen Unterscheidung von "Lauten" und "Bedeutungen" folgt, für jede Ebene eine eigene Erforschung anstrebt und - konsequenterweise - für eine "Syntax" im später üblich gewordenen Mischsinn keine Verwendung hat (vgl. 209f). Dagegen paßt unser redefinierter Syntax-Begriff problemlos zur Sichtweise des Apollonius.

ad 4.3: Die genaue Anzahl hängt auch von der Berücksichtigung des jeweiligen Akzentsystems ab, so scheinen im Griechischen die Akzente vorwiegend phonetische Funktion zu haben, im Französischen dagegen - neben der Phonetik - vor allem auch bedeutungsdifferenzierende. Es muß also schon der vorbereitende Schritt "Konstituierung des Untersuchungskorpus" das relevante Buchstabenmaterial definieren. Dies kann im Griechischen bedeuten, daß nichts vom Akzentsystem berücksichtigt wird, daß im Französischen alle Akzente als graph-differenzierend vermerkt werden. Demnach gibt es dort: e, é, ê, è und ausgefallenes e wie in l' .

ad 4.4:

ad 4.4.1: Damit wird de Saussures Terminus "Konvention" berücksichtigt. - Die Wortformen einer Einzelsprache bilden eine Teilmenge der an sich möglichen Wortformen auf der Basis des Alphabets. Vgl. die Erzählung: Die Bibliothek von Babel, in: BORGES, JL, Die Bibliothek von Babel. Erzählungen. Stuttgart 1974: RECLAM, S.47-57. Auf der Basis der wenigen orthographischen Symbole sind in jener Bibliothek ungeheuer viele verschiedene Bücher gesammelt. Angesichts eines Buches, das ein reines Buchstabenlabyrinth bietet, aber am Schluß die Zeile: O Zeit, deine Pyramiden: "Man ersieht hieraus: auf eine einzige verständliche Zeile oder eine richtige Bemerkung entfallen Meilen sinnloser Kakophonien, sprachlichen Kauderwelschs, zusammenhanglosen Zeugs." (50) Etwas später: "Diese Beispiele setzten einen genialen Bibliothekar instand, das Fundamentalgesetz der Bibliothek zu entdecken. Und zwar stellte dieser Denker fest, daß sämtliche Bücher, wie verschieden sie auch sein mögen, aus den gleichen Elementen bestehen: dem Raum, dem Punkt, dem Komma, den zweiundzwanzig Lettern des Alphabets. Auch führte er einen Umstand an, den alle Reisenden bestätigt haben: In der ungeheuer weiträumigen Bibliothek gibt es nicht zwei identische Bücher. Aus diesen unwiderleglichen Prämissen folgerte er, daß die Bibliothek total ist und daß ihre Regale alle irgend möglichen Kombinationen der zwanzig und soviel orthographischen Zeichen (deren Zahl, wenn auch außerordentlich groß, nicht unendlich ist) verzeichnen, mithin alles, was sich irgend ausdrücken läßt: in sämtlichen Sprachen."(51) - Teilweise gibt es Schnittmengen: Man denke an Bildungen vor dem Hintergrund des Lateinischen: / informatio / => / information / engl. / franz. / deutsch.

ad 4.4.2: Durch Mißachtung der These 4.4 lassen sich Bestsellererfolge erzielen, zugleich macht man sich lächerlich - nicht, was das statistische Know-how betrifft, aber bezüglich des Umgangs mit natürlicher Sprache. Gemeint sind die "Bibelcode"-Publikationen: In der Bibel würden sich bereits die Namen aktueller Politiker und ihrer Mörder finden (z.B. Fall Rabin). Aufgrund folgender Prämissen ist das nicht verwunderlich: (a) Man weiß, wonach man sucht (durch vorbereitete Namensliste), (b) die Wortkette der hebräischen Bibel wird - durch Entfernung der blanks=Worttrenner - in eine nichtssagende Buchstabenanhäufung verwandelt, diese - (c) - läßt sich leicht für diverse Suchprozeduren aufbereiten, die dann zum gewünschten Ergebnis führen, zumal - (d) - das Hebräische durch den Hang zur Drei-Radikalität und durch den Verzicht (in der Schrift) auf Vokale die Trefferwahrscheinlichkeit beträchtlich erhöht. Ein Mißverständnis von mehreren besteht darin, daß die im Hebräischen gültigen Wortformen aufgelöst werden. Ein Wortzwischenraum ist nicht nichts, sondern höchst relevant für die Beschreibung der Ausdrucksseite!

ad 4.5: Die Aussage gilt für die einzelnen selbständigen oder unselbständigen Wortformen. Über morphologische Veränderungen (v.a. in agglutinierenden Sprachen) oder Kompositabildung sind nachträgliche quantitative Ausweitungen möglich. - Wenn eine Einzelsprache - z.B. Hebräisch - eine besondere Vorliebe für dreibuchstabige Wörter hat, muß - so kann man von vornherein annehmen - die Übergangswahrscheinlichkeit zwischen den einzelnen Buchstaben signifikant höher sein als bei Sprachen, die diese Restriktion nicht aufweisen. Für das Hebräische wurde dies nachgewiesen und damit illustriert, daß es in dieser Sprache 4,7x leichter ist als im Englischen, dreidimensionale Kreuzworträtsel zu konstruieren, d.h. auch in der dritten Dimension ein passendes Wort zu finden. Andere indoeuropäische Sprachen schneiden noch schlechter ab als das Englische, weil ihr Anteil an dreibuchstabigen Wörtern noch geringer ist, vgl. H. Bluhme, Three-Dimensional Crossword Puzzles in Hebrew: Information and Control 6 (1963) 306-309.

ad 4.6: Unter "Wortform" wird jeder zwischen Trennzeichen (blank, Satzzeichen) stehende Ausdruck verstanden (also z.B. auch solche, die durch Konjugation verändert wurden). "Kern" dagegen ist die Grundform, die durch Hinzufügung weiterer unselbständiger Elemente modifiziert werden kann. - Bei der als Beispiel genannten Wortform ort könnte man - bei beibehaltener Reihenfolge (eine Element-Kette darf nicht als frei ausbeutbares Reservoir von Buchstaben betrachtet werden) - t abziehen und erhielte or. Im Deutschen ist diese Reduktion auf Ausdrucksebene sinnlos, weil kein neuer und gebräuchlicher Ausdruck sichtbar wird. Erst der Wechsel der Einzelsprache (Französisch oder Englisch) würde sichtbar machen, daß das Ergebnis als Ausdrucksmöglichkeit nicht unsinnig ist (wie es bei rt wohl weitgehend der Fall ist).

ad 4.8: Das Bewußtsein, daß die v.a. aus der Biologie stammende Systemtheorie auch im Bereich der sog. Geisteswissenschaften, darunter auch der Linguistik bzw. der Kognitionswissenschaft, gute Dienste leistet, wächst in den letzten Jahren.

ad 4.8.1: Ein System kann nur Elemente neu bilden, die von gleicher Art sind wie die übrigen. Ein System von Wortformen (=Buchstabenkombinationen) kann eben neue Wortformen hervorbringen, nicht aber Bedeutungselemente oder Säugetiere. Derartige hinreichend gleichartige Elemente sind also einzelne Einheiten des Systems die immer auch in Relation zu anderen Einheiten stehen. Das Gesamtsystem entsteht dadurch, daß die Elemente sich durch Rückbezug auf sich selbst verhaken und dadurch Zusammenhänge und Prozesse ermöglichen. Vgl. LUHMANN, N, Soziale Systeme. Grundriß einer allgemeinen Theorie. stw 666. Frankfurt/M 1994 (5. Aufl.), S. 67.

ad 4.8.2: Vgl. SCHWANITZ, D, Systemtheorie und Literatur. Ein neues Paradigma. WVST 157. Opladen 1990. S.55-66: Anhand einiger rhetorisch-stilistischer Figuren (Anagramm, Palindromie usw.) wird die Selbstreferentialität der Ausdrucksebene vorgeführt. Der weitere Blick für das Feld der Morphologie scheint zu fehlen.

ad 5.2: Da das Feld der Sprachanalyse nicht beliebig erweiterbar ist - wiewohl die Pragmatik wichtige, bislang aus der Grammatik ausgelagerte Deskriptionsfelder erschließt - stellt das kritisierte Verfahren einen Unsinn dar. Der prägt sich denn auch in erwartbaren Konsequenzen aus: (a) Fanselow, G / Felix, S W, Sprachtheorie. 1. Grundlagen und Zielsetzungen. 2. Die Rektions- und Bindungstheorie. UTB 1441/2. Tübingen 1987 tun sich immens schwer - und es gelingt ihnen auch nicht -, den überdimensionierten Chomsky-Syntax-Begriff von der Semantik zu unterscheiden. (b) Von der Montague-Grammatik werden nahezu 1:1- Relationen zwischen Syntax und Semantik postuliert. Wo ist dann die qualitative Differenz zwischen beiden Ebenen? Oder ist diese Semantik nur eine formalisierte Notation der alten Syntax? (c) Wer seinen Hauptstandort in der alten Syntax hat, kann zwar die inzwischen modischen Termini Semantik und Pragmatik anführen, aber nichts Substantielles dazu bieten: vgl. Guenthner, F, Lehmann, H, Verarbeitung natürlicher Sprache - ein Überblick: Informatik-Spektrum 9 (1986) 162-173. - Am Beginn des voluminösen Bandes: Joachim JAKOBS et. al. (eds.), Syntax. Ein internationales Handbuch zeitgenössischer Forschung. HSK 9/1. Berlin 1993. bezieht sich A. von Stechow auf Chomskys überdimensionierte Syntax-Definition von 1957, als hätten sich in der Zwischenzeit keine Zwänge zu einer Neuordnung des linguistischen Arbeitsfeldes ergeben.

ad 5.3: Wie ich im theoretischen wie praktischen Detail die geschilderte Konzeption verstehe bzw. umsetze, habe ich zuerst dargelegt in: Metaphorische Grammatik. ATS 15. St. Ottilien 1981, (2. Aufl.) 1990 (hier ist S. 21f die Anregung von Fillmore zitiert); Biblische Texte verstehen. Stuttgart 1986; und zuletzt: Computerunterstützte Textinterpretation, s.o. ad 3.3.

ad 5.4: Das habe ich oft erlebt, wenn mein ausdrucksformaler Syntax-Begriff auf den traditionellen traf. Es geht aber nicht um Bilder- / Begriffestürmerei, schon gar nicht darum aufzudecken, was "falsch" oder "richtig" sei, sondern darum, welches Gesamtkonzept theoretisch schlüssiger ist und damit auf effizientere Weise bessere Ergebnisse zu liefern verspricht.

ad 5.5: Im Rahmen dieses Papiers würden damit sämtliche Grenzen gesprengt. Aber das Geforderte ist anderweitig nachlesbar, s.o. ad 3.3, in allen drei Bänden. Jedenfalls ist die Bedeutungsproblematik extensiv in diesem Konzept integriert und nicht, wie im Behaviorismus (Bloomfield-Schule), als metalinguistisch ausgeklammert. Dies zu betonen ist wichtig, da - als rein formale Prozedur betrachtet - die Distributionsanalyse ihre Wurzeln im Behaviorismus hat. Der Dissens beginnt bei der Frage wessen Distribution untersucht wird (die der Ausdruckselemente oder die der üblichen "Wortarten", bei denen Ausdruckswissen und rudimentäre Semantik-Einträge vermischt sind).

ad 5.6: Knappe Erläuterung des Schaubildes: "Phonetik/Phonologie" wurden immer schon als Bereich sui generis verstanden: reine Ausdrucksbeobachtung. "Morphologie" hat üblicherweise eine Zwitterstellung, ist einerseits mit Phonetik verknüpft, andererseits mit Syntax (vgl. Morphosyntax). Diese Unklarheit wird - s.o. - inzwischen doch von verschiedenen AutorInnen registriert. Die Strategien, das Problem zu lösen, sind unterschiedlich. Einerseits soll Morphologie ganz auf die Seite der Form verlagert werden, also weg vom Bedeutungswissen, andererseits wird Morphologie als Untersuchung syntaktisch relevanter Funktionsbestimmungen gesehen, also schon ganz in den Bereich der Verarbeitung von Bedeutungen integriert, wobei die Bedingungen der Ausdrucksseite völlig irrelevant werden (M. Halle). "Syntax" ist üblicherweise ebenfalls durch die Vermischung von Ausdrucks- und Bedeutungsbeobachtungen charakterisiert. Auf dieser Linie bleibt auch Chomsky. Sein Ansatz versuchte jedoch, "Syntax" zugleich auch als kognitive linguistische Basisdisziplin zu etablieren. Zwar ist das Anliegen (theoretische Fundierung der Linguistik) wichtig, aber der Chomsky-Ansatz hatte weder einen Blick (noch ein Interesse) an der Ausdrucksseite noch an Text-, Diskurs-Pragmatikfragen. Angesichts der hypertroph konzipierten "Syntax" gelang es auch nicht, "Semantik" als eigene Disziplin zu integrieren bzw. sie verkümmerte zur "logical form" der "Syntax".
Satz-LinguistInnen entwickeln häufig eine regelrechte Aversion gegen TextwissenschaftlerInnen bzw. LiteraturwissenschaftlerInnen verstehen sich nicht als GrammatikerInnen. Der Übergang vom Text zur Kommunikationssituation (Discourse) wird in der Regel so verstanden, als sei er mit den Mitteln der Grammatik (eng verstanden) nicht mehr zu fassen.
Unintegrierte, z.T. mit Aversionen aufgeladene und zudem in ihrem Ansatz zweideutige Einzeldisziplinen kennzeichnen vielfach die Situation der Sprachanalyse.
Grafisch einfacher, transparenter präsentiert sich das neue Konzept. Die Hintergrundtheorie umfaßt alle für die Kommunikation relevanten Faktoren, bläht nicht eine Einzeldisziplin auf. Die neue Syntax ist reine Ausdrucksbeschreibung, ohne Beimengung von Bedeutungswissen. Die Ergebnisse haben allerdings sehr wohl pragmatische Funktionen (z.B. Verwendung von Reimen, geprägter Sprache u.ä.). Die neue "Semantik" übernimmt die Bedeutungsanteile der alten "Syntax" weitet sie aber aus um neue Fragestellungen (z.B. Sprechakte) bzw. behandelt die alten nach überprüfter und revidierter Terminologie (z.B. Determinationen, Aktanten u.a.). Die "Pragmatik" verbindet die Textbeschreibung mit den Grammatikanalysen, verwendet vielfach die gleiche Terminologie wie schon in der "Semantik". Dadurch kann die alte Kluft überwunden werden. Die drei Unterabteilungen (TG = "text grammar", TL = "textual linguistics", TP = "textual pragmatics") stehen für eine zunehmend strengere kritische Prüfung des zunächst naiv im Wortsinn genommenen Sprachbefundes. Das erlaubt einerseits ein Sichtbarmachen des gemeinten Sinnes hinter dem wörtlich präsentierten, andererseits kann damit der Übergang vom Text zum Diskurs eingeleitet werden.

ad 6.1: Unser "Neuansatz" ist neu im Verhältnis zur "herrschenden Praxis". Die zentrale Idee dazu ist aber schon längst formuliert, wenn auch nicht konsequent durchgehalten worden. Zellig S. Harris hat zu Beginn der 50er-Jahre in mehreren Aufsätzen die Idee propagiert, eine Einzelsprache distributionell zu beschreiben, d.h. ohne Hinzuziehung von Wissen sprachgeschichtlicher Art oder von Bedeutungswissen. Einige Zitate aus "Distributional Structure": WORD X (1954) 146-162: "The distribution of an element will be understood as the sum of all its environments ... the parts of language do not occur arbitrarily relative to each other" (146). "it is possible to describe the occurence of each element indirectly, by successive groupings into sets ... we can stop the process of setting up these statements at any convenient point, and accept the unfinished list of statements as an approximation to the distributional facts" (147). "the distributional structure should exist in the speakers in the sense of reflecting their speaking habits" (149). Es besteht keine Isomorphie zwischen der morphologischen Ebene (im distributionellen Sinn) und der Bedeutungsebene: "we cannot mix distributional investigations with occasional assists from meaning whenever the going is hard" (152). Im Gefolge dieser voll akzeptablen Äußerungen verwundert es, daß H. sehr stark doch über das Verhältnis der distributionellen Ergebnisse zur Bedeutungsebene nachdenkt. Damit verdunkelt er sein eigentliches Anliegen und erleichtert es späteren Kritikern, sich von diesem Ansatz zu distanzieren, bevor noch ausreichend Erfahrungen damit gesammelt wurden, vgl. Th. Lewandowski, Linguistisches Wörterbuch. UTB 1518. (5. Aufl.) 1990 Heidelberg. I, 236-239.

ad 6.2: Die Klarheit ist nicht gegeben, wenn ich zwei sich widerstreitende Prinzipien zugleich behandeln will: Linearität (betrifft die Ebene der Ausdrücke) und Konstituenz (bezieht sich auf die Bedeutungsfunktion z.B. der Satzglieder). Dieses Schillern von Anfang an, diese Doppelheit / Unentschiedenheit kennzeichnet die traditionelle Syntax ebenso wie gängige Morphologie.

ad 6.3: Die Idee, es ließen sich auf distributionellem Wege auch umfangreichere Bereiche von Ausdrücken beschreiben, hatte schon Zellig S. Harris, s.o. ad 6.1.

ad 6.5: Vgl. als praktische Demonstrationen auf der Basis verschiedener Vorarbeiten die Beiträge von W. Bader und M. Schindele in: H. Schweizer (ed.), Computerunterstützte Textinterpretation. THLI 7. Tübingen 1995

ad 6.6: Die hierbei sich aufbauende Komplexität und damit die Varianz der Ergebnisse ist zwar nicht zu unterschätzen. Da aber ohne die Opposition Regel / Ausnahme operiert wird, ist zunächst theoretisch zu postulieren (vielleicht wird es auch mal praktisch realisiert), daß das gesamte Wortformeninventar zufriedenstellend beschrieben werden kann. Irgendwelche hohen Trefferquoten (z.B. 70 %), mit verbleibender Dunkelziffer (30 %) genügen nicht.

ad 7.: Erste Erprobungen in diesem Feld habe ich 1986-1990 durchgeführt, publiziert in: Harald Schweizer, Sprachkritik als Ideologiekritik. Zur Grammatikrevision am Beispiel von QRB. THLI 1. Tübingen 1991. Kap. 3. - Ein hohes Maß an Übereinstimmung im Ansatz gibt es mit: Hein, D, UNIX gestützte maschinelle morphologische Untersuchung zur Komposition am Beispiel des DUDEN (Deutsches Universalwörterbuch). Bonn 1995, insofern H. - wie wir - ein "Verfahren der String- und der Teilstringsuche" (1) entwickelt. Daher werden zunächst identische Ergebnisse erzielt, z.B. Kompositionsstrukturen wie in stein + kohle + n + berg + werk = (M4 + M3) + Fugenmorphem + (M2 + M1), vgl. 6f. Die Gemeinsamkeiten enden aber bald, aus unterschiedlichen Gründen: (1) Unsere These Ziff. 7.4 wird nicht beachtet, d.h. der Algorithmus gibt sich zufrieden, bei einem potentiellen Kompositum einen Teil gefunden zu haben, z.B. pferde, der Rest - z.B. blumento - wird der manuellen Nachbearbeitung oder einer semantischen Klärung überantwortet. Wir verlangen stattdessen, daß auch jener "Rest" positiv nachweisbar ist - das wird bei blumento schwerfallen -, so daß erst dann die Gesamtzerlegung akzeptiert ist. - (2) Hein verläßt dann doch die reine Ausdrucksanalyse, insofern er semantische Auswertungen anvisiert (Mengen-, Reihenfolgerelationen, Einbeziehung der tradtionellen Wortarten). Was zuvor nicht in den Blick kommt, ist die Möglichkeit, distributionell den gesamten Wortschatz viel umfassender auf Ausdrucksebene zu untersuchen.

ad 7.1: So haben wir aus der "Blechtrommel" von G. Grass die lateinischen, englischen, französischen, aber auch die dialektalischen (Ostpreussisch) Elemente entfernt. - Bei Eigennamen kann es sein, daß sie den Algorithmus unbeeindruckt, d.h. unanalysierbar passieren (Koljaiczek), oder sie verhalten sich wie normale Wortformen (erich => er+ich).

ad 7.4: Bei der Wortform gründlich kann man nicht bei der Analyse: eine gefundene Wortform (grün) + nicht-belegter, unanalysierter Rest (dlich) stehenbleiben. - Mit alternativen Zerlegungen - die beide ausdrucksformal gleichwertig sind - ist zu rechnen: staubecken => stau+becken | staub+ecken.

ad 7.6: Die Schwelle zwischen gängigen Endungen und nicht-signifikanten Resten mußte bislang noch von außen, also intuitiv festgelegt werden. Wir arbeiten daran, den Nachweis algorithmisch herzuleiten. Der Weg ist folgender: zur quantitativen und damit nur graduellen Abstufung der Endungselemente kommt eine Überprüfung hinzu, etwa so:
(a) Zu der hypothetischen Endung dlich wird geprüft, ob ein Teil davon mit größerer Häufigkeit belegt ist. Das ist hier der Fall: lich rangiert in der Häufigkeit weiter oben, was zusätzlich impliziert: lich als Endungselement (präziser: Kernerweiterung) ist häufig nach ganz verschiedenen Kernen belegt.
(b) Damit bleibt als Rest: d, der ebenfalls befriedigend erklärt werden muß. In der Liste der häufigen Endungselemente rangiert dieses d ebenfalls weit oben, so daß - nur quantitativ betrachtet - hiermit die Überprüfung positiv ausgefallen wäre.
(c)Es gilt jedoch sicherzustellen - analog den Erkenntnissen zu lich -, daß d Endungselement nach vielen verschiedenen Kernen ist. Das wird kaum gelingen, denn d ist signifikant stark "abonniert" auf die Formation en+d.
(d) Die Folgerung: dlich kann nicht als Kombination von Endungselementen erklärt werden (+d+lich), damit ist der gesamte Endungsvorschlag hinfällig, entsprechend erhöht sich die Zahl der Belege von lich. Das d muß zum jeweiligen Kern gerechnet werden.

ad 7.7.2: Zu den in der These erwähnten Teilrealisierungen bei Kernerweiterungen: &keit begegnet eben nicht als &kei+[andere Endung], obwohl t zweifellos zu den gängigen Endungen gehört. Im Zusammenhang von &keit funktioniert aber t nicht als Endung, sondern bildet mit den vorherigen Buchstaben eine feste Kette. &schaft als Kernerweiterung zum Wortende hin wird auch nie in Teilrealisierung geboten.

ad 7.7.6: Das Wort erweiterung ist schon ein Beispiel für distributionelle Homographen, s.u. 7.9: er ist (a) selbständige Wortform, (b) Präfix (er-weiterung), (c) Kernerweiterung (erweit&er...), (d) Endung (weit => weit+e+r).

ad 7.8: Etwas anders ausgedrückt: Es wird die gleiche Prozedur wie oben bei den Infixen durchgeführt (s.o. Ziff. 7.5). Grundlage sind die selbständigen Wortformen und die Liste der häufigsten Endungen: Es wird sich ergeben, daß bei mehreren kompletten Zerlegungen ein Innenrest von einem Buchstaben = d bleibt. Nun nicht von Infix zu reden, sondern diesen Innenrest als Bildung eines neuen Kerns zu verbuchen, liegt an der anderen Ausgangsbasis. Außerdem ist der erste Teil (grün - wenn man die Belege von dlich verfolgt - in mehreren Fällen immer derselbe, der auf das d folgende Teil lich ist es ohnehin. Demgegenüber liegt ein Infix nur dann vor, wenn die beiden Teile komplett ausgetauscht werden können und dennoch das verbindende Element konstant bleibt.

ad 7.9: Um nicht-algorithmisch an Illustrationsmaterial zu kommen, ist recht nützlich: Gustav Muthmann. Rückläufiges deutsches Wörterbuch. Handbuch der Wortausgänge im Deutschen mit Beachtung der Wort- und Lautstruktur. RGI 78. Tübingen (2. Aufl.) 1991. Man kann sich etwa S.469ff informieren, wie es um ei im Wortauslaut steht. Unproblematisch ist dabei: selbständige Wortform + ei (ebenfalls als selbständige Wortform), wie in land+ei. Dazu gehört dann auch - entgegen der dann doch semantisch oder diachron bestimmten Einteilung bei Muthmann: fabel+ei, kurbel+ei, ziegel+ei, auch wenn sich einem semantisch die Haare sträuben. Allerdings tut sich eine Alternative auf: ei ist sehr häufig auch Kernerweiterung, wobei ihr entweder er vorangehen (zaub&er&ei, sing&er&ei, büch&er&ei, mal&er&ei) oder el, wie in lieb&el&ei, einsied&el&ei, blöd&el&ei, witz&el&ei. Daneben gibt es - wenn auch selten - lei als Kernerweiterung (viel&er&lei, all&er&lei, ein&er&lei).

ad 7.10: Die ersten Ergebnisse zu den gängigsten Endungen sind ohnehin noch kritisch zu überprüfen: Im ersten Zugang kann es sich ergeben, daß d als häufiges Endungselement erwiesen wird (wenn das Beispielkorpus enthält: lachen, lachend). Wenn die Gegenkontrolle ergibt, daß d im Endungsbereich immer nur in der Verbindung end auftritt, dann gilt fortan nicht isoliertes d, sondern nur noch end als Endung.
Wir haben bislang den Eindruck, als könne man Kernerweiterungen/Endungen nach einer Ordnung differenzieren, die anzeigt, wie diese Elemente kombinierbar sind. Demnach gibt es bottom-Elemente bzw. Elemente nullter Ordnung, die - wenn sie belegt sind - immer unmittelbar auf den Kern folgen (z.B. ig, heit). Elemente 1. oder jeder folgenden Ordnung können positiv belegt sein oder fehlen (wie auch die Elemente nullter Ordnung). Wenn sie belegt sind, folgen sie immer auf die Elemente der vorhergehenden Ordnung. Vgl. Beispiele wie: kreuz&ig&ung+e+n, kreuz&ung+e+n, kreuz+e+n; farb&ig&keit; wahrschein&lich&keit, wahr&haft&ig&keit. Im Rahmen dieser nicht-repräsentativen Belege wären &haft, &lich eine Kernerweiterung nullter Ordnung, &ig eine Kernerweiterung erster, &keit eine Kernerweiterung zweiter Ordnung usw. Damit ist aber erst die Art benannt, wie die Ergebnisse geordnet werden können. Die empirische Fundierung fehlt noch.

ad 7.11: Im Deutschen (f-?eier.tage; f-?ei.er.tage) und Englischen (f-?in.ally; f-?is.her.man) scheint sich f- als Präfix zu ergeben. Kontrolle: Für den behaupteten Kern (d.h. für das gesamte Restwort, nicht lediglich den ersten angebotenen Zerlegungsteil) wird verlangt, daß mindestens 2 zusätzliche verschiedene Präfixe (einschließlich 0-Präfix = selbständige Wortform) nachweisbar sind. In den zitierten Fällen wird dies nicht möglich sein (es gibt vielleicht eiertage, aber keine eiertage mit echtem weiterem Präfix. Ähnlich: inally usw.). Als Gegenkontrolle müßte die Reihe der Präfixe (also einschließlich des f-) an mehreren verschiedenen Wortformen nachweisbar sein. - Mit diesen Rückversicherungen wird es möglich, zwischen vermeintlichen Präfixen (die in Wirklichkeit zum Wortstamm gehören) und echten zu unterscheiden.

ad 7.12: Angesichts von Fällen wie beantragen sind distributionell die beiden Lösungsmöglichkeiten zu prüfen: (a) be-antrag+e+n, d.h. es kann antrag als erweiterter Kern plausibel gemacht werden, an entpuppte sich dann ebenfalls als Homograph, wäre hier also nicht Präfix, sondern Kernerweiterung. In diesem Fall gilt die obige Erkenntnis, daß unselbständige Präfixe immer am (u.U. erweiterten) Kern stehen. - (b) Sollte - unwahrscheinlicherweise - diese Differenzierung nicht möglich sein, dann würden beide Elemente als Präfix gewertet. Das unselbständige könnte dann auch Fernstellung zum Kern einnehmen.

ad 7.13: So konnte bei der Kompositazerlegung häusermeeres zerlegt werden, wenn im Vergleichskorpus noch häuser und meeres belegt waren. Diese Ergebnisse sind nun nachzubessern, indem häuser auf häus+e+r und meeres auf meer+e+s zurückgeführt wird, u.z. auch dann, wenn in meinem Vergleichskorpus meer nicht belegt ist. (Die Umlautproblematik wird hier noch ausgeklammert).

ad 7.15: Bei der Wortform tisch wird sich vorgeschaltet die Reihe ergeben: der, dem, den. Liegt tische vor, dann geht voraus: die, der, bei tisch+e+n den. - steh+s+t läßt mit hoher Wahrscheinlichkeit davor oder danach du erwarten. - Wenn es die Ausdrucksstruktur des Deutschen erlaubt, problemlos Wortformen zusammenzuschreiben (Nachtklub - s.o. unsere "Komposita"), so wäre jetzt die Stelle erreicht, wo Bildungen im Englischen (night club - d.h. getrennt geschrieben, aber signifikant oft in fester Verbindung) oder im Französischen (moulin à vent - getrennt und mit dazwischengeschalteter Wortform) ausdrucksformal erfaßt werden. - Man denke aber auch an Grußformeln (guten tag) bis hinauf zu ausführlichen feststehenden Wendungen (im namen des volkes ergeht folgendes urteil).

ad 7.16: Unter dem Einfluß der Phonetik / Phonologie lassen sich hier Gruppenbildungen einführen, z.B. die Zusammenfassung verschiedener Grapheme, weil sie etwa alle der Gruppe der Dentale angehören. Definition der Äquivalenz unter Reim-Gesichtspunkten: ei, ai u.ä.

ad 8.: Eine geraffte Illustration bezogen auf das Englische mag das Gesagte auf weitere Art verdeutlichen.

ad 8.1: Kein auf die Ausdrucksebene bezogener Algorithmus wird plausibel machen, daß im Englischen "go" und "went" etwas miteinander zu tun haben. Vgl. auch oben ad 2.1:. Die Semantik-Basierung der gängigen Morphologie, läßt sie mehr oder weniger großzügig von "Allomorph" sprechen. Beide Extreme dieser Gradskala haben lästige Folgen: Ist man zurückhaltend bei der Verwendung des Terminus, handelt man sich die Frage ein, warum man nicht konsequent sei und weitere bedeutungsgleiche, aber ausdrucksverschiedene Phänomene einbeziehe; geht man großzügig mit "Allomorph" um, ist von vornherein offenkundig, daß man Semantik betreibt und keine "Formenlehre" mehr. Gefragt ist also nicht ein "mehr oder weniger", sondern ein grundsätzlich anderer Ansatz.

ad 8.2: Es gibt in der Forschungsgeschichte allerdings genügend Beispiele, wo solche Grundlagenforschung in praktische, zunächst nicht abgesehene Folgen mündete.

ad 8.3: Dabei steht die Annahme im Hintergrund, daß die Verschiedenartigkeit der Einzelsprachen nicht von der Ebene der Inhalte her begründbar ist, daß also im wesentlichen in allen Sprachen die gleichen Inhalte aussagbar sind - wobei der Aufwand hierbei u.U. sehr verschieden ist (wo die eine Sprache für einen Sachverhalt vielleicht ein passendes Wort/einen passenden Begriff hat, benötigt man in der anderen u.U. mehrere Sätze zur Beschreibung). - Es mag Ausnahme-Nischen geben (vgl. die vielleicht nie ganz widerlegbare Whorfsche Hypothese), die aber in der Hauptlinie das genannte Argument nicht gefährden.

ad 8.5: Viel zu platt und folglich unangemessen wäre ein Lexikondenken, das nur danach fragt, welche Bedeutung mit einem Ausdruck verbunden ist. In der Regel sind es eben Bedeutungen, die mit einem Ausdruck verbunden sind. Man benötigt also eine Instanz, die hilft, zwischen diesen Möglichkeiten zu wählen.

ad 8.6: Die Vision einer solchen Grammatikstruktur formulierte ich zuerst in: "Was ist ein Akkusativ? - Ein Beitrag zur Grammatiktheorie" : Zeitschrift für die alttestamentliche Wissenschaft 87 (1975) 133-146.

ad 8.7: Bestimmte Konjugationsformen (in mehreren Sprachen) werden als "aktiv" qualifiziert. Dadurch wird dann bei der Bestimmung von "er starb" das STERBEN eine Aktion, während es sachverhaltlich sicher ein Prozess ist. Die oft unsinnigen Wechselwirkungen zwischen grammatischem und natürlichem "Geschlecht" sind weitbekannt (im Hebräischen sind die "Frauen" 'männlich', die "Väter" aber 'weiblich'). Üblicherweise - auch in wissenschaftlicher Literatur - werden "Prädikat" und "Verb" verwechselt, "Präpositionalgruppe" und "Umstandsbestimmung", "Akkusativ" und "Objekt", die Frage, ob ein "Artikel" vorliegt mit der der "Determination" usw. usw. "Modalitäten" werden oft nur behandelt, wenn einzelne 'Modalwörter' vorliegen, d.h. man sieht nicht die semantische Eigenständigkeit dieser Perspektive. - Derartige Konfusionen sind nicht nur ein theoretisch-wissenschaftliches Problem, sondern stören auch empfindlich jede Didaktik und Methodik des Sprachunterrichts.

ad 8.8: Einige Erfahrungen werden veröffentlicht werden in: H. Schweizer, Der Computer und Übersetzungen unterschiedlich starker Wörtlichkeit. Erfahrungen mit dem Text der Josephsgeschichte: Actes du Cinquième Colloque International "Bible et Informatique: Translation et Transmission", Aix-en-Provence 1-4 Septembre 1997. Paris-Genève 1998. xx-yy.

ad 9.2: Zu den Präfixen gibt es erste Erfahrungen, die aber noch weiterzuentwickeln sind. Es stehen aus: Klassenbildung, Behandlung der Wortgruppen. - Zu den ersten Erprobungen - s.o. ad 7: - kam inzwischen eine zweijährige Kooperation mit Sebastian Haase, einem C + + -erfahrenen Studenten, der nicht nur Programmieraufträge realisierte, sondern sich auch vielfältig kritisch mit der Fragestellung auseinandersetzte. Ihm sei ebenso gedankt wie den Teilnehmern zweier Seminare an der Fakultät für Informatik. Die vielfältigen Debatten und Auseinandersetzungen mit der Literatur waren eine große Hilfe bei der Klärung der Fragestellung.

ad 9.4: Der Einwand, jener Algorithmus liege noch nicht voll ausgearbeitet vor, disqualifiziert sich somit in doppelter Hinsicht und entpuppt sich als Vorwand: (a) Er nimmt die Auseinandersetzung auf Theorieebene, die jeder Programmierung vorausgehen muß, nicht ernst. (b) Er ist nicht bereit, die vorgestellten ersten Analyseschritte nachzuvollziehen und zu respektieren.