window.dataLayer = window.dataLayer || []; function gtag(){dataLayer.push(arguments);} gtag('js', new Date()); gtag('config', 'G-TCJTE9L38H');

Reimen leicht gemacht

Lies diesen Artikel und viele weitere mit einem kostenlosen, einwöchigen Testzugang.

Kennen Sie das Zur Feier des 70. Geburtstags Ihrer Mutter soll mit einigen Darbietungen aufgewartet werden, und Ihnen fällt das Los zu, ein würdigendes heiteres Gedicht zu verfassen. Ohne Reime darf dieses natürlich nicht auskommen, und so ringen Sie eines Tages mit Ihrer Kreativität und dem deutschen Wortbestand, um etwas Sinnvolles zu Papier zu bringen. Aber lassen Sie sich dabei doch einfach von Access und einer Reim-Hilfe-Datenbank unterstützen…

Beispieldatenbank

Die Beispiele dieses Artikels finden Sie in der Datenbank 1505_Reimer.accdb

Computer-Reimen

Nicht jeder ist ein Sprachgenie, und das Auffinden von gleichklingenden Ausdrücken in den neuronalen Untiefen des Sprachzentrums macht wohl Allen einige Mühe. Der Vorgang ist aber nicht so kompliziert, dass man ihn nicht auch an eine Software-Anwendung delegieren könnte.

Der Kern dieser wäre eine Liste aller deutschen Worte, deren Endungen dann nur noch verglichen werden müssten. Dafür eignet sich natürlich eine Datenbankanwendung am besten. Tatsächlich ist die Beispieldatenbank des Autors zu diesem Beitrag aus ähnlichen Motiven entstanden, wie im Intro erwähnt.

Wortliste

Auf der Suche nach Dateien, die alle deutschen Begriffe in allen Formen, wie Flexionen, et cetera, enthalten, stößt man im Netz auf verschiedene Quellen. Diese sind leider allesamt weder komplett, noch fehlerfrei.

Die einzige Tabelle tblWorte der Demo-Datenbank ist daher aus verschiedenen Dateien erstellt und nachbearbeitet worden.

Meist liegen diese Wortdateien in Textform vor und haben einen CSV-ähnlichen Aufbau. So war eine Quelle etwa der OpenThesaurus, welcher auch von Open-Office eingesetzt wird, oder die Ergebnisse des Sprachwunders Morphy, das auch der Syntaxanalyse der Begriffe mächtig ist. Diese Textdateien wurden in Tabellen importiert und über Anfügeabfragen zusammengeführt. Dann erfolgte noch eine Nachbearbeitung über VBA-Routinen, die die Begriffe eindeutig filterten und die Groß- und Kleinschreibung anpassten. Schließlich wurde die Tabelle auch noch für das Reimen vorbereitet und erweitert, indem eine automatische Silbentrennung aller Begriffe erfolgte.

Ergebnis ist eine Tabelle mit etwa 470.000 Begriffen, die aber dennoch keinen Anspruch auf Vollständigkeit erhebt. Viele umgangssprachliche Ausdrücke oder Modeworte fehlen, und die Groß- und Kleinschreibung lässt stellenweise zu wünschen übrig. Vor allem aber ist die Silbentrennung ganz und gar nicht perfekt, denn diese entstand aus Performancegründen über einen Algorithmus, der phonetische Gesichtspunkte außer Acht ließ und Konsonanten- und Vokalgruppen nur rudimentär untersuchte. Dennoch ist sie für den angepeilten Einsatz brauchbar. Damit die Tabelle schnell durchsucht werden kann, sind einige Felder indiziert, was dazu führt, dass die Datenbank mit 48 MB recht groß geraten ist.

Einen Ausschnitt der Wortliste der tblWorte finden Sie in Bild 1. Die Spalte Wort verzeichnet die Begriffe, welche in der gebräuchlichen Schreibweise gespeichert sind. Natürlich kann das Verb duschen auch im Nominativ daherkommen und schriebe sich dann korrekt Duschen. Im Feld Silben finden Sie dann jeweils den Begriff mit dem Trennzeichen für die Silbentrennung. Für Abfragen, die etwa den Rhythmus eines Ausdrucks berücksichtigen wollen, ist zur schnelleren Bearbeitung noch das berechnete Feld Silbenzahl eingefügt, dessen Werte sich aus der Zahl der Trennstriche plus eins ergeben. Mit LetzteSilbe und Reim folgen nun die für uns besonders interessanten Werte. Sie wurden über eine VBA-Routine aus dem Wort gebildet, wobei die Endsilbe und voranstehende Vokale untersucht wurden. Dass dies nicht fehlerfrei funktionierte, sehen Sie etwa am Begriff Duschbad, der aus unerfindlichem Grund ohne Silben angegeben ist. Das letzte Feld lautet LenReim und gibt die String-Länge des Ausdrucks in Reim wieder. Auch dieses berechnete Feld soll zur beschleunigten Weiterverarbeitung bei der Reimsuche helfen.

Der Screenshot verdeutlicht den Feldaufbau der Tabelle tblWorte, die (fast) alle deutschen Begriffe enthält

Bild 1: Der Screenshot verdeutlicht den Feldaufbau der Tabelle tblWorte, die (fast) alle deutschen Begriffe enthält

Die VBA-Routinen, die zu dieser Tabelle führten, sind in der Beispieldatenbank nicht enthalten. Ihre Erläuterung hätte angesichts der Komplexität sicher den Rahmen des Beitrags gesprengt.

Ende des frei verfügbaren Teil. Wenn Du mehr lesen möchtest, hole Dir ...

Testzugang

eine Woche kostenlosen Zugriff auf diesen und mehr als 1.000 weitere Artikel

diesen und alle anderen Artikel mit dem Jahresabo

Schreibe einen Kommentar