Batch-Anpassungen in Termbanken – it’s a kind of magic

Batch-Anpassungen in Termbanken – it’s a kind of magic

...und warum MultiTerm von RWS Trados unser Go-To ist!

Aber einen Schritt zurück - was bedeutet es überhaupt, eine Terminologiedatenbank zu "modifizieren"?

Als Computerlinguist:innen bei berns language consulting ist die Arbeit mit umfangreicher Terminologie und Terminologiedatenbanken ein fester Bestandteil unserer täglichen Arbeit. Von der Neueinrichtung von Datenbanken über die Konvertierung von Formaten bis hin zur Durchführung umfangreicher Modifizierungen und Zusammenführungen – wir können alles mit linguistischem und technischem Fachwissen bewältigen. Für diese Dienstleistungen setzen wir auf unser Data Toolkit, ein selbst entwickeltes Python-Framework. Darüber hinaus erweitert unsere strategische Partnerschaft mit RWS Trados unsere Möglichkeiten und befähigt uns, noch robustere und effizientere Sprachlösungen anzubieten.

„Modifizieren“ bedeutet, eine Terminologiedatenbank auf der strukturellen Ebene zu bereinigen. Die Strukturebene bezieht sich auf die Metadaten – im Gegensatz zur Inhaltsebene, die sich auf die Begriffe und Konzepte selbst bezieht.

Konkrete Beispiele für Bereinigungspotenziale auf struktureller Ebene sind die Umbenennung von Metadatenfeldern, die Änderung der Ebene von Feldern, die Zuordnung von Feldwerten oder die Zusammenführung doppelter Einträge. Auch der Aufbau einer Terminologiedatenbank aus Nicht-Terminologiedaten (z. B. Excel-Listen) oder die Anreicherung einer bestehenden Terminologiedatenbank mit weiteren Daten sind spezielle Fälle von Änderungen.

Warum überhaupt eine Terminologiedatenbank strukturell verändern?

Use Case: Anreicherung einer Terminologiedatenbank mit zusätzlichen Daten

Hier ist ein Beispiel für einen Use Case, bei dem wir eine bereits hochkomplexe einsprachige Datenbank eines deutschen Automobilherstellers um Terminologieäquivalente in rund 50 Sprachen ergänzt haben.

Und wie machen wir das?

In einem objektorientierten Python-Framework werden die Dateien gelesen und ihr Inhalt zusammen mit den Metadaten in Python-Objekten dargestellt. Alle Änderungen und Modifizierungen werden direkt an diesen Objekten vorgenommen, um einen klaren und organisierten Arbeitsablauf zu gewährleisten. Schließlich wird die abgeänderte Terminologiedatenbank in einer Datei im gewünschten Format gespeichert, wobei die Integrität der verarbeiteten Daten gewahrt bleibt.

Entschuldigung bitte, welche Objekte?

Die Objektorientierung ist eine Programmierstrategie, die es ermöglicht, reale Entitäten in der Programmierung als Objekte zu modellieren, wodurch sich komplexe Systeme leichter organisieren und verwalten lassen. In unserem Data Toolkit bilden die Objekte die hierarchische Struktur einer Terminologiedatenbank nach, d. h. die Ebenen Konzept, Sprache, Begriff und verschiedene Metadatenfelder.

Da es verschiedene Formate für eine Terminologiedatenbank gibt, mussten wir uns entscheiden, wie unsere Objekte aussehen sollten. Da der Standard auf dem Markt MultiTerm XML ist, ein von RWS Trados entwickeltes Format, haben wir unsere Objekte entsprechend strukturiert. Wir sind sogar so weit gegangen, alle anderen Formate mit eigens dafür geschriebenen Parsern/Readern in dieses Format zu konvertieren. Theoretisch könnte man auf diese Weise auch Parser/Writer schreiben,  nachdem Änderungen an den Objekten vorgenommen wurden, um sie in verschiedene Formate übertragen zu können. Da jedoch die meisten der auf dem Markt verbreiteten Terminologieverwaltungssysteme mit MultiTerm XML als Importformat kompatibel sind, war dieser Schritt bisher in der Regel nicht notwendig. Außerdem wird MultiTerm häufig als bevorzugtes System eingesetzt.

Partnerschaft mit RWS Trados

Trados ist Teil von RWS, einem weltweit führenden Anbieter von KI-gestützter Sprach- und Inhaltstechnologie und -dienstleistungen, der mit 88 der 100 größten globalen Marken zusammenarbeitet. Als führender Hersteller setzt RWS Trados Standards in der Lokalisierung. Die Tool-Lösungen sind weit verbreitet und viele unserer Kunden vertrauen auf die Lösungen von RWS Trados. Trados bietet End-to-End-Lösungen für alle, die an der Übersetzung beteiligt sind – ob ein neuer Übersetzer, der sein erstes Tool für computergestütztes Übersetzung (CAT) einsetzen möchte, ein Sprachdienstleister, der seine Zusammenarbeit mit Kunden effektiver gestalten möchte, oder ein Unternehmen, das große Mengen mehrsprachiger Inhalte verwalten möchte.

Als unabhängige Partner profitieren sowohl blc als auch RWS Trados von Austausch, Know-how und enger Zusammenarbeit!


To view or add a comment, sign in

Explore topics