Wörterbuchtypen 15. September 2007
Posted by koocachoo in dicML, E-Wörterbuch.add a comment
Welches Leistungsspektrum soll dicML bieten, welche Wörterbuchtypen sollen erfassbar sein?
Zukunft der E-Wörterbücher 6. September 2007
Posted by koocachoo in dicML, E-Wörterbuch.add a comment
Wie sollen zukünftig E-Wörterbücher aussehen? Was sollen sie können?
Diese und andere Fragen möchten wir mit euch in der neuen Google-Gruppe »Arbeitsgruppe E-Wörterbücher« diskutieren: http://groups.google.com/group/ag-ewb/.
Was macht eigentlich …? 2. September 2007
Posted by Thomas in dicML, E-Wörterbuch, gidooCMS.add a comment
Hier mal eine kurze Zusammenfassung des aktuellen Stands auf der Softwareseite.
Das Online-Wörterbuch ist zwar in soweit entwickelt, dass es einen funktionsfähigen Prototypen gibt. Allerdings ist die Entwicklung erstmal eingefroren bis der neue dicML-Standard fertig ist. Bisher haben dort auch nur die Anzeigefunktion, nicht jedoch die Editierfunktion funktioniert.
Mein aktuelles Hauptaugenmerk befindet sich derzeit auf die Entwicklung eines eigenen Content-Management-Systems (CMS). Angesichts der Fülle der bestehenden CMS scheint dies an sich überflüssig. Allerdings haben wir doch sehr spezielle Anforderungen die ich in ihrer Gesamtheit bisher bei keinem bestehenden CMS gefunden habe.
- Es sollte in Java implementiert sein, damit später nur ein Server zu warten ist (das Wörterbuch ist bereits in Java).
- Man solle eine eigene XML-basierte Auszeichnungssprache einsetzen können, die dann mit Hilfe eines XSLT-Skripts konvertiert werden. So kann man leicht eigene Tags hinzufügen.
- Das Einbinden von anderen Komponenten, wie z.B. dem Wörterbuch, soll möglichst einfach sein. Das Wörterbuch wurde mit Hilfe des Wicket Frameworks geschrieben (http://wicket.apache.org) also wäre ein CMS in Wicket ideal.
- Um dem doch sehr strengen deutschem Recht genüge zu tun wäre eine Rechteverwaltung mit einer Art Chefredakteur der geänderte Artikel erst überprüft und dann veröffentlicht wünschenswert.
- Die Konfiguration sollte nicht komplizierter sein als selbst ein CMS zu schreiben
- Eigenheiten des konkreten CMS, wie z.B. die Menüs oder zufällige Banner wie jetzt schon beim sf-Projekt, sollten direkt Java und nicht in irgendeiner Skriptsprache oder mit unendlich komplizierten Konfigurationsdateien umgesetzt werden können.
Die Entwicklung von gidoocms geht voran, wird aber sicher noch eine Weile benötigen. Aktuell funktioniert die Anzeige der Seite und weite Teile der Administrationsoberfläche. Es fehlen noch die Bearbeitungs- und Veröffentlichungsoberfläche sowie Caching-Funktionen. Genug Arbeit also noch.
Während wir früher unsere Projekte bei berliOS (http://developer.berlios.de) gehosted haben sind wir inzwischen zu Google umgezogen. Wer Interesse hat sich den aktuellen Stand in konkreter Quellcodeform anzuschauen kann dies dort tun. Die Projekte sind natürlich unter einer Opensource-Lizenz veröffentlicht.
- das Online-Wörterbuch: http://code.google.com/p/owl-dicml
- gidoocms: http://code.google.com/p/gidoocms/
Wer Interesse hat mitzuarbeiten ist natürlich herzlich eingeladen.
E-Wörterbücher: Zielgruppenüberlegungen 1. Juli 2007
Posted by koocachoo in dicML, E-Wörterbuch.2 comments
Bei der Entwicklung einer Wörterbuchauszeichnungssprache ist es vonnöten, sich darüber bewusst zu werden, wer eigentlich die Zielgruppe ist. Jede Zielgruppe hat ihre unterschiedlichen Bedürfnisse. So ist es etwa wenig sinnvoll, in einem Grundschulwörterbuch die Etymologie von Wörtern zu verzeichnen.
Die Zielgruppe von gidoo.org sind grundsätzlich Fremdsprachenlerner. Diese benötigen in der Anfangsphase (bis etwa Niveau B1/B2) auf jeden Fall ein zweisprachiges Wörterbuch – ein Aktivwörterbuch zum Produzieren und ein Rezeptionswörterbuch zum Verstehen fremdsprachlicher Texte.
Verlage kombinieren häufig diese beiden Wörterbuchtypen. So ist ein Deutsch-Französisch-Wörterbuch häufig als Aktivwörterbuch für deutsche Muttersprachler und als Passivwörterbuch für französische Muttersprachler konzipiert. Diese häufig finanziell motivierte Kombination hat allerdings nicht selten den Effekt, dass das Wörterbuch für die deutschen Muttersprachler zu wenig Informationen enthält, für die französischen hingegen zu viel. Bei dem Sprachenpaar Französisch-Deutsch ist dies genau umgekehrt. Da dies unbefriedigend für alle – bis auf vielleicht den Verlag – ist, trennen wir strikt Aktiv- von Rezeptionswörterbüchern.
An fortgeschrittene Lerner richtet sich einsprachige Wörterbücher. Diese Wörterbücher zeichnen sich nicht nur dadurch aus, dass statt Übersetzungen Defintionen geboten werden. Es werden ebenso Synonyme und eine Reihe weiterer Informationen, die für fortgeschrittene Lerner interessant sind, gegeben. Da dies jedoch einen enormen Erarbeitungsaufwand mit sich bringt, den wir nicht bewältigen können, berücksichtigen wir vorerst einsprachige Wörterbücher nicht in dicML. Um die zukünftige Entwicklung von dicML jedoch zu gewährleisten, haben wir stets im Hinterkopf, dass dicML später auch auf diesen Wörterbuchtyp ausgeweitet werden soll.
Lerner im Anfangsunterricht suchen mitunter auch flektierte Wortformen im Wörterbuch oder wissen nicht genau, wie welches Wort flektiert (›gebeugt‹) wird. Da es wenig sinnvoll ist, jede flektierte Form als eigenes Lemma zu führen, werden wir neben der reinen Wörterbuchauszeichnungssprache auch eine Morphologieaussprache schaffen, die eine Deklination und Konjugation »auf Knopfdruck« ermöglicht. Angesichts der sehr verschiedenen Sprachtypen, deren Flexionsmöglichkeit noch im Detail analysiert werden müssen, sind wir derzeit gezwungen, dieses Thema ebenfalls zu verschieben.
dicML 2.0 – die Wörterbuchauszeichnungssprache 24. Juni 2007
Posted by koocachoo in dicML, E-Wörterbuch.add a comment
Im Rahmen unseres Wörterbuchprojektes erarbeite ich, Julius, die Auszeichnungssprache dicML 2.0 ›dictionary markup language‹.
dicML 2.0 wird keine Fortführung seines Vorgängers sein, das heißt, es wird nicht abwärtskompatibel sein. Seit dicML 1.0 habe ich viel dazugelernt – sowohl im Rahmen meines Französischstudiums als auch durch die Lektüre von verschiedenen Lexikografiebüchern. Dieses Wissen wird nun in dicML 2.0 fließen. Ich freue mich schon auf eure Kommentare, denn dicML gelingt nur gemeinsam.