Überarbeitung der Wortliste

Moderator: Moderatoren

Post Reply
User avatar
Lúthien Meliel
Posts: 79
Joined: Thu Jun 26 2008 21:58

Post by Lúthien Meliel »

Here's a little example database with only three Sindarin entries, should anyone like to have a look at it. It's an SQLite database, which is the lightest open source database that I could find (see http://www.sqlite.org/ if you want to know more about it). It also has a very small memory footprint, and therefore is probably also very fast in performance.

All the data and structures are maintained in only one file, which I uploaded on http://parendili.org/doc/ithildin.db. Note that you will need some sort of SQLite interface in order to access it: you can use the command line tool supplied by sqlite.org or another one (there's a few out there, some also free). I found that the firefox plugin is very handy: it provides a graphical user interface so that you can browse through the data.
(if you just want the sql to re-create all tables, I uploaded that here: http://parendili.org/doc/ithildin.db.dump )

In order to demonstrate how the model works, here's a query that retrieves the entries, plus the metadata that I entered (it's only very basic, because I added these by hand):

select l.name, e1.gloss, e2.gloss, dc.name, md.text from entry e1
join translation t
on e1.id = t.sind_entry_id
join entry e2
on e2.id = t.mod_entry_id
join tr_md trmd
on trmd.translation_id = t.id
join metadata md
on md.metadata_id = trmd.metadata_id
join dataclass dc
on dc.dataclass_id = md.dataclass_id
join language l
on l.lang_id = md.language_id
and l.lang_id = e2.language_id
and l.lang_id = dc.language_id
and l.lang_id = l.desc_lang_id

this gives the following result:

Image

if you would restrict the query to one language only, say "German", you can add the clause " where l.name = 'Deutsch' ":

Image

or if you want to only retrieve the short names for the metadata, you can replace this part

select (...) dc.name, md.text from (...)
with this
select (...) dc.short_name, md.short_text from (...)

Image

Just to make sure .. it's not necessary to deal with any of this technical stuff in order to use it. It's just to illustrate how it works.

Image
User avatar
Roman
Admin
Posts: 2049
Joined: Tue Mar 13 2007 13:27
Contact:

Post by Roman »

I'm finished going through the list of words in Hiswelóke which were not on sindarin.de. It was a good idea to make such a list, as it revealed lots of issues.. It seems to me that there will never be the ultimate dictionary, one can get used to the thought of a state of perpetual revisions...
Anyway, here is a log of changes. I'll have a look at your tables when I've got the time.

- *rim
+ ambath (amath)
brethel, pl. brethil Ety/376 und brethil Ety/352 getrennt
+ cadwar (cadwor), pl. *cedwoer
+ deloth (delos)
+ dúwath (dúath)
+ egthel (ecthel)
**eiliant -> eilianw, eilian
+ emmelin (emlin)
+ enegui + Kommentar
ened und enedh getrennt
+ pl. feles (falas)
+ gemb (gem)
+ glamb (glam)
+ glas (*glass)
+ gœlœidh, geleidh (golodh)
+ golodhvir (golovir)
hathel, hathol getrennt
+ heledirn (heledir)
+ hervenn (herven)
+ hervess (herves)
+ mesg (mesc)
minnas, minas getrennt
+ pl. muindyr (muindor)
+ pl. newaig X/EI (nawag)
+ nœdia- (nedia-)
+ nemb (nem)
+ old (oll)
+ pl. eirch, erch (orch)
+ orchall (orchal) + Kommentar
+ pl. ereid (orod)
+ graug
+ pl. seleb (salab)
+ ahamar
+ Daumenpaar (samarad)
+ tadeg + Kommentar
+ neleg + Kommentar
+ teilia- (telia-)
+ teilien (telien)
+ ters (tess)
+ thamb (tham)
+ thambas (thamas)
tolodh und toloth getrennt
+ yneb
+ inib

Also:

+ ravaed
+ pirin
User avatar
Eryniel Elmíris
Posts: 1533
Joined: Tue Jun 24 2008 19:51
Location: Ribobel / Rímdor

Post by Eryniel Elmíris »

It seems to me that there will never be the ultimate dictionary, one can get used to the thought of a state of perpetual revisions...
I think with anything Tolkien, that's quite normal though... but I would like to think once we have a fixed starting point - one that I think we are approaching now - we will have a usable Dictionary that will need updating "only" when new information is published...
I'm finished going through the list of words in Hiswelóke which were not on sindarin.de.
So how do you suggest we continue?
The following words are still not in the list (just copy-pasted). Does that mean you would like them not to be?

- erin S. [ɛrin] präp. an dem — on the ◇ SD/129-31
- galad dawn (PE17:84)
- †godref *S. (godrebh N.) [gˈɔdrɛv] (godrebh N.) adv. zusammen hindurch — through together ◇ TAI/150
- gwân (gwan) fair, pale (PE17:165)
- ho N. [hɔ] (hon N., hono N.) pl. †hyn *S. [hyn] (huin N.) pron. 3. pers. m. er — he ◇ Ety/385, X/Z
- -iann, -ion, -iand wide (PE17:115)
- ithildim moon-star(-light) (PE17:39)
- †land I *S. [lˈɑnd] (lhand N.) adj. Fläche — open space, level ◇ Ety/368, X/LH, X/ND1
- meiniel female (PE17:190)
- mēnē, emēnē- have as object, (in)tend, proceed, make for, go towards (PE17:93)
- mîn II S. [mˈiːn] (min- S.) präp. zwischen (konkret örtlich zu verstehen) — (in) between (referring to a gap, space, barrier or anything intervening between two other things)
- minlamad S. [minlˈɑmɑd] s. Ling. (?) alliteratives Versmas (minlamad thent/estent) — 'first voiced' or 'first-echoing', alliterative (?) verse mode (minlamad thent/estent)
- naglath N. [nˈɑglɑθ] s. koll. von nagol, Biol. die Zähne — the teeth ◇ WR/122
- nuin S., N. [nujn] präp. unter dem/den — under the ◇ Ety/378
- rhúnedain East men (PE17:18 )
- taur wise (PE17:102)
- thôr II N. [θˈɔːr] adj. Hinunterspringen, Hinunterstürzen, Sturzflug — swooping, leaping down ◇ Ety/393
- thórod N. [θˈɔːrɔd] s. Sturzbach — torrent ◇ Ety/393
- uin S. [ujn] präp. von — of the ◇ SD/129-31
- whaewar breeze (PE17:34)
- whinn birch (PE17:23)

And what about the more general gloss of 'lore-master' for golodh, (PE17:139)?
User avatar
Roman
Admin
Posts: 2049
Joined: Tue Mar 13 2007 13:27
Contact:

Post by Roman »

- galad dawn (PE17:84)
That's Early Noldorin. Ignote the comments in the brackets in PE17 - they just compare the words with other sources.
- †godref *S. (godrebh N.) [gˈɔdrɛv] (godrebh N.) adv. zusammen hindurch — through together ◇ TAI/150
The word is too uncertain. I still suspect it's actually a verb.
- ho N. [hɔ] (hon N., hono N.) pl. †hyn *S. [hyn] (huin N.) pron. 3. pers. m. er — he ◇ Ety/385, X/Z
Pronouns with gender distinction seem to have been rejected after the LotR.
- -iann, -ion, -iand wide (PE17:115)
Mhm, well - suffixes were not in the dictionary before.
- meiniel female (PE17:190)
It doesn't mean 'female', it's rather the female version of the name Manwe.
- mēnē, emēnē- have as object, (in)tend, proceed, make for, go towards (PE17:93)
This is Common Eldarin or very, very old Sindarin.
- thôr II N. [θˈɔːr] adj. Hinunterspringen, Hinunterstürzen, Sturzflug — swooping, leaping down ◇ Ety/393
- thórod N. [θˈɔːrɔd] s. Sturzbach — torrent ◇ Ety/393
These seem to be Ilkorin.
- whinn birch (PE17:23)
Appears already as hwinn.
And what about the more general gloss of 'lore-master' for golodh, (PE17:139)?
Appears as "Lehrmeister", unless there is a better way to translate it...
- gwân (gwan) fair, pale (PE17:165)
- ithildim moon-star(-light) (PE17:39)
- †land I *S. [lˈɑnd] (lhand N.) adj. Fläche — open space, level ◇ Ety/368, X/LH, X/ND1
- minlamad S. [minlˈɑmɑd] s. Ling. (?) alliteratives Versmas (minlamad thent/estent) — 'first voiced' or 'first-echoing', alliterative (?) verse mode (minlamad thent/estent)
- naglath N. [nˈɑglɑθ] s. koll. von nagol, Biol. die Zähne — the teeth ◇ WR/122
- rhúnedain East men (PE17:18 )
- whaewar breeze (PE17:34)
These should be added.
- taur wise (PE17:102)
Daur - or am I overlooking something?
- erin S. [ɛrin] präp. an dem — on the ◇ SD/129-31
- mîn II S. [mˈiːn] (min- S.) präp. zwischen (konkret örtlich zu verstehen) — (in) between (referring to a gap, space, barrier or anything intervening between two other things)
- nuin S., N. [nujn] präp. unter dem/den — under the ◇ Ety/378
- uin S. [ujn] präp. von — of the ◇ SD/129-31
I'm not sure about compounded prepositions, as they're somehow on the border between grammar and vocabulary. But I guess it wouldn't hurt to add them.
So how do you suggest we continue?
You mention a 'second sheet' in your mail, but I don't think I got any second sheet. If they words above are all which it contained, then I'll make the changes in the table and send it once more to you.
User avatar
Eryniel Elmíris
Posts: 1533
Joined: Tue Jun 24 2008 19:51
Location: Ribobel / Rímdor

Post by Eryniel Elmíris »

Thank you for those clarifications Roman :)
You mention a 'second sheet' in your mail, but I don't think I got any second sheet.
Thats strange, it should have automatically been in the excel sheet...
If they words above are all which it contained, then I'll make the changes in the table and send it once more to you.
Yes, thats all there was in that sheet, so thanks :)
I'm not sure about compounded prepositions, as they're somehow on the border between grammar and vocabulary. But I guess it wouldn't hurt to add them.
Yes, I think they might be handy to have in a dictionary.

The mentioned PE17 were from a list I got from here before I actually got PE17 itself. I was trying to mention everything rather than make my own judgements.
I also got the second file, so I will make the last changes and then off with it to Lúthien. Menneg hennaid :)
User avatar
Eryniel Elmíris
Posts: 1533
Joined: Tue Jun 24 2008 19:51
Location: Ribobel / Rímdor

Post by Eryniel Elmíris »

So, nachdem die Liste nun bei Lúthien ist, wollte ich einen Vorschlag von Roman nochmals aufgreifen und in die Runde fragen, wie die Meinungen dazu sind:
Roman wrote:It should be very helpful, however, to include the past tenses for all verbs - reconstructed, if needed - as they aren't trivial in Sindarin, and also indicative of a verb's etymology - which does belong into a helpful dictionary.
Ich persönlich bin total dafür, würde aber gerne eure Meinungen hören.
User avatar
Eirien
Moderator
Posts: 2091
Joined: Thu Mar 15 2007 13:23

Post by Eirien »

Ich bin mir nicht ganz sicher, ob ich die Frage richtig verstehe: Wenn es sich darum handelt, dass wir uns einfach etwas Nützliches + Sinnvolles wünschen dürfen, wird doch bestimmt niemand Nein sagen?
Falls die Frage irgendwelche Mithilfe/Schreibarbeit o.ä. betrifft, würde ich natürlich auch dazu Ja sagen, im Rahmen meiner Möglichkeiten.
User avatar
Eryniel Elmíris
Posts: 1533
Joined: Tue Jun 24 2008 19:51
Location: Ribobel / Rímdor

Post by Eryniel Elmíris »

Danke Eirien, ich dachte schon, das interessiert niemanden....

Gemeint war, ob die Aufführung der Vergangenheitsform für Verben in der Übersetzungs-Applikation gewünscht ist oder nicht.
Und wegen Mitarbeit: Wenn es soweit ist, werden bestimmt alle gebraucht ;)
User avatar
Avorninnas
Posts: 1499
Joined: Mon Mar 12 2007 22:58

Post by Avorninnas »

Eirien wrote: Falls die Frage irgendwelche Mithilfe/Schreibarbeit o.ä. betrifft, würde ich natürlich auch dazu Ja sagen, im Rahmen meiner Möglichkeiten.
Ich ebenfalls - ich dachte, das sei in unserem Rahmen hier ohnehin selbstverständlich.
Faerphin
Posts: 59
Joined: Sun Jul 04 2010 13:45

Post by Faerphin »

Mir würde das auch gefallen. Außerordentlich. :pro:


Und da hier schon die Rede von einer Anwendung ist würde ich gerne etwas vorschlagen, was ich in der Darstellung der Suchergebnisse sehr hilfreich fände. Wenn man ein Wort nachschlägt zeigt die Webseite alle Sindarinworte an, die unter anderem auch die gefragte Bedeutung haben. Für jedes einzelne Ergebnis bedeutet das, daß man nur einen Ausschnitt des Bedeutungsumfangs sieht - was mitunter irreführend ist. Und wenn mehrere Möglichkeiten angeboten werden, kann man nur raten welches der Worte gerade angebracht wäre zu verwenden. Um eine gute Entscheidung treffen zu können muß ich deshalb oft noch eine Suche für jedes gefundene Sindarinwort anschließen, um alle Übersetzungsmöglichkeiten zu erfahren - was unnötig umständlich ist.

Ideal fände ich es daher, wenn eine Suche nicht nur die möglichen Worte ergäbe, sondern für jedes auch die möglichst klare Bedeutung darstellen würde. Deshalb wäre mein Vorschlag:
- In der Spalte "Deutsch" alle Übersetzungen aufzuführen (den eingetippten Suchbegriff hervorheben)
- Eine Spalte "original gloss" ausgeben.
Ailinel
Posts: 1715
Joined: Fri Mar 16 2007 11:53

Post by Ailinel »

Eryniel Elmíris wrote:So, nachdem die Liste nun bei Lúthien ist, wollte ich einen Vorschlag von Roman [*bzgl. der Aufnahme der past tenses] nochmals aufgreifen und in die Runde fragen, wie die Meinungen dazu sind
Ich habe deshalb nicht sofort geantwortet, weil ich diesbezüglich etwas im Zweifel war/bin. Es käme damit m.E. ein massives hypothetisches Element zu dem ansonsten fast gänzlich auf attestiertem Material beruhenden (mit exakten und hohen Ansprüchen genügenden Quellenangaben ausgestatteten) Vokabular hinzu, von Regularisierungen, die ja erklärt werden und leicht nachvollziehbar sind, einmal abgesehen. Rekonstruierte Vergangenheitsformen scheinen mir teilweise einer grundsätzlich anderen Kategorie des Spekulativen, Hypothetischen anzugehören und sollten möglicherweise eher in einer Zusammenfassung der Grammatik, aus der Sicht eines konkreten, identifizierbaren Autors, dargestellt werden.
Ich sehe und respektiere aber andererseits, dass manche die Aufnahme solcher Formen hier nützlich finden, und möchte mich daher der Stimme enthalten.
User avatar
Roman
Admin
Posts: 2049
Joined: Tue Mar 13 2007 13:27
Contact:

Post by Roman »

Ideal fände ich es daher, wenn eine Suche nicht nur die möglichen Worte ergäbe, sondern für jedes auch die möglichst klare Bedeutung darstellen würde. Deshalb wäre mein Vorschlag:
- In der Spalte "Deutsch" alle Übersetzungen aufzuführen (den eingetippten Suchbegriff hervorheben)
Also einfach entsprechende Zeilen aus der Sindarin-Deutsch-Wortliste ausgeben (wie jetzt in html), mit dem hervorgehobenen Suchbegriff? Das klingt eigentlich ganz vernünftig.
Ich muss die Suche sowieso an Lúthiens neues Datenformat anpassen und werde es mal probieren.
- Eine Spalte "original gloss" ausgeben.
Das war bislang nicht möglich, aber mit Lúthiens Daten wird es hoffentlich eine triviale Hinzufügung sein.
Ich habe deshalb nicht sofort geantwortet, weil ich diesbezüglich etwas im Zweifel war/bin. Es käme damit m.E. ein massives hypothetisches Element zu dem ansonsten fast gänzlich auf attestiertem Material beruhenden (mit exakten und hohen Ansprüchen genügenden Quellenangaben ausgestatteten) Vokabular hinzu, von Regularisierungen, die ja erklärt werden und leicht nachvollziehbar sind, einmal abgesehen. Rekonstruierte Vergangenheitsformen scheinen mir teilweise einer grundsätzlich anderen Kategorie des Spekulativen, Hypothetischen anzugehören und sollten möglicherweise eher in einer Zusammenfassung der Grammatik, aus der Sicht eines konkreten, identifizierbaren Autors, dargestellt werden.
Ich sehe und respektiere aber andererseits, dass manche die Aufnahme solcher Formen hier nützlich finden, und möchte mich daher der Stimme enthalten.
Mir gefällt es eigentlich auch nicht, zu viele Spekulationen in die Wortlisten aufzunehmen, da man sich damit auch nur Arbeit macht, wenn mit einer neuen Publikation alles wieder geändert werden muss. Ich habe z.B. sehr viele rekonstruierte Plural-Formen aus den Listen gelöscht, weil die Pluralbildung nach vorgegebenen Regeln aus der Wortstruktur ableitbar ist, die jeder anwenden kann, der die Grammatik liest. Die Lautänderungen sind hier diachronisch, der Satz von Regeln aber synchronisch. Eigentlich ist es mittlerweile auch überflüssig, rekonstruierte Plurale für den magol/cabor-Typ zu führen, da hier die Pluralbildung nunmehr anhand der Alternativformen magl/cabr (oder deren Abwesenheit) ableitbar ist.
Bei Verbvergangenheiten ist die Sache aber weniger trivial, weil hier individuelle Lautveränderungen zum Tragen kommen, die schwer synchronisch zu erklären sind. Ich glaube aber nicht, dass die Vergangenheiten hier eine andere Klasse des Hypothetischen bilden. Den zum jetzigen Zeitpunkt attestierten Beispielen nach zu urteilen, scheint die Art der Bildung doch recht vorhersagbar zu sein (im Gegensatz zu Quenya), es sind eben nur die diachronischen Änderungen, die das ganze bis zur Unkenntlichkeit verstümmeln.

Da das Projekt jetzt nun allem Anschein nach Hiswelóke ablösen wird, brauchen wir unbedingt noch etwas: Das Anführen der nicht-regularisierten Formen. Ich denke aber, das sollte sich nicht als sehr schwierig gestalten - man braucht bloß eine Spalte anzufügen und alle mit X/Reg. markierten Wörter durchzugehen (es sind 339). Dann kommen da aber auch noch die Noldorin-Vergangenheitsformen dazu.
User avatar
Eryniel Elmíris
Posts: 1533
Joined: Tue Jun 24 2008 19:51
Location: Ribobel / Rímdor

Post by Eryniel Elmíris »

Keine Panik, das Gute hieran ist ja, dass es in Java passieren wird, was plattformunabhängig ist (es läuft auf Windows, Linux und Mac). Des weiteren ist es ja ein "Projekt in Arbeit" und es sollte kein Problem sein, weitere Dinge hinzuzufügen. Es muss also nicht alles auf einmal hinein.
Ich habe Lúthien auf diese neuen Aspekte aufmerksam gemacht. Sie arbeitet zur Zeit an der Ausgabe (Display), da es einige neue Dinge in Java gibt, die sie gerne nutzen möchte und sie außerdem in Ihrer Arbeit gerade ziemlich eingebunden ist.
Ich finde es sehr gut, dass darüber geredet und gemeinsam entschieden wird. Ich denke, so kommt das Bestmögliche dabei heraus.
User avatar
Lúthien Meliel
Posts: 79
Joined: Thu Jun 26 2008 21:58

Post by Lúthien Meliel »

Update:

last week I got the updated wordlist from Eryniel and I've started to consolidate everything into the db schema. That's a bit of a puzzle job but it is going pretty well. I'll post the sqlite db file somewhere if that's done, so anyone interested can have a look at it.

I'm not sure I completely understand the issues that you speak of above - my German is quite ok, but in technical discussions it still lacks a bit :)
But if I get the gist of it right: the fact that the application is built in Java is irrelevant for the contents of the dictionary. It's merely handy in order to have it available for any platform.

What I tried to do is to model the database in such a way that adding data (e.g. adding other modern languages or another elvish one), or adding new categories of metadata (e.g. adding past tenses) will not require a change in the database structure, but only a change in the contents of it so that the application itself does not have to be altered in order to accomodate that.
User avatar
Eryniel Elmíris
Posts: 1533
Joined: Tue Jun 24 2008 19:51
Location: Ribobel / Rímdor

Post by Eryniel Elmíris »

Let me try to summarize what we are talking about in German:

- the question if there should be a past tense included in the sindarin verbs is still under discussion. On one hand it would be very handy since the reconstruction of unknown past tense words is not really transparent, on the other hand exactly those reconstructions would leave the attested path, going onto speculations.
- the other suggestion was to display not only the sindarin word if you search for a translation in german, but also all possible translation alternatives. For example: you enter Ruhm" as search word and would get something like: aglar - Glanz, Ruhm (sources)...
- then there was the suggestion to always show the original gloss (which as I understand wouldn't be necessary if your search language is english.
- And last but not least Roman wished to include the non-regularized forms where applicable, but if we would do that, then the Noldorin past-tense should also be included.
Post Reply