Davar4: MDK - Příprava modulů slovníků (DIC) Homepage Help index Previous Next

 
 

Příprava modulů slovníků (DIC)


Moduly slovníků jsou moduly, které obsahují překlady typu slovo - slovo. Ve většině případů obsahují krátké fráze nebo jen jedno slovo. Hlavní idea modulu slovníku je to, že kliknutím na text v některém jiném okně synchronizuje slovník, pokud je to možné. V modulu slovníku je ještě třetí sloupec, typ slova, kde může být vložen jeden znak, který popisuje dané slovo. Například R pro "root"(kořen slova) apod.

Moduly slovníků jsou databázové soubory SQLite3. Můžete otevřít .dic soubor v některém z databázových prohlížečů nebo manažerů a editovat, přidávat nebo mazat záznamy.

 

Program konvertoru d4dic.exe potřebuje opět dva soubory: data.txt ainfo.txt.

Soubor info.txt obsahuje důležité definice slovníku, jména slovníku pro oba směry a definice jazyků.

Většina položek v info.txt byla již vysvětlena v části příprava knih, prostudujte ji.

Soubor data.txt obsahuje jednu definici slovníku na jeden řádek, pro překlad Z->DO :

slovo (v jazyku Z) TAB slovo (v jazyku DO) TAB volitelný znak(nebo nic) NOVÝ ŘÁDEK (=CR+LF).

 

 


Example3 - HE-EN dictionary as DIC (příklad použití d4dic.exe)

Toto je příklad, který najdete v adresáři MDK. Po úspěšné kompilaci modulu můžete přesunout připravený soubor dic do adresáře data, nastartovat Davar4 a otevřít tento modul.

Nyní projdeme soubory info.txt a data.txt a okomentujeme nejdůležitější části.

Příklad Hebrejsko - Anglického slovníku (He-En): hlavní směr je He->En, opačný směr (En->He) může být přepnut tlačítkem v horní části okna. Psaní v editačním poli provádí okamžitou synchronizaci nejbližšího slova. Pokud stisknete klávesu Enter, aktivuje se filtr který zobrazí všechna slova, která obsahují text z editačního pole. Můžete využít i zástupné znaky * a ?.

 

soubor info.txt

 

Příklad souboru info.txt, použitého v Example3 - HE-EN dictionary as DIC (modře, tučně) , další řádek (červeně) je komentář a vysvětlení (není částí souboru!). Všechny červené komentáře rovněž začínají znakem ; takže celý tento blok můžete zkopírovat do editoru a použít jako šablonu pro váš modul.

;THIS FILE MUST BE UTF-8, Little Endian, without Byte Order Mark. New line is CR+LF pair

D4_Version_Major=1
D4_Version_Minor=0

D4_OutputFile=he_en.dic
D4_Abbreviation=He-En
D4_Title=Hebrew-English dictionary
D4_Info=Words in this file was used with kind permission of Ben Stitz, author of RosettaStone software.
D4_Copyright=Max Oerder
D4_URL=http://janeway.tilda.com.au/ben_s/RosettaStone.html

 

;if type description of word is not used, you can set to 1.
;in this case, USE: Type PrimaryLanguage 0x09 and Type SubLanguage 0x00
;this is NOT implemented yet...use value 0!
D4_Type_Unused=0

;toto musí být nastaveno na 0

 

;specification of main language and sublanguage. We use standard Windows
;values expressed by hexadecimal number. This affects sorting of keys in
;module. For English use 0x09 and 0x00, for Hebrew: 0x0d and 0x00 and
;for Greek 0x08 and 0x00. List of all possible values can be found in
;README.TXT for d4dic program and also in MSDN for MAKELANGID macro (also available freely online on Microsoft web)

D4_From_PrimaryLanguage=0x0d
D4_From_SubLanguage=0x00
D4_To_PrimaryLanguage=0x09
D4_To_SubLanguage=0x00
D4_Type_PrimaryLanguage=0x09
D4_Type_SubLanguage=0x00

;zde se nastavují primární jazyky a sublanguage pro slova Z (FROM) a DO (TO) a TYPE (=3. sloupec)

;hodnoty jsou stejné jako v ostatních modulech

;v příkladu je jazyk z Hebrejština (0x0d a 0x00), jazyk do je Angličtina (0x09 a 0x00) a jazyk type (3. sloupec) je rovněž Angličtina (0x09 a 0x00)

 

D4_Label_From_To=Hebrew-English dictionary
D4_Label_To_From=English-Hebrew dictionary

;zde se nastavují popisky pro hlavní směr slovníku (z->do) a pro opačný směr (do->z)


 

 

 

 

 

soubor data.txt

 

V případě slovníku má soubor data.txt velmi jednoduchou strukturu:

 

slovo (v jazyku Z) TAB slovo (v jazyku DO) TAB volitelný znak(nebo nic) NOVÝ ŘÁDEK (=CR+LF).

 

Pamatujte, že jeden překlad je vždy na jednom řádku, slova nebo fráze jsou separovány pomocí znaku tabelátoru (0x09).

Níže je počáteční blok slov v souboru data.txt pro He-En slovník z uvedeného příkladu:

אָב Father
אָב father
אַבָּא daddy, father
אָב, אַבָּא father
אבד perish
אבד destroy
אבד exterminate
אָבַד perish
אִבֵּד destroy