Nápověda pro hledání ve staročeské a středněčeské textové bance
- V poli Zadání dotazu napište hledaný výraz v rovných uvozovkách a klikněte na tlačítko
Hledej nebo zmáčkněte klávesu Enter.
Hledaným výrazem může být:
- konkrétní slovo, např. "tohoto";
- tzv. regulární výraz, který obsahuje tzv. zástupné znaky, umožňující prohledávat v širším rozsahu;
- porovnání hodnoty některého z dostupných atributů, např. komentář == "\[torzovité slovo\]";
- kombinace výše uvedených možností (viz též podrobnější vyhledávání).
- Význam zástupných znaků v regulárních výrazech při prohledávání staročeské a a středněčeské textové banky
- . (tečka) zastupuje jeden libovolný znak. Zadáte-li např. "to.", vyhledají se tedy podoby tom, toť atd., zadáte-li "to.." vyhledají se podoby tobě, tomu, toto atd.
- .* (tečka a hvězdička) zastupují žádný nebo jakýkoliv počet libovolných znaků. Zadáte-li např. "dě.*", vyhledají se všechny výrazy začínající na dě-. Zadáte-li "dě.*ti", vyhledají se všechny výrazy začínající na dě a končící na ti, tj. včetně slova děti. Zadáte-li ".*ati", vyhledají se všechna slova končící na -ati.
- [] (hranaté závorky) obsahují seznam znaků, které se na dané pozici mohou vyskytovat, např. "m[áé]" najde výrazy má i mé.
- Jednotlivé zástupné znaky lze samozřejmě kombinovat: výraz "k[ao].." najde všechna čtyřpísmenná slova počínající na k, která mají na druhé pozici samohlásku a nebo o.
- V poli Výsledky jsou zobrazeny konkordanční řádky vyhovující danému dotazu. Na jedné stránce se zobrazuje maximálně 30 řádků, na další/předchozí stranu se dostanete kliknutím na ikonu šipky ( a ) v poli Listování. Kliknutím na ikonu šipky se zarážkou (/) přejdete na první/poslední (tj. z chronologického pohledu nejstarší/nejmladší) nalezené výsledky. Pole Listování také obsahuje informaci o rozsahu právě zobrazovaných řádků a o celkovém počtu nalezených řádků.
- Kliknutím na nalezené slovo nebo sousloví, tedy zeleně podbarvenou část konkordančního řádku, se v poli Informace o struktuře textu zobrazí informace o textu, z něhož slovo pochází. Opětovným kliknutím se vám zobrazí jinak strukturovaná verze této informace. Vybraný konkordanční řádek je zvýrazněn vodorovnými zelenými čarami.
- V poli Volby vyhledávání můžete zaškrtnout, zda chcete, aby se při vyhledávaní rozlišovala malá a velká písmena zadaná v hledaném výrazu.
- V poli Volby vyhledávání můžete nastavit rozsah kontextu vyhledaného výrazu (10, 20, 50 či 100 pozic).
- V poli Volby zobrazení je možné zapnout či vypnout zobrazení jednotlivých atributů a strukturních informací. Zaškrtnete-li komentář,
zobrazí se vám ve výsledcích jinak skryté komentářové informace o podobě textu, jako například paleografická podoba emendovaných slov nebo poznámky o editaci textu. Zaškrtnete-li jazyk, zobrazí se vám označení jinojazyčných slov (a to ve formě „[cizí jazyk]“).
- V rámci atributů (jejichž názvy jsou uvedeny v Možnostech zobrazení) lze vyhledávat pomocí konstrukce atribut == textový řetězec, kdy atribut znamená daný příznak a textový řetězec hledaný výraz nebo regulární výraz. Podoba atribut != textový řetězec vyhledá takové výskyty, kdy atribut zadaný výraz nebo regulární výraz neobsahuje.
- Zadáte-li komentář == "a.*", vyhledají se všechny komentářové výrazy začínající na a-. Zadáte-li jazyk == "\[cizí jazyk\]", vyhledají se vám všechny výrazy označené jako jinojazyčné.
- Informace dodané do textu editorem uvádíme v hranatých závorkách; jedná se o tyto výrazy: [doplněno], [torzovité slovo] (v rámci atributu komentář) a [cizí jazyk] (v rámci atributu jazyk). Při jejich vyhledávání je musíte uvést v této podobě: komentář == "\[doplněno\]", komentář == "\[torzovité slovo\]",
jazyk == "\[cizí jazyk\]". Dotaz komentář == "\[.*\]" nalezne všechna doplněná a torzovitá slova. Dotaz komentář != "" najde veškeré výrazy, které u sebe mají komentář libovolného typu.
- Při kombinaci podmínek v rámci jednoho hledaného výrazu oddělte jednotlivé atributy pomocí logické spojky and, přičemž celý řetězec musí být umístěn v hranatých závorkách. Dotaz [slovo == "It.*" and jazyk != ""] vyhledá všechna slova, která začínají na It- a jsou označena jako jinojazyčná.
- Konstrukce [dotaz1][dotaz2][dotaz3] atd. umožňuje řetězit dotazy na bezprostředně sousedící položky. Tak například konstrukce [slovo == "pán"][slovo == "náš"] vyhledá všechny výskyty, kdy se vedle sebe objevují tato dvě slova (v tomto pořadí).
- Obsah pole Výsledky si můžete uložit do textového souboru (v prostém textovém formátu .TXT s kódováním UTF-8) kliknutím na ikonu diskety (). Všechny nalezené výsledky (maximálně však do počtu 2500) uložíte kliknutím na ikonu řady disket (). Potřebujete-li uložit více než 2500 konkordančních řádků, zkuste svůj dotaz nějak omezit, např. stoletím vzniku pramene (viz podrobnější vyhledávání).
- Každý konkordanční řádek z pole Výsledky v uloženém souboru zabere tři odstavce:
- strukturní informace vztahující se k nalezenému slovu, tzn. obsah pole
Infomace o struktuře textu po kliknutí na nalezené slovo v daném řádku.
- samotný konkordanční řádek – nalezené sousloví je uzavřeno mezi „trojšipky“ <<< a >>>.
- prázdný odstavec (tj. řádek) oddělující konkordanční řádky (pro lepší čitelnost textu).
Zvláštnosti zpracování Klaretových slovníků
Na rozdíl od jiných textů začleněných do staročeské textové a středněčeské banky obsahují Klaretovy slovníky v hlavním textu rovněž různočtení z odborné literatury, které je uvedeno grafickou značkou ≈. Při volbě možnosti „Komentář“ se pak kromě obvyklých údajů zveřejní transliterovaná podoba staročeských výrazů a zdroj, z něhož bylo převzato různočtení.
Podrobnější vyhledávání
Nová verze korpusového manažeru (z července 2009) umožňuje omezit vyhledávání na jednotlivý text nebo subkorpus textů, například od jednoho autora nebo v rámci téhož literárního žánru. Rovněž je možné kombinovat různé podmínky pomocí logických operátorů and, or a závorek.
- Do dotazu je možné zahrnout strukturní značky (např. odstavec, vers) a atributy strukturních značek, zejména ty, které popisují jednotlivé dokumenty (např. autor, zkratkaPamatky, literarniDruh).
- Příklady dotazů:
- "žiezn.*" and autor == "Hus, Jan" – vyhledá všechna slova začínající na žiezn- v památkách, jejichž autorem je Jan Hus
- "žiezn.*" and literarniZanr == "lékařství" – vyhledá všechna slova začínající na žiezn- v památkách věnovaných středověkému lékařství
- "žiezn.*" and literarniDruh == "verš" – vyhledá všechna slova začínající na žiezn- ve veršovaných památkách
- "žiezn.*" and titul == "\[Neuberský sborník\]" – vyhledá všechna slova začínající na žiezn- v tzv. Neuberském sborníku
- "žiezn.*" and name == "vers" – vyhledá všechna slova začínající na žiezn- použitá ve verších
- Seznam atributů:
- autor – autor památky (je-li znám), např. Jan Čapek; Bechyňka, Jan
- titul – titul památky, např. [O ženě zlobivé], Knížky o večeři Páně
- zkratkaPamatky – zkratka památky, používaná pro jednodušší identifikaci památky (místo celého jejího jména); zkratky většinou vycházejí z praxe Staročeského slovníku, např. Dal
- zkratkaPramene – zkratka identifikující konkrétní pramen památky, zkratky většinou vycházejí z praxe Staročeského slovníku, např. DalV, DalL
- literarniZanr – (pro potřeby vyhledávání) tematická, formální atp. specifikace literárních památek, např. slovník, biblický text, cestopis, právo, lékařství, kronika atp.
- literarniDruh – pro potřeby vyhledávání rozlišujeme následující druhy: próza, verš, drama
- datacePramene – slovně vyjádřená datace pramene, např. přelom 14. a 15. století, okolo roku 1445
- dataceStoleti – století vzniku pramene vyjádřené číslicí (pro jednodušší omezení prohledávání), např. 13, 14, 15
- predlohaTyp – typ předlohy, např. edice, prvotisk, rukopis, starý tisk
- predlohaStat – označení státu, na jehož území se pramen nachází, např. Česko, Rakousko, Francie
- predlohaMesto – sídlo instituce, kde je uložen pramen, např. Třeboň, Krakov, Vídeň
- predlohaInstituce – název instituce, kde je uložen pramen, např. Kapitulní archiv, Státní oblastní archiv
- predlohaSignatura – signatura pramene, např. VII G 17 d; Fonds slave 29; G 10, č. 461
- predlohaEdiceTitul – informace o edici pramene, která se stala základem pro elektronickou edici
- predlohaEdiceEditor – informace o edici pramene, která se stala základem pro elektronickou edici
- predlohaEdiceMistoVydani – informace o edici pramene, která se stala základem pro elektronickou edici
- predlohaEdiceRokVydani – informace o edici pramene, která se stala základem pro elektronickou edici
- Seznam použitelných atributů (i s konkrétními hodnotami) se mj. zobrazuje v poli Informace o struktuře textu po dvojím kliknutí na nalezené slovo nebo sousloví, tedy zeleně podbarvenou část konkordančního řádku. Dále tyto informace naleznete na stránce zdrojů staročeské a středněčeské textové banky.
- Použití logického operátoru or (nebo) ve spojení se závorkami umožňuje rozšiřovat rozsah zadaného dotazu. Například:
- "p[óů]l" or "puol" – vyhledá všechny hláskoslovné varianty staročeského výrazu pól
- "pán" and (autor == "Hus, Jan" or autor == "Bechyňka, Jan") – vyhledá všechny výskyty výrazu pán v dílech Jana Husa a Jana Bechyňky
- "dieti" and name == "vers" – vyhledá všechny výskyty výrazu dieti použité ve verších
- "počíná" and name == "nadpis" – vyhledá všechny výskyty výrazu počíná použité v nadpisech (pro prohledávání v rámci strukturních značek je potřeba použít atribut name a jako jeho hodnotu uvést název značky)