Index

Hledat

Prázdné položky se ignorují (kromě typu výčet (enum), kde k ignorování slouží hodnota *). Tlačítko Vymazat vymaže všechna políčka; anotátoři mohou při hledání využívat také rozlišení podle šuplíků.

Vyhledávání bez speciálních znaků

Nejjednodušší (a nejrychlejší) je vyhledávání pomocí celých slov. Dojde ke zobrazení všech záznamů, ve kterých dané slovo bylo nalezeno (i když anotace obsahuje slov více).

V nastavení sloupců kartotéky je možné vybrat, zda se bude při porovnávání ignorovat případně rozdíly ve velikosti písmen (a se nerozlišuje od A) a diakritiky (a se nerozlišuje od á).

Maskovací znaky (wildcards)

Malinko složitější je vyhledávání při použití maskovacích znaků (wildcards):

?nahrazuje libovolný znak
*nahrazuje nula a více výskytů libovolného znaku

Například:

p?tokvyhovuje potok i patok
p*toknajde navíc průtok

Pokud použijete maskovací znak na konci slova, budou se textová pole prohledávat podobně, jako bez použití maskovacích znaků: tedy porovnávají se všechna slova v každém záznamu. Pokud však použijete maskovací znak uvnitř, či na začátku slova, porovnává se celý záznam, tedy ne jeho jednotlivá slova, ale celý obsah řádku.

Tip: Nejrychlejší jsou dotazy bez maskovacích znaků, případně s maskovacími znaky na konci výrazu. Pokud zadáte maskovací znak na začátku či uvnitř výrazu, vyhledávání může být výrazně pomalejší (důvod je ten, že v tomto případě není možné použít index pro urychlení vyhledávání).

Regulární výrazy

Pokud ve formuláři zatrhnete políčko Regulární výraz, budou se záznamy porovnávat s tzv. regulárním výrazem, které vám dávají poměrně velkou sílu v určení hledaných záznamů. Také v tomto případě se porovnává celý záznam, nikoliv jednotlivá slova.

Regulární výraz je řetězec, který popisuje množinu vyhovujících slov. Základní syntaxe:

Libovolný znak
tečka .
Seskupení
řetězec uzavřený v závorkách, např. (ko)
Alternativa
k oddělení se používá znak |, např. (ko|mo)st najde všechny záznamy, které obsahují řetězec kost či most.
Výčet znaků
uvádí se v hranatých závorkách, jsou povolené i rozsahy, např. [a-z0-9] znamená malé písmeno nebo číslice
Negativní výčet znaků
znaky, které se na daném místě nesmí vyskytovat, např. [^abc], znamená libovolný znak, kromě a, b, c
Začátek a konec řetězce
^ a $, např. ^[km]ost$ najde pouze slova kost a most, ale [km]ost najde i známost, či kostel.
Nepovinná část
zakončená otazníkem ?, lze použít i pro seskupení a výčet, např. výrazu kost? vyhovuje kos i kost
Libovolně krát
hvězdička *, např. kr[ay]*sa vyhovuje krsa, krasa, krysa, kraasa, kryasa, ...
Aspoň jednou
plus +, např. kra+sa vyhovuje krasa i kraasa
Zadaný počet opakování
{3,6} -- předchozí písmeno či skupina se bude opakovat tři- až šestkrát. Např. ko{2,4}ška vyhovuje kokoška, kokokoška a kokokokoška.

Speciální znaky (jako je hvězdička, či tečka) musí při běžném použití mít před sebou zpětné lomítko \, např. tři tečky najdeme pomocí \.\.\.

Podrobnější informace o regulárních výrazech najdete na internetu, např. zde: http://www.root.cz/clanky/regularni-vyrazy-1/, http://interval.cz/clanky/regularni-vyrazy-v-php-1/.