5. Binární vyhledávací strom (BVS)

5 - Binární vyhledávací strom (BVS)

Připomenutí teorie

Přednáška 5 v oddíle Přednášky.


Binární vyhledávací strom

Binární vyhledávací strom (Binary Search Tree - BST) je binární strom, který splňuje v každém uzlu podmínku, že všechny klíče v levém podstromu mají nižší hodnotu než klíč uzlu a v pravém podstromu jsou klíče hodnoty vyšší.

bst
Operace

Vyhledávání (find) probíhá podobně jako v půlení intervalu, akorát místo vybírání prostředního indexu nahlížíme do kořene (pod)stromu.

Vkládání (insert) probíhá podobně, hledáme prvek který chceme přidat, jakmile dojdeme na konec stromu (list / chybějící větev), přidáme prvek na správnou stranu.

Odstraňování (delete) je nejsložitější, protože musíme opravit strukturu stromu. Nalezneme uzel s nejmenším klíčem v pravém podstromu (nebo nejvyšším v levém), smažeme ten uzel, a přesuneme jeho klíč do uzlu který mažeme.


(Min) Halda

Halda (Heap) je binární strom, kde platí pravidlo, že klíče v obou potomcích jsou vyšší (nebo rovni) než v jejich rodiči. Haldu lze zapsat do pole, které reprezentuje úplný strom. Někdy se specifikuje jako min-heap, protože v kořeni je minimum. Alternativně můžeme sestrojit max-heap, kde je v kořeni maximum a potomci jsou vždy menší (nebo rovni).

Vkládání (insert): Pokud přidáváme prvek, vložíme ho na konec pole a “probubláváme” ho nahoru skrze strom, dokud má klíč v rodiči větší hodnotu.

Odstraňování (deleteTop): Pokud odebíráme kořen (jiné prvky neodebíráme), nahradíme ho posledním prvkem z haldy a opravujeme haldu směrem dolů, záměnou za menšího (pro min-heap) z jeho potomků (pokud je menší než klíč v rodiči.

Haldu lze využít například na prioritní frontu (znáte z PRP) a heap sort.

08_heap.svg

Řešené úlohy

Řešená úloha 1:

Čísla z následující posloupnosti postupně vkládejte do prázdného binárního vyhledávacího stromu (BVS), který nevyvažujte. Jak bude vypadat takto vytvořený BVS?

10, 16, 5, 17, 4, 15, 3, 1, 23, 13, 2, 11

Výsledný strom

sol

Z něj pak postupně odstraňte první tři prvky (10, 16, 5). Jak bude vypadat výsledný BVS?

Strom(y) po odstranění

sol

sol

sol


Řešená úloha 2: Jaká je složitost operace insert v obecném BVS s nn uzly a hloubkou dd? Vyjádřete nejprve pomocí dd a převeďte na funkci s neznámou nn.

Odpověď

Platí Θ(d)\Theta\left( d \right) tedy pro obecný BVS je složitost O(n)\mathrm{O}\left( n \right).

Jaká je složitost operace find a delete? .Odpověď

Details

Je stejná.

A co pro vyvážený BVS? .Odpověď

Details

Pro vyvážený BVS je složitost těchto operací O(log(n))\mathrm{O}\left( \log(n) \right).


Řešená úloha 3: Předpokládejme, že binární vyhledávací strom obsahuje přirozená čísla mezi 1 a 1000. Která z následujících sekvencí navštívených uzlů nemůže nastat, pokud hledáne klíč 363?

a) 2, 252, 401, 398, 330, 363
b) 399, 387, 219, 266, 382, 381, 278, 363
c) 3, 923, 220, 911, 244, 898, 258, 362, 363
d) 4, 924, 278, 347, 621, 299, 392, 358, 363
e) 5, 925, 202, 910, 245, 363

Řešení

d) Hodnota 299 nemůže být po 621, protože by byla v levém podstromu uzlu s klíčem 347.


Řešená úloha 4: V jakém pořadí vypíšeme prvky binárního vyhledávácího stromu, pokud ho projdeme inorder?

Řešení

Vzestupné uspořádání.


Řešená úloha 5: Mějme binární vyhledávací strom s nn uzly. Jaká je asymptotická složitost operace, která spočítá klíče, jejichž hodnota je menší, než xx?

Řešení

Lze použít procházení inorder pro nalezení prvního prvku, jehož hodnota je větší, než xx. Jednoduše pak spočítáme počet prohledaných uzlů.

Složitost tohoto přístupu je O(n)\mathrm{O}(n).

Co v případě, že si budeme ukládat pomocnou informaci? Jakou?

Řešení

Efektivnějším by mohlo být pamatovat si velikost každého podstromu (rozmyslete jak náročné je udržovat tuto informaci při vkládání a mazání klíčů).

Pak by nám stačilo vyhledat prvek s hodnotou xx a přičíst velikosti všech levých podstromů vrcholů cesty, které jsme nenavštívili plus počet navštívených uzlů, které měly klíče menší. Asymptotická složitost je stále O(n)O(n), ale v případě vyváženého stromu poklesne na Θ(log2n)\Theta(\log_2 n).


Řešená úloha 6: Která z následujících posloupností představuje (min-)haldu uloženou v poli?

a) 9 5 4 6 3
b) 5 4 2 3 9
c) 3 8 9 5 6
d) 5 1 8 9 1
e) 1 3 6 5 4

Řešení

e)

Další úlohy

Binární vyhledávací strom

Úloha 7: Obdoba úlohy 1, pro jiné posloupnosti. Sestavte operací insert BVS, poté proveďte delete na první 3 (nebo i další) prvky posloupnosti.

  • 14, 24, 5, 13, 1, 3, 22, 10, 19, 11

  • 17, 4, 15, 2, 5, 9, 1, 12, 3, 19, 16, 18


Úloha 8: Mějme klíče 1,2,3,,n1, 2, 3, \ldots, n. Číslo nn je liché. Nejprve vložíme do BVS všechny sudé klíče v rostoucím pořadí a pak všechny liché klíče, také v rostoucím pořadí.

Jaká bude hloubka výsledného stromu?

Jak by se změnil tvar stromu, kdybychom liché klíče vkládali v náhodném pořadí?


Úloha 9: V jakém pořadí máme vkládat 2n12^n − 1 prvků do binárního vyhledávacího stromu tak, aby byl úplný? Formulujte nutnou a postačující podmínku, aby byl výsledný vyhledávací strom úplný.

Odpověď

Existuje právě jeden úplný strom o daných 2n12^n − 1 prvcích. Pokud ho chceme vybudovat, je nutnou a postačující podmínkou, abychom získali stejný strom, že vkládáme vždy uzel dříve než jeho potomky. Takto docílíme toho, že strom budujeme odshora.

Při vkládání je jen jedno možné místo, kam lze nový uzel vložit. Pokud vkládáme další uzel a jeho rodič a všechny uzly na cestě ke kořeni z úplného stromu jsou již vloženy do stromu, pak je uzel vložen na stejné místo jako v úplném stromě. Protože uzel vkládáme vždy před jeho potomky, platí, že získáme úplný strom.


Halda

Úloha 10: Které z následující posloupností představují (min-)haldu o čtyřech prvcích uloženou v poli?

a) 1 3 4 2
b) 1 4 2 3
c) 1 2 4 3
d) 2 3 4 1
e) 1 3 2 4


Úloha 11: Pole nn prvků uspořádané v rostoucím pořadí lze považovat za haldu. Z této operace odstraníme standardní operací deleteTop() její vrchol. Určete za jakých okolností je možné, aby výsledné pole bylo po uvedené operaci opět celé uspořádané.


Úloha 12: V haldě, jejíž vrchol obsahuje minimální prvek haldy, máme najít prvek s maximálním klíčem. Jaká je asymptotická složitost této akce? Umíte vyřešit problém lépe (ne nutně asymptoticky) než v nn operacích.


Úlohy na složitost

Úloha 13: Mějme úplný BVS, který obsahuje 2n12^n-1 prvků. Předpokládejte, že během operace find stráví program v každém navštíveném uzlu právě 1μs1\\ \mu s a že další případné činnosti jsou v této době zahrnuty.

Předpokládejte, že každý klíč v tomto BVS je vyhledáván stejně často a že jiné klíče se v něm nevyhledávají.

Jaká je průměrná doba operace find?

Bonus: Co kdybychom v 50% případů hledali klíč, který se ve stromu nevyskytuje?


Úloha 14: Je dán BVS s nn uzly. Máme za úkol spočítat hodnotu součtu všech klíčů v tomto stromě.

Jaká bude složitost této operace, když to implementujeme efektivně?


Úloha 15: Je dán BVS a dvojice klíčů xx, yy (x < yx~<~y). Máme určit, kolik je v tomto BVS takových klíčů zz, pro které platí x < z < yx~<~z~<~y.

Jaká bude asymptotická složitost této operace za předpokladu, že v uzlech stromu neukládáme žádné další pomocné informace?


Úloha 16: Operace R z BVS opakovaně odstraňuje operací delete vždy ten uzel, který má alespoň jednoho potomka a přitom klíč v odstraňovaném uzlu je největší možný. R končí tesně předtím, než by odstranila kořen BVS.

Jakou bude mít R složitost? Co když by byl BVS vyvážený?


Úloha 17: Je dáno nn (nN,n2n \in \mathbb{N}, n \ge 2) navzájem různých celočíselných klíčů a prázdná halda. Všechny klíče vložíme jeden po druhém v náhodném pořadí do dané haldy.

  1. Jaká je asymptotická složitost tohoto procesu?

  2. Je možné, že pro některé speciální pořadí klíčů bude asymptotická složitost menší nebo větší než v náhodném případě?


Úloha 18: Z binární haldy obsahující n3n^3 prvků, jejíž kořen obsahuje nejmenší hodnotu z celé haldy, odstraníme nn nejmenších prvků. Jaká je asymptotická složitost této akce?


Úloha 19: Do binární haldy obsahující n1.5n^{1.5} prvků, jejíž kořen obsahuje nejmenší hodnotu z celé haldy, přidáme nn prvků. Jaká je asymptotická složitost této akce?


Úloha 20: Danou haldu s nn prvky máme rozdělit na dvě haldy, tak že každá bude mít n/2n/2 prvků. Předpokládejme, že původní halda je uložena v poli délky nn a nové haldy budou uloženy ve dvou připravených polích délky n/2n/2. Navrhněte, jak rozdělit haldu v čase Θ(n)\Theta(n).


Implementační úlohy

Základní implementace BVS v Pythonu je k dispozici pro následující implmenentační pokusy. Nejprve doimplementujte operace insert a delete.

Úloha 21: Napište rekurzivní verze operací: TreeMinimum, která vrátí referenci na uzel s nejmenší hodnotou v BVS.


Úloha 22: Napište funkci, jejímž vstupem bude ukazatel (=reference) na uzel XX v BVS a výstupem ukazatel (=reference) na uzel s nejbližší vyšší hodnotou ve stromu.


Úloha 23: Přidejte do uzlu pomocnou proměnnou count. Navrhněte nerekurzivní proceduru, která do atributu count v každém uzlu zapíše počet vnitřních uzlů v podstromu, jehož kořenem je tento uzel (včetně tohoto uzlu, pokud sám není listem).


Úloha 24: Napište (ne)rekurzivní funkci, která přetvoří strom na “zrcadlový obraz” původního. Tedy výpisem klíčů v pořadí inorder získáme opačně uspořádanou posloupnost.

Odpověď

Funkce v každém uzlu daného BVS zamění levý a pravý podstrom


Úloha 25: Uzel binárního binárního vyhledávacího stromu obsahuje tři složky: Klíč a ukazatele na pravého a levého potomka.

Navrhněte rekurzivní funkci (vracející bool), která porovná, zda má dvojice stromů stejnou strukturu. Dva BVS považujeme za strukturně stejné, pokud se dají nakreslit tak, že po položení na sebe pozorovateli splývají, bez ohledu na to, jaká obsahují data.

Bonus: Upravte předchozí funkci tak, aby zjistila, zda jsou dva BVS shodné, t.j. zda se shodují strukturou i svými daty.


Úloha 26: Navrhněte algoritmus, který spojí dva BVS AA a BB. Spojení proběhne tak, že všechny uzly z BB budou přesunuty do AA, přičemž se nebudou vytvářet žádné nové uzly ani se nebudou žádné uzly mazat. Přesun proběhne jen manipulací s ukazateli. Předpokládejte, že v každém uzlu v AA i v BB je k dispozici ukazatel na rodičovský uzel.


💻 Úloha 27: Zkuste naimplementovat úlohu Tree Insert Permutations. Cílem je spočítat permutace posloupnosti klíčů, které vedou ke stejnému stromu pokud jsou jeden za druhým přidávány do stromu pomocí operace insert.


Je na stránce chyba?

Nahlašte nám ji

Máte otázky nebo připomínky?

Edit Dejte nám vědět