Skip to content

Commit 3c9650c

Browse files
committed
Přesun kapitoly Regulární výrazy sem
1 parent 8c7aedc commit 3c9650c

18 files changed

+655
-0
lines changed

ziskavani-dat/entry.yml

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -2,3 +2,4 @@ title: Získávání dat
22
lead: Kde a jak získat zajímavá data k analýze
33
lessons:
44
- webscraping
5+
- regularni-vyrazy
Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,4 @@
1+
title: Regulární výrazy
2+
lead: Ovládneme regulární výrazy, které nám umožní dělat kouzla při dolování dat z textů.
3+
sections:
4+
- regularni-vyrazy
Lines changed: 13 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,13 @@
1+
---
2+
title: Adresy stránek
3+
demand: 3
4+
---
5+
6+
Adresy webových stránek zpravidla začínají záhadným shlukem písmen http:// nebo https://. Například náš web najdete pod adresou [https://kodim.cz](https://kodim.cz). Zkrátka HTTP nebo HTTPS je ve skutečnosti označení protokolu, což je nějaký popis toho, jak by měla vypadat komunikace mezi dvěma zařízeními. Standardního tvaru můžeme využít, abychom z textu vytáhli všechny adresy. Napiš program, který z proměnné `emailSRadami` vytáhne všechny webové stránky, které jsou tam zmíněny.
7+
8+
```py
9+
emailSRadami = """
10+
Ahoj,
11+
posílám ti pár tipů, kam se podívat. https://realpython.com nabízí spoustu článků i kurzů. http://docs.python.org nabízí tutoriál i rozsáhlou dokumentaci. http://www.learnpython.org nabízí hezky strukturovaný kurz pro začátečníky, rozebírá ale i nějaká pokročilejší témata. https://www.pluralsight.com je placený web, který ale kvalitou kurzů víceméně nemá konkurenci. Určitě ale sleduj i web https://www.czechitas.cz a přihlašuj se na naše kurzy!
12+
"""
13+
```
Lines changed: 18 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,18 @@
1+
---
2+
title: Ave, Caesar!
3+
demand: 3
4+
---
5+
6+
Římské číslice se dodnes používají například pro označení století, pořadí panovníků, papežů atd. Zkus sestavit regulární výraz, který zachytí římské číslice v následujících řetězcích. Nemusíš vytvářet obecný regulární výraz pro římské číslice, ale pouze výraz, který bude fungovat na dané řetězce.
7+
8+
```
9+
IX. století
10+
Matematika pro VII. třídu
11+
Star Trek III
12+
Karel IV.
13+
papež Benedict V.
14+
Bělá je X. část statutárního města Děčín.
15+
III. patro
16+
II. stupeň povodňové aktivity
17+
Konstantin XI. Dragases
18+
```
Lines changed: 6 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,6 @@
1+
---
2+
title: Předčíslí u čísla účtu
3+
demand: 1
4+
---
5+
6+
Přidej k regulárnímu výrazu na číslo účtu možnost předčíslí, tj. na začátku může být 0 až 6 čísel a za nimi může (ale nemusí) být pomlčka.
Lines changed: 9 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,9 @@
1+
---
2+
title: Číslo účtu podruhé
3+
demand: 1
4+
---
5+
6+
Nejmenovaná česká banka rozlišuje typy účtů podle číslic na začátku čísla. Například je-li první číslice 1, jedná se o investiční účet, je-li první číslice 2, jde o bankovní účet. Uvažujme, že naše tajemná banka má kód (poslední čtyři čísla) 2100.
7+
8+
* Uprav regulární výraz (nemusíš řešit předčíslí) tak, aby na prvním místě mohla být pouze 1 nebo 2.
9+
* Uvažuj, že na druhém místě mohou být jen číslice 0, 1 nebo 2.
Lines changed: 6 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,6 @@
1+
---
2+
title: E-mail s tečkou
3+
demand: 2
4+
---
5+
6+
Uprav program na ověření e-mailu tak, aby akceptoval i e-maily, které mají v první části tečku, např. [email protected].
Lines changed: 8 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,8 @@
1+
---
2+
title: IP adresy
3+
demand: 3
4+
---
5+
6+
Počítačové sítě jsou ve skutečnosti postavené na číselných adresách, které jsou označeny jako IP adresy. Každá IP adresy je čtveřice čísel v rozsahu 0 až 255, které jsou odděleny tečkou. Například IP adresy webu Czechitas v internetu je 51.68.166.161. My ale pro zjednodušení budeme kontrolovat pouze to, zda je číslo v rozsahu 0 až 299.
7+
8+
Uvažuj, že vytváříš aplikaci, která pošle testovací zprávu (tzv. ping) počítači s nějaou IP adresou. Napiš program, která požádá uživatele o IP adresu a zkontroluj, zda je adresa platná. Např. adresa 325.125.100.128 není platná (první číslo je větší než 255), adresa 152.145.146 také není platá (jde o trojici čísel, nikoli čtveřici), adresa 192.168.1.0 je platná (čtveřice čísel v daném rozsahu).
Lines changed: 11 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,11 @@
1+
---
2+
title: Ministerstva
3+
demand: 3
4+
---
5+
6+
Napiš regulární výraz, který z následujícího řádku vybere celé názvy ministerstev.
7+
8+
```
9+
Ministerstvo pro místní rozvoj, Celní správa České republiky, Ministerstvo životního prostředí, Ministerstvo práce a sociálních věcí, Český statistický úřad, Nejvyšší kontrolní úřad
10+
```
11+
Lines changed: 11 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,11 @@
1+
---
2+
title: Nápravy
3+
demand: 2
4+
---
5+
6+
Uvažuj vyhlášku, která definuje maximální hmotnosti vozidel u trojnápravy nákladních vozidel a jejíž zjednodušený text je níže. Napiš 2 regulární výraz. Prvním zjistíš limit (nebo limity) vzdáleností náprav v metrech a druhým maximální povolenou hmotnost v tunách.
7+
8+
Maximální hmotnosti trojnápravy při dílčím rozvoru náprav jsou:
9+
1. do 1,3 m včetně - 21,00 t,
10+
2. nad 1,3 m do 1,4 m včetně - 24,00 t,
11+
3. nad 1,4 m do 1,8 m včetně - 27,00 t,

0 commit comments

Comments
 (0)