@@ -41,8 +41,8 @@ car pour ce genre de choses, dans la vraie vie, on pourrait aussi utiliser une d
4141
4242## parsing
4343
44- on veut pouvoir lire des fichiers texte qui ressemblent à celui-ci (` data-small.txt ` )
45- ``` {literalinclude} data-small.txt
44+ on veut pouvoir lire des fichiers texte qui ressemblent à celui-ci (` data/sample -small.txt ` )
45+ ``` {literalinclude} data/sample -small.txt
4646```
4747
4848on suppose dans tout ce TP qu'il y a ** unicité du (nom x prénom)**
@@ -80,7 +80,7 @@ def parse_text(filename):
8080 persons.append(person)
8181 return persons
8282
83- parse_text("data-small.txt")
83+ parse_text("data/sample -small.txt")
8484```
8585
8686``` {code-cell} ipython3
@@ -98,7 +98,7 @@ def parse_text(filename):
9898 with open(filename) as f:
9999 return [line_to_person(line) for line in f]
100100
101- parse_text("data-small.txt")
101+ parse_text("data/sample -small.txt")
102102```
103103
104104``` {code-cell} ipython3
@@ -113,17 +113,17 @@ parse_text("data-small.txt")
113113
114114à partir des deux fichiers joints:
115115
116- * ` last_names .txt`
116+ * ` data/last-names .txt`
117117 (dérivé de < https://fr.wikipedia.org/wiki/Liste_des_noms_de_famille_les_plus_courants_en_France > )
118- * ` first_names .txt`
118+ * ` data/first-names .txt`
119119 (dérivé de < https://fr.wikipedia.org/wiki/Liste_des_pr%C3%A9noms_les_plus_donn%C3%A9s_en_France > )
120120
121121ce qu'il faut faire:
122122
123123* fabriquez un jeu de données aléatoires contenant 10000 personnes
124124 avec la contrainte qu'il y ait en sortie ** unicité du nom x prénom**
125125* pour les dates de naissance tirez au sort une date entre le 01/01/2000 et le 31/12/2004
126- * rangez cela dans le fichier ` data-big.txt `
126+ * rangez cela dans le fichier ` data/sample -big.txt `
127127* vous devez produire ce fichier dans un temps de l'ordre de 50-100ms
128128
129129``` {code-cell} ipython3
@@ -148,7 +148,7 @@ def random_date(start, end):
148148BEG = Date(year=2000, month=1, day=1)
149149END = Date(year=2004, month=12, day=31)
150150
151- with open("last_names .txt") as last, open("first_names .txt") as first:
151+ with open("data/last-names .txt") as last, open("data/first-names .txt") as first:
152152 LAST_NAMES = [x for line in last for x in line.strip().split()]
153153 FIRST_NAMES = [x for line in first for x in line.strip().split()]
154154
@@ -173,7 +173,7 @@ def generate_data(filename, how_many):
173173
174174``` {code-cell} ipython3
175175%%timeit
176- generate_data("data-big.txt", 10_000)
176+ generate_data("data/sample -big.txt", 10_000)
177177```
178178
179179``` {code-cell} ipython3
@@ -193,7 +193,7 @@ generate_data("data-big.txt", 10_000)
193193```
194194
195195``` {code-cell} ipython3
196- L = parse_text("data-big.txt")
196+ L = parse_text("data/sample -big.txt")
197197```
198198
199199``` {code-cell} ipython3
0 commit comments