Skip to content

Commit 09cd1e4

Browse files
committed
Fedorov course notes [SENATOROVAI#4] (SENATOROVAI/DA#4)
Closes SENATOROVAI/DA#4
1 parent 240b128 commit 09cd1e4

File tree

2 files changed

+207
-0
lines changed

2 files changed

+207
-0
lines changed
Lines changed: 188 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,188 @@
1+
{
2+
"cells": [
3+
{
4+
"cell_type": "code",
5+
"execution_count": 1,
6+
"id": "030d8d9b",
7+
"metadata": {},
8+
"outputs": [
9+
{
10+
"data": {
11+
"text/plain": [
12+
"'chapter_03_what_people_cannot_find_on_ozon.'"
13+
]
14+
},
15+
"execution_count": 1,
16+
"metadata": {},
17+
"output_type": "execute_result"
18+
}
19+
],
20+
"source": [
21+
"\"\"\"chapter_03_what_people_cannot_find_on_ozon.\"\"\""
22+
]
23+
},
24+
{
25+
"cell_type": "markdown",
26+
"id": "390e3ae3",
27+
"metadata": {},
28+
"source": [
29+
"# Что не находят на Ozon\n",
30+
"\n",
31+
"> [источник](https://opendata.ozon.ru/data/chto-ne-nakhodyat-na-ozon/)\n",
32+
"\n",
33+
"Кроме популярных товаров, Ozon также анализирует поисковые запросы, по которым покупатели не нашли товаров вообще или не заинтересовались предложенными. Мы собрали такие запросы в отдельный файл и разбили на три группы:\n",
34+
"\n",
35+
"- Нет результатов — по поисковому запросу нет товаров\n",
36+
"- Только похожие — подходящих результатов нет, но есть похожие товары\n",
37+
"- Не подошли — результаты таких поисковых запросов не заинтересовали покупателей. В столбце Доля неуспешных запросов указан процент запросов, после которых покупатели не перешли на карточку товара и не добавили ни одного товара в корзину"
38+
]
39+
},
40+
{
41+
"cell_type": "code",
42+
"execution_count": 2,
43+
"id": "4643a78d",
44+
"metadata": {},
45+
"outputs": [],
46+
"source": [
47+
"import pandas as pd"
48+
]
49+
},
50+
{
51+
"cell_type": "code",
52+
"execution_count": 3,
53+
"id": "24cfc6ca",
54+
"metadata": {},
55+
"outputs": [
56+
{
57+
"data": {
58+
"text/html": [
59+
"<div>\n",
60+
"<style scoped>\n",
61+
" .dataframe tbody tr th:only-of-type {\n",
62+
" vertical-align: middle;\n",
63+
" }\n",
64+
"\n",
65+
" .dataframe tbody tr th {\n",
66+
" vertical-align: top;\n",
67+
" }\n",
68+
"\n",
69+
" .dataframe thead th {\n",
70+
" text-align: right;\n",
71+
" }\n",
72+
"</style>\n",
73+
"<table border=\"1\" class=\"dataframe\">\n",
74+
" <thead>\n",
75+
" <tr style=\"text-align: right;\">\n",
76+
" <th></th>\n",
77+
" <th>Поисковый запрос</th>\n",
78+
" <th>Количество запросов с пустым результатом за ноябрь 2020</th>\n",
79+
" <th>Предположительная категория поиска 1</th>\n",
80+
" <th>Предположительная категория поиска 2</th>\n",
81+
" <th>Статус запроса на 01.12.2020</th>\n",
82+
" </tr>\n",
83+
" </thead>\n",
84+
" <tbody>\n",
85+
" <tr>\n",
86+
" <th>0</th>\n",
87+
" <td>аквадетрим</td>\n",
88+
" <td>42961</td>\n",
89+
" <td>Лекарственные средства</td>\n",
90+
" <td>NaN</td>\n",
91+
" <td>Товар найден</td>\n",
92+
" </tr>\n",
93+
" <tr>\n",
94+
" <th>1</th>\n",
95+
" <td>арбидол</td>\n",
96+
" <td>20569</td>\n",
97+
" <td>Лекарственные средства</td>\n",
98+
" <td>NaN</td>\n",
99+
" <td>Товар найден</td>\n",
100+
" </tr>\n",
101+
" <tr>\n",
102+
" <th>2</th>\n",
103+
" <td>цефтриаксон</td>\n",
104+
" <td>20060</td>\n",
105+
" <td>Лекарственные средства</td>\n",
106+
" <td>NaN</td>\n",
107+
" <td>Нет результатов</td>\n",
108+
" </tr>\n",
109+
" <tr>\n",
110+
" <th>3</th>\n",
111+
" <td>детримакс</td>\n",
112+
" <td>16971</td>\n",
113+
" <td>Лекарственные средства</td>\n",
114+
" <td>NaN</td>\n",
115+
" <td>Товар найден</td>\n",
116+
" </tr>\n",
117+
" <tr>\n",
118+
" <th>4</th>\n",
119+
" <td>shiseido</td>\n",
120+
" <td>8928</td>\n",
121+
" <td>Товары для красоты</td>\n",
122+
" <td>Тональные средства для лица</td>\n",
123+
" <td>Товар найден</td>\n",
124+
" </tr>\n",
125+
" </tbody>\n",
126+
"</table>\n",
127+
"</div>"
128+
],
129+
"text/plain": [
130+
" Поисковый запрос Количество запросов с пустым результатом за ноябрь 2020 \\\n",
131+
"0 аквадетрим 42961 \n",
132+
"1 арбидол 20569 \n",
133+
"2 цефтриаксон 20060 \n",
134+
"3 детримакс 16971 \n",
135+
"4 shiseido 8928 \n",
136+
"\n",
137+
" Предположительная категория поиска 1 Предположительная категория поиска 2 \\\n",
138+
"0 Лекарственные средства NaN \n",
139+
"1 Лекарственные средства NaN \n",
140+
"2 Лекарственные средства NaN \n",
141+
"3 Лекарственные средства NaN \n",
142+
"4 Товары для красоты Тональные средства для лица \n",
143+
"\n",
144+
" Статус запроса на 01.12.2020 \n",
145+
"0 Товар найден \n",
146+
"1 Товар найден \n",
147+
"2 Нет результатов \n",
148+
"3 Товар найден \n",
149+
"4 Товар найден "
150+
]
151+
},
152+
"execution_count": 3,
153+
"metadata": {},
154+
"output_type": "execute_result"
155+
}
156+
],
157+
"source": [
158+
"# pylint: disable=line-too-long\n",
159+
"\n",
160+
"df = pd.read_excel(\n",
161+
" \"https://github.com/dm-fedorov/pandas_basic/blob/master/%D0%BA%D0%B5%D0%B9%D1%81%D1%8B%20%D0%BF%D0%BE%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%D1%83%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85/ozon_case_01/data/raw/chto-ne-nashli-na-ozon-v-noyabre-2020_JBQtdms.xlsx?raw=True\"\n",
162+
")\n",
163+
"df.head()"
164+
]
165+
}
166+
],
167+
"metadata": {
168+
"kernelspec": {
169+
"display_name": "base",
170+
"language": "python",
171+
"name": "python3"
172+
},
173+
"language_info": {
174+
"codemirror_mode": {
175+
"name": "ipython",
176+
"version": 3
177+
},
178+
"file_extension": ".py",
179+
"mimetype": "text/x-python",
180+
"name": "python",
181+
"nbconvert_exporter": "python",
182+
"pygments_lexer": "ipython3",
183+
"version": "3.12.8"
184+
}
185+
},
186+
"nbformat": 4,
187+
"nbformat_minor": 5
188+
}
Lines changed: 19 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,19 @@
1+
"""chapter_03_what_people_cannot_find_on_ozon."""
2+
3+
# # Что не находят на Ozon
4+
#
5+
# > [источник](https://opendata.ozon.ru/data/chto-ne-nakhodyat-na-ozon/)
6+
#
7+
# Кроме популярных товаров, Ozon также анализирует поисковые запросы, по которым покупатели не нашли товаров вообще или не заинтересовались предложенными. Мы собрали такие запросы в отдельный файл и разбили на три группы:
8+
#
9+
# - Нет результатов — по поисковому запросу нет товаров
10+
# - Только похожие — подходящих результатов нет, но есть похожие товары
11+
# - Не подошли — результаты таких поисковых запросов не заинтересовали покупателей. В столбце Доля неуспешных запросов указан процент запросов, после которых покупатели не перешли на карточку товара и не добавили ни одного товара в корзину
12+
13+
import pandas as pd
14+
15+
# +
16+
# pylint: disable=line-too-long
17+
18+
df = pd.read_excel("https://github.com/dm-fedorov/pandas_basic/blob/master/%D0%BA%D0%B5%D0%B9%D1%81%D1%8B%20%D0%BF%D0%BE%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%D1%83%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85/ozon_case_01/data/raw/chto-ne-nashli-na-ozon-v-noyabre-2020_JBQtdms.xlsx?raw=True")
19+
df.head()

0 commit comments

Comments
 (0)