realpython
diff --git a/‎pandas-gradebook-project/01-loading-the-data.py‎
Lines changed: 7 additions & 25 deletions b/‎pandas-gradebook-project/01-loading-the-data.py‎
Lines changed: 7 additions & 25 deletions
diff --git a/‎pandas-gradebook-project/02-merging-dataframes.py‎
Lines changed: 11 additions & 23 deletions b/‎pandas-gradebook-project/02-merging-dataframes.py‎
Lines changed: 11 additions & 23 deletions
diff --git a/‎pandas-gradebook-project/03-calculating-grades.py‎
Lines changed: 16 additions & 58 deletions b/‎pandas-gradebook-project/03-calculating-grades.py‎
Lines changed: 16 additions & 58 deletions
diff --git a/‎pandas-gradebook-project/04-grouping-the-data.py‎
Lines changed: 32 additions & 15 deletions b/‎pandas-gradebook-project/04-grouping-the-data.py‎
Lines changed: 32 additions & 15 deletions
@@ -14,49 +14,31 @@
 HERE = Path(__file__).parent
 DATA_FOLDER = HERE / "data"
 
+# ----------------------
+# 01 - LOADING THE DATA
+# ----------------------
+
 roster = pd.read_csv(
     DATA_FOLDER / "roster.csv",
     converters={"NetID": str.lower, "Email Address": str.lower},
     usecols=["Section", "Email Address", "NetID"],
     index_col="NetID",
 )
 
-# print(
-#     roster.loc[["wxb12345", "mxl12345", "txj12345", "jgf12345"]].to_markdown()
-# )
-
 hw_exam_grades = pd.read_csv(
     DATA_FOLDER / "hw_exam_grades.csv",
     converters={"SID": str.lower, "Email Address": str.lower},
     usecols=lambda x: "Submission" not in x,
     index_col="SID",
 )
-# print(
-#     hw_exam_grades.loc[
-#         hw_exam_grades["SID"].isin(
-#             ["jgf12345", "mxl12345", "txj12345", "wxb12345"]
-#         )
-#     ].to_markdown()
-# )
 
 quiz_grades = pd.DataFrame()
-for f in DATA_FOLDER.glob("quiz_*_grades.csv"):
-    quiz_name = " ".join(f.stem.title().split("_")[:2])
+for file_path in DATA_FOLDER.glob("quiz_*_grades.csv"):
+    quiz_name = " ".join(file_path.stem.title().split("_")[:2])
     quiz = pd.read_csv(
-        f,
+        file_path,
         converters={"Email": str.lower},
         index_col=["Email"],
         usecols=["Email", "Grade"],
     ).rename(columns={"Grade": quiz_name})
     quiz_grades = pd.concat([quiz_grades, quiz], axis=1)
-
-# print(
-#     quiz_grades.loc[
-#         [
-#             "[email protected]",
-#             "[email protected]",
-#             "[email protected]",
-#             "[email protected]",
-#         ]
-#     ].to_markdown()
-# )
@@ -14,6 +14,10 @@
 HERE = Path(__file__).parent
 DATA_FOLDER = HERE / "data"
 
+# ----------------------
+# 01 - LOADING THE DATA
+# ----------------------
+
 roster = pd.read_csv(
     DATA_FOLDER / "roster.csv",
     converters={"NetID": str.lower, "Email Address": str.lower},
@@ -29,40 +33,24 @@
 )
 
 quiz_grades = pd.DataFrame()
-for f in DATA_FOLDER.glob("quiz_*_grades.csv"):
-    quiz_name = " ".join(f.stem.title().split("_")[:2])
+for file_path in DATA_FOLDER.glob("quiz_*_grades.csv"):
+    quiz_name = " ".join(file_path.stem.title().split("_")[:2])
     quiz = pd.read_csv(
-        f,
+        file_path,
         converters={"Email": str.lower},
         index_col=["Email"],
         usecols=["Email", "Grade"],
     ).rename(columns={"Grade": quiz_name})
     quiz_grades = pd.concat([quiz_grades, quiz], axis=1)
 
+# ------------------------
+# 02 - MERGING DATAFRAMES
+# ------------------------
+
 final_data = pd.merge(
     roster, hw_exam_grades, left_index=True, right_index=True,
 )
-
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"]
-#     ].to_markdown()
-# )
-
 final_data = pd.merge(
     final_data, quiz_grades, left_on="Email Address", right_index=True
 )
-
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"]
-#     ].to_markdown()
-# )
-
 final_data = final_data.fillna(0)
-
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"]
-#     ].to_markdown()
-# )
@@ -15,6 +15,10 @@
 HERE = Path(__file__).parent
 DATA_FOLDER = HERE / "data"
 
+# ----------------------
+# 01 - LOADING THE DATA
+# ----------------------
+
 roster = pd.read_csv(
     DATA_FOLDER / "roster.csv",
     converters={"NetID": str.lower, "Email Address": str.lower},
@@ -30,80 +34,53 @@
 )
 
 quiz_grades = pd.DataFrame()
-for f in DATA_FOLDER.glob("quiz_*_grades.csv"):
-    quiz_name = " ".join(f.stem.title().split("_")[:2])
+for file_path in DATA_FOLDER.glob("quiz_*_grades.csv"):
+    quiz_name = " ".join(file_path.stem.title().split("_")[:2])
     quiz = pd.read_csv(
-        f,
+        file_path,
         converters={"Email": str.lower},
         index_col=["Email"],
         usecols=["Email", "Grade"],
     ).rename(columns={"Grade": quiz_name})
     quiz_grades = pd.concat([quiz_grades, quiz], axis=1)
 
+# ------------------------
+# 02 - MERGING DATAFRAMES
+# ------------------------
+
 final_data = pd.merge(
     roster, hw_exam_grades, left_index=True, right_index=True,
 )
-
 final_data = pd.merge(
     final_data, quiz_grades, left_on="Email Address", right_index=True
 )
-
 final_data = final_data.fillna(0)
 
+# ------------------------
+# 03 - CALCULATING GRADES
+# ------------------------
+
 n_exams = 3
 for n in range(1, n_exams + 1):
     final_data[f"Exam {n} Score"] = (
         final_data[f"Exam {n}"] / final_data[f"Exam {n} - Max Points"]
     )
 
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"],
-#         [f"Exam {n} Score" for n in range(1, n_exams + 1)],
-#     ].to_markdown()
-# )
-
 homework_scores = final_data.filter(regex=r"^Homework \d\d?$", axis=1)
 homework_max_points = final_data.filter(regex=r"^Homework \d\d? -", axis=1)
 
 sum_of_hw_scores = homework_scores.sum(axis=1)
 sum_of_hw_max = homework_max_points.sum(axis=1)
 final_data["Total Homework"] = sum_of_hw_scores / sum_of_hw_max
 
-# print(
-#     pd.concat(
-#         [sum_of_hw_scores, sum_of_hw_max, final_data["Total Homework"]], axis=1
-#     )
-#     .set_axis(
-#         ["Sum of Homework Scores", "Sum of Max Scores", "Total Homework"],
-#         axis=1,
-#     )
-#     .loc[["wxb12345", "mxl12345", "txj12345", "jgf12345"]]
-#     .to_markdown()
-# )
-
 hw_max_renamed = homework_max_points.set_axis(homework_scores.columns, axis=1)
 average_hw_scores = (homework_scores / hw_max_renamed).sum(axis=1)
 final_data["Average Homework"] = average_hw_scores / homework_scores.shape[1]
 
-# print(
-#     pd.concat([average_hw_scores, final_data["Average Homework"]], axis=1)
-#     .set_axis(["Sum of Average Homework Scores", "Average Homework"], axis=1)
-#     .loc[["wxb12345", "mxl12345", "txj12345", "jgf12345"]]
-#     .to_markdown()
-# )
-
 final_data["Homework Score"] = final_data[
     ["Total Homework", "Average Homework"]
 ].max(axis=1)
 
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"],
-#         ["Total Homework", "Average Homework", "Homework Score"],
-#     ].to_markdown()
-# )
-
 quiz_scores = final_data.filter(regex=r"^Quiz \d$", axis=1)
 quiz_max_points = pd.Series(
     {"Quiz 1": 11, "Quiz 2": 15, "Quiz 3": 17, "Quiz 4": 14, "Quiz 5": 12}
@@ -120,13 +97,6 @@
     ["Total Quizzes", "Average Quizzes"]
 ].max(axis=1)
 
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"],
-#         ["Total Quizzes", "Average Quizzes", "Quiz Score"],
-#     ].to_markdown()
-# )
-
 weightings = pd.Series(
     {
         "Exam 1 Score": 0.05,
@@ -142,13 +112,6 @@
 )
 final_data["Ceiling Score"] = np.ceil(final_data["Final Score"] * 100)
 
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"],
-#         ["Final Score", "Ceiling Score"],
-#     ].to_markdown()
-# )
-
 grades = {
     90: "A",
     80: "B",
@@ -159,6 +122,7 @@
 
 
 def grade_mapping(value):
+    """Map numerical grade to letter grade."""
     for key, letter in grades.items():
         if value >= key:
             return letter
@@ -168,9 +132,3 @@ def grade_mapping(value):
 final_data["Final Grade"] = pd.Categorical(
     letter_grades, categories=grades.values(), ordered=True
 )
-
-# print(
-#     final_data.loc[
-#         ["wxb12345", "mxl12345", "txj12345", "jgf12345"], ["Final Grade"],
-#     ].to_markdown()
-# )
@@ -15,6 +15,10 @@
 HERE = Path(__file__).parent
 DATA_FOLDER = HERE / "data"
 
+# ----------------------
+# 01 - LOADING THE DATA
+# ----------------------
+
 roster = pd.read_csv(
     DATA_FOLDER / "roster.csv",
     converters={"NetID": str.lower, "Email Address": str.lower},
@@ -30,26 +34,32 @@
 )
 
 quiz_grades = pd.DataFrame()
-for f in DATA_FOLDER.glob("quiz_*_grades.csv"):
-    quiz_name = " ".join(f.stem.title().split("_")[:2])
+for file_path in DATA_FOLDER.glob("quiz_*_grades.csv"):
+    quiz_name = " ".join(file_path.stem.title().split("_")[:2])
     quiz = pd.read_csv(
-        f,
+        file_path,
         converters={"Email": str.lower},
         index_col=["Email"],
         usecols=["Email", "Grade"],
     ).rename(columns={"Grade": quiz_name})
     quiz_grades = pd.concat([quiz_grades, quiz], axis=1)
 
+# ------------------------
+# 02 - MERGING DATAFRAMES
+# ------------------------
+
 final_data = pd.merge(
     roster, hw_exam_grades, left_index=True, right_index=True,
 )
-
 final_data = pd.merge(
     final_data, quiz_grades, left_on="Email Address", right_index=True
 )
-
 final_data = final_data.fillna(0)
 
+# ------------------------
+# 03 - CALCULATING GRADES
+# ------------------------
+
 n_exams = 3
 for n in range(1, n_exams + 1):
     final_data[f"Exam {n} Score"] = (
@@ -64,14 +74,13 @@
 final_data["Total Homework"] = sum_of_hw_scores / sum_of_hw_max
 
 hw_max_renamed = homework_max_points.set_axis(homework_scores.columns, axis=1)
-overall_hw_scores = (homework_scores / hw_max_renamed).sum(axis=1)
-final_data["Overall Homework"] = overall_hw_scores / homework_scores.shape[1]
+average_hw_scores = (homework_scores / hw_max_renamed).sum(axis=1)
+final_data["Average Homework"] = average_hw_scores / homework_scores.shape[1]
 
 final_data["Homework Score"] = final_data[
-    ["Total Homework", "Overall Homework"]
+    ["Total Homework", "Average Homework"]
 ].max(axis=1)
 
-
 quiz_scores = final_data.filter(regex=r"^Quiz \d$", axis=1)
 quiz_max_points = pd.Series(
     {"Quiz 1": 11, "Quiz 2": 15, "Quiz 3": 17, "Quiz 4": 14, "Quiz 5": 12}
@@ -81,11 +90,11 @@
 sum_of_quiz_max = quiz_max_points.sum()
 final_data["Total Quizzes"] = sum_of_hw_scores / sum_of_hw_max
 
-overall_quiz_scores = (quiz_scores / quiz_max_points).sum(axis=1)
-final_data["Overall Quizzes"] = overall_quiz_scores / quiz_scores.shape[1]
+average_quiz_scores = (quiz_scores / quiz_max_points).sum(axis=1)
+final_data["Average Quizzes"] = average_quiz_scores / quiz_scores.shape[1]
 
 final_data["Quiz Score"] = final_data[
-    ["Total Quizzes", "Overall Quizzes"]
+    ["Total Quizzes", "Average Quizzes"]
 ].max(axis=1)
 
 weightings = pd.Series(
@@ -113,6 +122,7 @@
 
 
 def grade_mapping(value):
+    """Map numerical grade to letter grade."""
     for key, letter in grades.items():
         if value >= key:
             return letter
@@ -123,8 +133,15 @@ def grade_mapping(value):
     letter_grades, categories=grades.values(), ordered=True
 )
 
+# -----------------------
+# 04 - GROUPING THE DATA
+# -----------------------
+
 for section, table in final_data.groupby("Section"):
-    print(f"In Section {section} there are {table.shape[0]} students.")
-    table.sort_values(by=["Last Name", "First Name"]).to_csv(
-        DATA_FOLDER / f"Section {section} Grades.csv"
+    section_file = DATA_FOLDER / f"Section {section} Grades.csv"
+    num_students = table.shape[0]
+    print(
+        f"In Section {section} there are {num_students} students saved to "
+        f"file {section_file}."
     )
+    table.sort_values(by=["Last Name", "First Name"]).to_csv(section_file)