Merge pull request #29 from advanced-computing/irina2

irinasun120 · web-flow · commit bdcd08245113 · 2026-02-27T14:57:17.000-05:00
run the test.yml and address the issues
diff --git a/.github/workflows/test.yml b/.github/workflows/test.yml
diff --git a/Homepage.py b/Homepage.py
@@ -30,12 +30,14 @@
     "&offset=0&length=5000"
 )
 
+
 @st.cache_data(ttl=60 * 60)  # cache 1 hour
 def fetch_supply_json(url: str) -> dict:
     r = requests.get(url, timeout=30)
     r.raise_for_status()
     return r.json()
 
+
 try:
     payload = fetch_supply_json(SUPPLY_URL)
 except Exception as e:
diff --git a/pages/2_WTI_Price.py b/pages/2_WTI_Price.py
@@ -29,12 +29,14 @@
     "&offset=0&length=5000"
 )
 
+
 @st.cache_data(ttl=60 * 60)
 def fetch_wti_json(url: str) -> dict:
     r = requests.get(url, timeout=30)
     r.raise_for_status()
     return r.json()
 
+
 try:
     payload = fetch_wti_json(URL)
 except Exception as e:
@@ -61,9 +63,8 @@ def fetch_wti_json(url: str) -> dict:
     st.stop()
 
 # Aggregate weekly (safe even if already weekly)
-weekly_wti = (
-    sum_by_week(df, date_col="week", value_col="value")
-    .rename(columns={"value": "wti_price"})
+weekly_wti = sum_by_week(df, date_col="week", value_col="value").rename(
+    columns={"value": "wti_price"}
 )
 
 # Latest price
diff --git a/project.ipynb b/project.ipynb
@@ -204,7 +204,7 @@
     "st.caption(\n",
     "    \"Note: 'Product supplied' is often used as a proxy for consumption. \"\n",
     "    \"This visualization is descriptive (not causal).\"\n",
-    ")\n"
+    ")"
    ]
   }
  ],
diff --git a/requirements.txt b/requirements.txt
@@ -14,3 +14,5 @@ streamlit==1.54.0
 numpy
 requests
 altair==4.2.2
+pytest
+pytest-cov
diff --git a/tests/eia_part3.py b/tests/eia_part3.py
@@ -60,6 +60,7 @@ def sum_by_week(df: pd.DataFrame, date_col: str, value_col: str) -> pd.DataFrame
     )
     return out
 
+
 def validate_required_columns(df: pd.DataFrame, required_cols: list[str]) -> None:
     """Raise ValueError if any required column is missing."""
     missing = [c for c in required_cols if c not in df.columns]
diff --git a/tests/test_eia_part3.py b/tests/test_eia_part3.py
@@ -1,7 +1,6 @@
 import pandas as pd
 import pytest
-
-from tests.eia_part3 import (
+from eia_part3 import (
     add_week_ending_friday_column,
     build_df_from_eia_data,
     coerce_numeric_and_dropna,
@@ -11,6 +10,15 @@
     validate_required_columns,
 )
 
+# Constants used in tests to satisfy Ruff PLR2004 (no "magic numbers" in comparisons)
+EXPECTED_FIRST_VALUE = 100
+EXPECTED_FILTERED_VALUE = 2
+EXPECTED_LATEST_VALUE = 500.0
+EXPECTED_WEEK_COUNT = 2
+EXPECTED_WEEK1_SUM = 17
+EXPECTED_WEEK2_SUM = 3
+EXPECTED_SINGLE_VALUE = 10
+
 
 def test_build_df_from_eia_data_parses_and_drops_bad_rows():
     # includes: valid row, invalid date, invalid value
@@ -26,7 +34,7 @@ def test_build_df_from_eia_data_parses_and_drops_bad_rows():
     assert pd.api.types.is_datetime64_any_dtype(df["week"])
     assert pd.api.types.is_numeric_dtype(df["value"])
     assert df["week"].iloc[0] == pd.to_datetime("2012-01-06")
-    assert df["value"].iloc[0] == 100
+    assert df["value"].iloc[0] == EXPECTED_FIRST_VALUE
 
 
 def test_filter_since_keeps_2012_and_after():
@@ -39,7 +47,7 @@ def test_filter_since_keeps_2012_and_after():
 
     assert len(df2) == 1
     assert df2["week"].iloc[0] == pd.to_datetime("2012-01-06")
-    assert df2["value"].iloc[0] == 2
+    assert df2["value"].iloc[0] == EXPECTED_FILTERED_VALUE
 
 
 def test_latest_value_returns_value_of_most_recent_date_even_if_unsorted():
@@ -52,7 +60,7 @@ def test_latest_value_returns_value_of_most_recent_date_even_if_unsorted():
     df = build_df_from_eia_data(data)
     v = latest_value(df, date_col="week", value_col="value")
 
-    assert v == 500.0
+    assert v == EXPECTED_LATEST_VALUE
 
 
 def test_latest_value_raises_on_empty_df():
@@ -70,9 +78,14 @@ def test_sum_by_week_sums_duplicates():
     out = sum_by_week(df, date_col="week", value_col="value")
 
     assert list(out.columns) == ["week", "value"]
-    assert len(out) == 2
-    assert out.loc[out["week"] == pd.to_datetime("2012-01-06"), "value"].iloc[0] == 17
-    assert out.loc[out["week"] == pd.to_datetime("2012-01-13"), "value"].iloc[0] == 3
+    assert len(out) == EXPECTED_WEEK_COUNT
+    assert (
+        out.loc[out["week"] == pd.to_datetime("2012-01-06"), "value"].iloc[0] == EXPECTED_WEEK1_SUM
+    )
+    assert (
+        out.loc[out["week"] == pd.to_datetime("2012-01-13"), "value"].iloc[0] == EXPECTED_WEEK2_SUM
+    )
+
 
 def test_validate_required_columns_passes_when_present():
     df = pd.DataFrame({"week": [pd.to_datetime("2012-01-06")], "value": [1]})
@@ -99,4 +112,4 @@ def test_coerce_numeric_and_dropna_drops_invalid_values():
     out = coerce_numeric_and_dropna(df, value_col="value")
 
     assert len(out) == 1
-    assert out["value"].iloc[0] == 10
+    assert out["value"].iloc[0] == EXPECTED_SINGLE_VALUE

Original file line number	Diff line number	Diff line change
`@@ -204,7 +204,7 @@`
`204`	`204`	`"st.caption(\n",`
`205`	`205`	`" \"Note: 'Product supplied' is often used as a proxy for consumption. \"\n",`
`206`	`206`	`" \"This visualization is descriptive (not causal).\"\n",`
`207`		`- ")\n"`
	`207`	`+ ")"`
`208`	`208`	`]`
`209`	`209`	`}`
`210`	`210`	`],`
Original file line number	Diff line number	Diff line change
`@@ -60,6 +60,7 @@ def sum_by_week(df: pd.DataFrame, date_col: str, value_col: str) -> pd.DataFrame`
`60`	`60`	`)`
`61`	`61`	`return out`
`62`	`62`
	`63`	`+`
`63`	`64`	`def validate_required_columns(df: pd.DataFrame, required_cols: list[str]) -> None:`
`64`	`65`	`"""Raise ValueError if any required column is missing."""`
`65`	`66`	`missing = [c for c in required_cols if c not in df.columns]`