Add handling for missing mapping data in score set annotated variants responses

bencap · bencap · commit 2746d7b514d4 · 2025-08-20T14:00:01.000-07:00
diff --git a/src/mavedb/routers/score_sets.py b/src/mavedb/routers/score_sets.py
@@ -15,6 +15,7 @@
 from sqlalchemy.orm import Session
 
 from mavedb import deps
+from mavedb.lib.annotation.exceptions import MappingDataDoesntExistException
 from mavedb.lib.annotation.annotate import (
     variant_pathogenicity_evidence,
     variant_functional_impact_statement,
@@ -519,9 +520,16 @@ def get_score_set_annotated_variants(
             detail=f"No mapped variants associated with score set URN {urn} were found. Could not construct evidence lines.",
         )
 
-    return {
-        mapped_variant.variant.urn: variant_pathogenicity_evidence(mapped_variant) for mapped_variant in mapped_variants
-    }
+    variant_evidence: dict[str, Optional[VariantPathogenicityEvidenceLine]] = {}
+    for mv in mapped_variants:
+        # TODO#372: Non-nullable URNs
+        try:
+            variant_evidence[mv.variant.urn] = variant_pathogenicity_evidence(mv)  # type: ignore
+        except MappingDataDoesntExistException:
+            logger.debug(msg=f"Mapping data does not exist for variant {mv.variant.urn}.", extra=logging_context())
+            variant_evidence[mv.variant.urn] = None  # type: ignore
+
+    return variant_evidence
 
 
 @router.get(
@@ -569,10 +577,16 @@ def get_score_set_annotated_variants_functional_statement(
             detail=f"No mapped variants associated with score set URN {urn} were found. Could not construct functional impact statements.",
         )
 
-    return {
-        mapped_variant.variant.urn: variant_functional_impact_statement(mapped_variant)
-        for mapped_variant in mapped_variants
-    }
+    variant_impact_statements: dict[str, Optional[Statement]] = {}
+    for mv in mapped_variants:
+        # TODO#372: Non-nullable URNs
+        try:
+            variant_impact_statements[mv.variant.urn] = variant_functional_impact_statement(mv)  # type: ignore
+        except MappingDataDoesntExistException:
+            logger.debug(msg=f"Mapping data does not exist for variant {mv.variant.urn}.", extra=logging_context())
+            variant_impact_statements[mv.variant.urn] = None  # type: ignore
+
+    return variant_impact_statements
 
 
 @router.get(
@@ -620,7 +634,16 @@ def get_score_set_annotated_variants_functional_study_result(
             detail=f"No mapped variants associated with score set URN {urn} were found. Could not construct study results.",
         )
 
-    return {mapped_variant.variant.urn: variant_study_result(mapped_variant) for mapped_variant in mapped_variants}
+    variant_study_results: dict[str, Optional[ExperimentalVariantFunctionalImpactStudyResult]] = {}
+    for mv in mapped_variants:
+        # TODO#372: Non-nullable URNs
+        try:
+            variant_study_results[mv.variant.urn] = variant_study_result(mv)  # type: ignore
+        except MappingDataDoesntExistException:
+            logger.debug(msg=f"Mapping data does not exist for variant {mv.variant.urn}.", extra=logging_context())
+            variant_study_results[mv.variant.urn] = None  # type: ignore
+
+    return variant_study_results
 
 
 @router.post(
diff --git a/tests/helpers/util/variant.py b/tests/helpers/util/variant.py
@@ -100,3 +100,15 @@ def create_mapped_variants_for_score_set(db, score_set_urn, mapped_variant: dict
     score_set.mapping_state = MappingState.complete
     db.commit()
     return
+
+
+def clear_first_mapped_variant_post_mapped(session, score_set_urn):
+    db_score_set = session.query(ScoreSet).filter(ScoreSet.urn == score_set_urn).one()
+    variants = db_score_set.variants
+
+    if variants:
+        first_var = variants[0]
+        first_var.mapped_variants[0].post_mapped = None
+        session.commit()
+
+        return first_var
diff --git a/tests/routers/test_score_set.py b/tests/routers/test_score_set.py
@@ -69,7 +69,11 @@
     create_seq_score_set_with_variants,
 )
 from tests.helpers.util.user import change_ownership
-from tests.helpers.util.variant import create_mapped_variants_for_score_set, mock_worker_variant_insertion
+from tests.helpers.util.variant import (
+    create_mapped_variants_for_score_set,
+    mock_worker_variant_insertion,
+    clear_first_mapped_variant_post_mapped,
+)
 
 
 ########################################################################################################################
@@ -2839,6 +2843,42 @@ def test_nonetype_annotated_pathogenicity_evidence_lines_for_score_set_when_thre
         assert annotated_variant is None
 
 
+@pytest.mark.parametrize(
+    "mock_publication_fetch",
+    [({"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"})],
+    indirect=["mock_publication_fetch"],
+)
+def test_get_annotated_pathogenicity_evidence_lines_for_score_set_when_some_variants_were_not_mapped(
+    client, session, data_provider, data_files, setup_router_db, admin_app_overrides, mock_publication_fetch
+):
+    experiment = create_experiment(client)
+    score_set = create_seq_score_set_with_mapped_variants(
+        client,
+        session,
+        data_provider,
+        experiment["urn"],
+        data_files / "scores.csv",
+        update={
+            "secondaryPublicationIdentifiers": [{"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"}],
+            "scoreRanges": camelize(TEST_SCORE_SET_RANGES_ONLY_PILLAR_PROJECT),
+        },
+    )
+
+    first_var = clear_first_mapped_variant_post_mapped(session, score_set["urn"])
+
+    response = client.get(f"/api/v1/score-sets/{score_set['urn']}/annotated-variants/pathogenicity-evidence-line")
+    response_data = response.json()
+
+    assert response.status_code == 200
+    assert len(response_data) == score_set["numVariants"]
+
+    for annotated_variant_urn, annotated_variant in response_data.items():
+        if annotated_variant_urn == first_var.urn:
+            assert annotated_variant is None
+        else:
+            assert f"Pathogenicity evidence line {annotated_variant_urn}" in annotated_variant.get("description")
+
+
 @pytest.mark.parametrize(
     "mock_publication_fetch",
     [({"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"})],
@@ -2954,6 +2994,42 @@ def test_nonetype_annotated_functional_impact_statement_for_score_set_when_thres
         assert annotated_variant is None
 
 
+@pytest.mark.parametrize(
+    "mock_publication_fetch",
+    [({"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"})],
+    indirect=["mock_publication_fetch"],
+)
+def test_get_annotated_functional_impact_statement_for_score_set_when_some_variants_were_not_mapped(
+    client, session, data_provider, data_files, setup_router_db, admin_app_overrides, mock_publication_fetch
+):
+    experiment = create_experiment(client)
+    score_set = create_seq_score_set_with_mapped_variants(
+        client,
+        session,
+        data_provider,
+        experiment["urn"],
+        data_files / "scores.csv",
+        update={
+            "secondaryPublicationIdentifiers": [{"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"}],
+            "scoreRanges": camelize(TEST_SCORE_SET_RANGES_ALL_SCHEMAS_PRESENT),
+        },
+    )
+
+    first_var = clear_first_mapped_variant_post_mapped(session, score_set["urn"])
+
+    response = client.get(f"/api/v1/score-sets/{score_set['urn']}/annotated-variants/functional-impact-statement")
+    response_data = response.json()
+
+    assert response.status_code == 200
+    assert len(response_data) == score_set["numVariants"]
+
+    for annotated_variant_urn, annotated_variant in response_data.items():
+        if annotated_variant_urn == first_var.urn:
+            assert annotated_variant is None
+        else:
+            assert annotated_variant.get("type") == "Statement"
+
+
 @pytest.mark.parametrize(
     "mock_publication_fetch",
     [({"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"})],
@@ -3069,6 +3145,42 @@ def test_annotated_functional_study_result_exists_for_score_set_when_thresholds_
         assert annotated_variant.get("type") == "ExperimentalVariantFunctionalImpactStudyResult"
 
 
+@pytest.mark.parametrize(
+    "mock_publication_fetch",
+    [({"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"})],
+    indirect=["mock_publication_fetch"],
+)
+def test_annotated_functional_study_result_exists_for_score_set_when_some_variants_were_not_mapped(
+    client, session, data_provider, data_files, setup_router_db, admin_app_overrides, mock_publication_fetch
+):
+    experiment = create_experiment(client)
+    score_set = create_seq_score_set_with_mapped_variants(
+        client,
+        session,
+        data_provider,
+        experiment["urn"],
+        data_files / "scores.csv",
+        update={
+            "secondaryPublicationIdentifiers": [{"dbName": "PubMed", "identifier": f"{TEST_PUBMED_IDENTIFIER}"}],
+            "scoreRanges": camelize(TEST_SCORE_SET_RANGES_ONLY_PILLAR_PROJECT),
+        },
+    )
+
+    first_var = clear_first_mapped_variant_post_mapped(session, score_set["urn"])
+
+    response = client.get(f"/api/v1/score-sets/{score_set['urn']}/annotated-variants/functional-study-result")
+    response_data = response.json()
+
+    assert response.status_code == 200
+    assert len(response_data) == score_set["numVariants"]
+
+    for annotated_variant_urn, annotated_variant in response_data.items():
+        if annotated_variant_urn == first_var.urn:
+            assert annotated_variant is None
+        else:
+            assert annotated_variant.get("type") == "ExperimentalVariantFunctionalImpactStudyResult"
+
+
 ########################################################################################################################
 # Fetching gnomad variants for a score set
 ########################################################################################################################