DataDog
diff --git a/‎ddtrace/llmobs/_experiment.py‎
Lines changed: 7 additions & 3 deletions b/‎ddtrace/llmobs/_experiment.py‎
Lines changed: 7 additions & 3 deletions
diff --git a/‎ddtrace/llmobs/_writer.py‎
Lines changed: 32 additions & 18 deletions b/‎ddtrace/llmobs/_writer.py‎
Lines changed: 32 additions & 18 deletions
diff --git a/‎tests/llmobs/llmobs_cassettes/datadog/datadog_api_unstable_llm-obs_v1_datasets_delete_post_a66cc19d.yaml‎
Lines changed: 46 additions & 0 deletions b/‎tests/llmobs/llmobs_cassettes/datadog/datadog_api_unstable_llm-obs_v1_datasets_delete_post_a66cc19d.yaml‎
Lines changed: 46 additions & 0 deletions
@@ -266,9 +266,13 @@ def as_dataframe(self) -> None:
                 flat_record[("expected_output", "")] = expected_output
                 column_tuples.add(("expected_output", ""))
 
-            for metadata_col, metadata_val in record.get("metadata", {}).items():
-                flat_record[("metadata", metadata_col)] = metadata_val
-                column_tuples.add(("metadata", metadata_col))
+            metadata = record.get("metadata", {})
+            if isinstance(metadata, dict):
+                for metadata_col, metadata_val in metadata.items():
+                    flat_record[("metadata", metadata_col)] = metadata_val
+                    column_tuples.add(("metadata", metadata_col))
+            else:
+                logger.warning("unexpected metadata format %s", type(metadata))
 
             data_rows.append(flat_record)
 
 
@@ -303,9 +303,10 @@ class LLMObsExperimentsClient(BaseLLMObsWriter):
     ENDPOINT = ""
     TIMEOUT = 5.0
     BULK_UPLOAD_TIMEOUT = 60.0
+    LIST_RECORDS_TIMEOUT = 20
     SUPPORTED_UPLOAD_EXTS = {"csv"}
 
-    def request(self, method: str, path: str, body: JSONType = None) -> Response:
+    def request(self, method: str, path: str, body: JSONType = None, timeout=TIMEOUT) -> Response:
         headers = {
             "Content-Type": "application/json",
             "DD-API-KEY": self._api_key,
@@ -315,7 +316,7 @@ def request(self, method: str, path: str, body: JSONType = None) -> Response:
             headers[EVP_SUBDOMAIN_HEADER_NAME] = self.EVP_SUBDOMAIN_HEADER_VALUE
 
         encoded_body = json.dumps(body).encode("utf-8") if body else b""
-        conn = get_connection(url=self._intake, timeout=self.TIMEOUT)
+        conn = get_connection(url=self._intake, timeout=timeout)
         try:
             url = self._intake + self._endpoint + path
             logger.debug("requesting %s", url)
@@ -450,23 +451,36 @@ def dataset_get_with_records(self, name: str) -> Dataset:
         dataset_description = data[0]["attributes"].get("description", "")
         dataset_id = data[0]["id"]
 
-        path = f"/api/unstable/llm-obs/v1/datasets/{dataset_id}/records"
-        resp = self.request("GET", path)
-        if resp.status != 200:
-            raise ValueError(f"Failed to pull dataset {name}: {resp.status} {resp.get_json()}")
-        records_data = resp.get_json()
-
+        list_base_path = f"/api/unstable/llm-obs/v1/datasets/{dataset_id}/records"
+        has_next_page = True
         class_records: List[DatasetRecord] = []
-        for record in records_data.get("data", []):
-            attrs = record.get("attributes", {})
-            class_records.append(
-                {
-                    "record_id": record["id"],
-                    "input_data": attrs["input"],
-                    "expected_output": attrs.get("expected_output"),
-                    "metadata": attrs.get("metadata", {}),
-                }
-            )
+        list_path = list_base_path
+        page_num = 0
+        while has_next_page:
+            resp = self.request("GET", list_path, timeout=self.LIST_RECORDS_TIMEOUT)
+            if resp.status != 200:
+                raise ValueError(
+                    f"Failed to pull {page_num}th page of dataset records {name}: {resp.status} {resp.get_json()}"
+                )
+            records_data = resp.get_json()
+
+            for record in records_data.get("data", []):
+                attrs = record.get("attributes", {})
+                class_records.append(
+                    {
+                        "record_id": record["id"],
+                        "input_data": attrs["input"],
+                        "expected_output": attrs.get("expected_output"),
+                        "metadata": attrs.get("metadata", {}),
+                    }
+                )
+            next_cursor = records_data.get("meta", {}).get("after")
+            has_next_page = False
+            if next_cursor:
+                has_next_page = True
+                list_path = f"{list_base_path}?page[cursor]={next_cursor}"
+                logger.debug("next list records request path %s", list_path)
+                page_num += 1
         return Dataset(name, dataset_id, class_records, dataset_description, curr_version, _dne_client=self)
 
     def dataset_bulk_upload(self, dataset_id: str, records: List[DatasetRecord]):
 
@@ -0,0 +1,46 @@
+interactions:
+- request:
+    body: '{"data": {"type": "datasets", "attributes": {"type": "soft", "dataset_ids":
+      ["f572bfe7-98d4-42c2-90d9-4c50e554d62b"]}}}'
+    headers:
+      Accept:
+      - '*/*'
+      ? !!python/object/apply:multidict._multidict.istr
+      - Accept-Encoding
+      : - identity
+      Connection:
+      - keep-alive
+      Content-Length:
+      - '119'
+      ? !!python/object/apply:multidict._multidict.istr
+      - Content-Type
+      : - application/json
+      User-Agent:
+      - python-requests/2.32.3
+    method: POST
+    uri: https://api.datadoghq.com/api/unstable/llm-obs/v1/datasets/delete
+  response:
+    body:
+      string: '{"data":[{"id":"f572bfe7-98d4-42c2-90d9-4c50e554d62b","type":"datasets","attributes":{"author":{"id":"a7cd01e3-f412-11ed-a144-0aa89e224034"},"created_at":"2025-09-04T23:06:39.294177Z","current_version":1,"deleted_at":"2025-09-04T23:06:46.662435Z","description":"A
+        test dataset with a large number of records","name":"test-dataset-large-num-records","updated_at":"2025-09-04T23:06:40.341225Z"}}]}'
+    headers:
+      content-length:
+      - '395'
+      content-security-policy:
+      - frame-ancestors 'self'; report-uri https://logs.browser-intake-datadoghq.com/api/v2/logs?dd-api-key=pube4f163c23bbf91c16b8f57f56af9fc58&dd-evp-origin=content-security-policy&ddsource=csp-report&ddtags=site%3Adatadoghq.com
+      content-type:
+      - application/vnd.api+json
+      date:
+      - Thu, 04 Sep 2025 23:06:46 GMT
+      strict-transport-security:
+      - max-age=31536000; includeSubDomains; preload
+      vary:
+      - Accept-Encoding
+      x-content-type-options:
+      - nosniff
+      x-frame-options:
+      - SAMEORIGIN
+    status:
+      code: 200
+      message: OK
+version: 1