ucbepic
diff --git a/‎Makefile‎
Lines changed: 3 additions & 2 deletions b/‎Makefile‎
Lines changed: 3 additions & 2 deletions
diff --git a/‎docetl/operations/map.py‎
Lines changed: 23 additions & 1 deletion b/‎docetl/operations/map.py‎
Lines changed: 23 additions & 1 deletion
diff --git a/‎docetl/operations/reduce.py‎
Lines changed: 23 additions & 0 deletions b/‎docetl/operations/reduce.py‎
Lines changed: 23 additions & 0 deletions
@@ -8,10 +8,11 @@ tests:
 	poetry run pytest
 
 tests-basic:
-	poetry run pytest tests/basic
+	poetry run pytest -s tests/basic
 	poetry run pytest -s tests/test_api.py
-	poetry run pytest tests/test_runner_caching.py
+	poetry run pytest -s tests/test_runner_caching.py
 	poetry run pytest -s tests/test_pandas_accessors.py
+	poetry run pytest -s tests/test_output_modes.py
 
 lint:
 	poetry run ruff check docetl/* --fix
 
@@ -16,6 +16,7 @@
 from docetl.base_schemas import Tool, ToolFunction
 from docetl.operations.base import BaseOperation
 from docetl.operations.utils import RichLoopBar, strict_render
+from docetl.operations.utils.api import OutputMode
 
 
 class MapOperation(BaseOperation):
@@ -326,12 +327,17 @@ def _process_map_item(
                 ]
 
             def validation_fn(response: Union[Dict[str, Any], ModelResponse]):
+                structured_mode = (
+                    self.config.get("output", {}).get("mode")
+                    == OutputMode.STRUCTURED_OUTPUT.value
+                )
                 output = (
                     self.runner.api.parse_llm_response(
                         response,
                         schema=self.config["output"]["schema"],
                         tools=self.config.get("tools", None),
                         manually_fix_errors=self.manually_fix_errors,
+                        use_structured_output=structured_mode,
                     )[0]
                     if isinstance(response, ModelResponse)
                     else response
@@ -381,11 +387,16 @@ def validation_fn(response: Union[Dict[str, Any], ModelResponse]):
             if llm_result.validated:
                 # Parse the response
                 if isinstance(llm_result.response, ModelResponse):
+                    structured_mode = (
+                        self.config.get("output", {}).get("mode")
+                        == OutputMode.STRUCTURED_OUTPUT.value
+                    )
                     outputs = self.runner.api.parse_llm_response(
                         llm_result.response,
                         schema=self.config["output"]["schema"],
                         tools=self.config.get("tools", None),
                         manually_fix_errors=self.manually_fix_errors,
+                        use_structured_output=structured_mode,
                     )
                 else:
                     outputs = [llm_result.response]
@@ -432,8 +443,14 @@ def _process_map_batch(items: List[Dict]) -> Tuple[List[Dict], float]:
                 total_cost += llm_result.total_cost
 
                 # Parse the LLM response
+                structured_mode = (
+                    self.config.get("output", {}).get("mode")
+                    == OutputMode.STRUCTURED_OUTPUT.value
+                )
                 parsed_output = self.runner.api.parse_llm_response(
-                    llm_result.response, self.config["output"]["schema"]
+                    llm_result.response,
+                    self.config["output"]["schema"],
+                    use_structured_output=structured_mode,
                 )[0].get("results", [])
                 items_and_outputs = [
                     (item, parsed_output[idx] if idx < len(parsed_output) else None)
@@ -709,11 +726,16 @@ def process_prompt(item, prompt_config):
                 ),
                 op_config=self.config,
             )
+            structured_mode = (
+                self.config.get("output", {}).get("mode")
+                == OutputMode.STRUCTURED_OUTPUT.value
+            )
             output = self.runner.api.parse_llm_response(
                 response.response,
                 schema=local_output_schema,
                 tools=prompt_config.get("tools", None),
                 manually_fix_errors=self.manually_fix_errors,
+                use_structured_output=structured_mode,
             )[0]
             return output, prompt, response.total_cost
 
 
@@ -25,6 +25,9 @@
     get_embeddings_for_clustering,
 )
 from docetl.operations.utils import rich_as_completed, strict_render
+
+# Import OutputMode enum for structured output checks
+from docetl.operations.utils.api import OutputMode
 from docetl.utils import completion_cost
 
 
@@ -765,9 +768,14 @@ def _incremental_reduce(
         return current_output, prompts, total_cost
 
     def validation_fn(self, response: Dict[str, Any]):
+        structured_mode = (
+            self.config.get("output", {}).get("mode")
+            == OutputMode.STRUCTURED_OUTPUT.value
+        )
         output = self.runner.api.parse_llm_response(
             response,
             schema=self.config["output"]["schema"],
+            use_structured_output=structured_mode,
         )[0]
         if self.runner.api.validate_output(self.config, output, self.console):
             return output, True
@@ -834,10 +842,15 @@ def _increment_fold(
         self._update_fold_time(end_time - start_time)
 
         if response.validated:
+            structured_mode = (
+                self.config.get("output", {}).get("mode")
+                == OutputMode.STRUCTURED_OUTPUT.value
+            )
             folded_output = self.runner.api.parse_llm_response(
                 response.response,
                 schema=self.config["output"]["schema"],
                 manually_fix_errors=self.manually_fix_errors,
+                use_structured_output=structured_mode,
             )[0]
 
             folded_output.update(dict(zip(self.config["reduce_key"], key)))
@@ -897,10 +910,15 @@ def _merge_results(
         self._update_merge_time(end_time - start_time)
 
         if response.validated:
+            structured_mode = (
+                self.config.get("output", {}).get("mode")
+                == OutputMode.STRUCTURED_OUTPUT.value
+            )
             merged_output = self.runner.api.parse_llm_response(
                 response.response,
                 schema=self.config["output"]["schema"],
                 manually_fix_errors=self.manually_fix_errors,
+                use_structured_output=structured_mode,
             )[0]
             merged_output.update(dict(zip(self.config["reduce_key"], key)))
             merge_cost = response.total_cost
@@ -1010,10 +1028,15 @@ def _batch_reduce(
         item_cost += response.total_cost
 
         if response.validated:
+            structured_mode = (
+                self.config.get("output", {}).get("mode")
+                == OutputMode.STRUCTURED_OUTPUT.value
+            )
             output = self.runner.api.parse_llm_response(
                 response.response,
                 schema=self.config["output"]["schema"],
                 manually_fix_errors=self.manually_fix_errors,
+                use_structured_output=structured_mode,
             )[0]
             output.update(dict(zip(self.config["reduce_key"], key)))