fix(core): replace blocking run_async_tasks with asyncio.gather (#20795)

gautamvarmadatla · web-flow · commit 91d811f19921 · 2026-02-25T12:17:14.000+01:00
replace blocking run_async_tasks with asyncio.gather
diff --git a/llama-index-core/llama_index/core/query_engine/router_query_engine.py b/llama-index-core/llama_index/core/query_engine/router_query_engine.py
@@ -1,7 +1,7 @@
+import asyncio
 import logging
 from typing import Callable, Generator, List, Optional, Sequence, Any
 
-from llama_index.core.async_utils import run_async_tasks
 from llama_index.core.base.base_query_engine import BaseQueryEngine
 from llama_index.core.base.base_retriever import BaseRetriever
 from llama_index.core.base.base_selector import BaseSelector
@@ -220,7 +220,7 @@ async def _aquery(self, query_bundle: QueryBundle) -> RESPONSE_TYPE:
                     selected_query_engine = self._query_engines[engine_ind]
                     tasks.append(selected_query_engine.aquery(query_bundle))
 
-                responses = run_async_tasks(tasks)
+                responses = await asyncio.gather(*tasks)
                 if len(responses) > 1:
                     final_response = await acombine_responses(
                         self._summarizer, responses, query_bundle
@@ -380,7 +380,7 @@ async def _aquery(self, query_bundle: QueryBundle) -> RESPONSE_TYPE:
             for query_engine_tool in query_engine_tools:
                 query_engine = query_engine_tool.query_engine
                 tasks.append(query_engine.aquery(query_bundle))
-            responses = run_async_tasks(tasks)
+            responses = await asyncio.gather(*tasks)
             if len(responses) > 1:
                 final_response = await acombine_responses(
                     self._summarizer, responses, query_bundle
diff --git a/llama-index-core/tests/query_engine/test_router_query_engine.py b/llama-index-core/tests/query_engine/test_router_query_engine.py
@@ -0,0 +1,114 @@
+import asyncio
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+
+from llama_index.core.base.base_selector import (
+    BaseSelector,
+    SelectorResult,
+    SingleSelection,
+)
+from llama_index.core.base.response.schema import Response
+from llama_index.core.llms.mock import MockLLM
+from llama_index.core.query_engine.router_query_engine import (
+    RouterQueryEngine,
+    ToolRetrieverRouterQueryEngine,
+)
+from llama_index.core.tools.types import ToolMetadata
+
+
+class _AlwaysMultiSelector(BaseSelector):
+    def _get_prompts(self):
+        return {}
+
+    def _update_prompts(self, prompts):
+        pass
+
+    def _select(self, choices, query):
+        return SelectorResult(
+            selections=[
+                SingleSelection(index=i, reason="") for i in range(len(choices))
+            ]
+        )
+
+    async def _aselect(self, choices, query):
+        return self._select(choices, query)
+
+
+def _make_query_engine_tool(name: str):
+    async def _fake_aquery(_):
+        await asyncio.sleep(0.05)
+        return Response(response="ok")
+
+    engine = MagicMock()
+    engine.aquery = AsyncMock(side_effect=_fake_aquery)
+
+    tool = MagicMock()
+    tool.query_engine = engine
+    tool.metadata = ToolMetadata(name=name, description=name)
+    return tool
+
+
+class _MockSummarizer:
+    async def aget_response(self, *args, **kwargs):
+        return "combined"
+
+
+async def _assert_not_blocked(coro) -> None:
+    loop = asyncio.get_running_loop()
+    start = loop.time()
+    ran_at = None
+
+    async def _background():
+        nonlocal ran_at
+        await asyncio.sleep(0.01)
+        ran_at = loop.time()
+
+    bg_task = asyncio.create_task(_background())
+    await asyncio.sleep(0)
+    await coro
+    await bg_task
+
+    assert ran_at is not None, "background task never ran"
+    assert (ran_at - start) < 0.04, (
+        f"background task finished {ran_at - start:.3f}s after start "
+        f"(expected < 0.04s) — the event loop was likely blocked"
+    )
+
+
+@pytest.mark.asyncio
+async def test_router_aquery_does_not_block_event_loop():
+    tool_a = _make_query_engine_tool("a")
+    tool_b = _make_query_engine_tool("b")
+
+    router = RouterQueryEngine(
+        selector=_AlwaysMultiSelector(),
+        query_engine_tools=[tool_a, tool_b],
+        llm=MockLLM(),
+        summarizer=_MockSummarizer(),
+    )
+
+    await _assert_not_blocked(router.aquery("test query"))
+
+    assert tool_a.query_engine.aquery.call_count == 1
+    assert tool_b.query_engine.aquery.call_count == 1
+
+
+@pytest.mark.asyncio
+async def test_tool_retriever_router_aquery_does_not_block_event_loop():
+    tool_a = _make_query_engine_tool("a")
+    tool_b = _make_query_engine_tool("b")
+
+    retriever = MagicMock()
+    retriever.retrieve = MagicMock(return_value=[tool_a, tool_b])
+
+    router = ToolRetrieverRouterQueryEngine(
+        retriever=retriever,
+        llm=MockLLM(),
+        summarizer=_MockSummarizer(),
+    )
+
+    await _assert_not_blocked(router.aquery("test query"))
+
+    assert tool_a.query_engine.aquery.call_count == 1
+    assert tool_b.query_engine.aquery.call_count == 1