agno-agi
diff --git a/‎.github/workflows/test_on_release.yml‎
Lines changed: 25 additions & 2 deletions b/‎.github/workflows/test_on_release.yml‎
Lines changed: 25 additions & 2 deletions
diff --git a/‎cookbook/02_agents/14_advanced/combined_metrics.py‎
Lines changed: 102 additions & 0 deletions b/‎cookbook/02_agents/14_advanced/combined_metrics.py‎
Lines changed: 102 additions & 0 deletions
diff --git a/‎cookbook/02_agents/14_advanced/culture_metrics.py‎
Lines changed: 47 additions & 0 deletions b/‎cookbook/02_agents/14_advanced/culture_metrics.py‎
Lines changed: 47 additions & 0 deletions
diff --git a/‎cookbook/02_agents/14_advanced/multi_model_metrics.py‎
Lines changed: 49 additions & 0 deletions b/‎cookbook/02_agents/14_advanced/multi_model_metrics.py‎
Lines changed: 49 additions & 0 deletions
diff --git a/‎cookbook/02_agents/14_advanced/session_metrics.py‎
Lines changed: 49 additions & 0 deletions b/‎cookbook/02_agents/14_advanced/session_metrics.py‎
Lines changed: 49 additions & 0 deletions
diff --git a/‎cookbook/02_agents/14_advanced/session_summary_metrics.py‎
Lines changed: 68 additions & 0 deletions b/‎cookbook/02_agents/14_advanced/session_summary_metrics.py‎
Lines changed: 68 additions & 0 deletions
@@ -848,6 +848,26 @@ jobs:
           ./libs/agno/tests/integration/teams/test_metrics.py \
           ./libs/agno/tests/integration/teams/test_parser_model.py
 
+  verify-split-test-coverage:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v3
+      - name: Verify all split integration tests are assigned to CI jobs
+        run: |
+          status=0
+          for dir in teams knowledge; do
+            grep -oE "\./libs/agno/tests/integration/${dir}/[^ \\\\]+(/[^ \\\\]+)*\.py" \
+              .github/workflows/test_on_release.yml \
+              | grep -v '^\s*#' | sort -u > /tmp/wf.txt
+            find "libs/agno/tests/integration/${dir}" -name 'test_*.py' \
+              | sed 's|^|./|' | sort > /tmp/repo.txt
+            if ! diff /tmp/repo.txt /tmp/wf.txt; then
+              echo "::error::${dir} test coverage mismatch — see diff above"
+              status=1
+            fi
+          done
+          exit $status
+
   test-workflows:
     runs-on: ubuntu-latest
     strategy:
@@ -943,7 +963,9 @@ jobs:
           ./libs/agno/tests/integration/knowledge/test_json_knowledge.py \
           ./libs/agno/tests/integration/knowledge/test_md_knowledge.py \
           ./libs/agno/tests/integration/knowledge/test_pdf_knowledge.py \
-          ./libs/agno/tests/integration/knowledge/test_text_knowledge.py
+          ./libs/agno/tests/integration/knowledge/test_pptx_knowledge.py \
+          ./libs/agno/tests/integration/knowledge/test_text_knowledge.py \
+          ./libs/agno/tests/integration/knowledge/test_async_knowledge_retriever.py
 
   test-knowledge-2:
     runs-on: ubuntu-latest
@@ -977,7 +999,8 @@ jobs:
           python -m pytest ./libs/agno/tests/integration/knowledge/test_arxiv_knowledge.py \
           ./libs/agno/tests/integration/knowledge/test_firecrawl_knowledge.py \
           ./libs/agno/tests/integration/knowledge/test_website_knowledge.py \
-          ./libs/agno/tests/integration/knowledge/test_youtube_knowledge.py
+          ./libs/agno/tests/integration/knowledge/test_youtube_knowledge.py \
+          ./libs/agno/tests/integration/knowledge/filters/test_agentic_filtering.py
 
   # Run A2A tests (isolated due to dependency conflicts)
   test-a2a:
 
@@ -0,0 +1,102 @@
+"""
+Combined Metrics
+=============================
+
+When an agent uses multiple background features, each model's
+calls are tracked under separate detail keys:
+- "model" for the agent's own calls
+- "reasoning_model" for reasoning manager calls
+- "compression_model" for compression manager calls
+- "output_model" for output model calls
+- "memory_model" for memory manager calls
+- "culture_model" for culture manager calls
+- "session_summary_model" for session summary calls
+- "eval_model" for evaluation hook calls
+
+This example shows all detail keys and session-level metrics.
+"""
+
+from typing import List
+
+from agno.agent import Agent
+from agno.compression.manager import CompressionManager
+from agno.culture.manager import CultureManager
+from agno.db.postgres import PostgresDb
+from agno.eval.agent_as_judge import AgentAsJudgeEval
+from agno.memory.manager import MemoryManager
+from agno.models.openai import OpenAIChat
+from agno.session.summary import SessionSummaryManager
+from agno.tools.yfinance import YFinanceTools
+from pydantic import BaseModel, Field
+from rich.pretty import pprint
+
+
+class StockSummary(BaseModel):
+    ticker: str = Field(..., description="Stock ticker symbol")
+    summary: str = Field(..., description="Brief summary of the stock")
+    key_metrics: List[str] = Field(..., description="Key financial metrics")
+
+
+# ---------------------------------------------------------------------------
+# Create Agent
+# ---------------------------------------------------------------------------
+db = PostgresDb(db_url="postgresql+psycopg://ai:ai@localhost:5532/ai")
+
+eval_hook = AgentAsJudgeEval(
+    name="Quality Check",
+    model=OpenAIChat(id="gpt-4o-mini"),
+    criteria="Response should be helpful and accurate",
+    scoring_strategy="binary",
+)
+
+agent = Agent(
+    model=OpenAIChat(id="gpt-4o-mini"),
+    tools=[YFinanceTools(enable_stock_price=True, enable_company_info=True)],
+    reasoning_model=OpenAIChat(id="gpt-4o-mini"),
+    reasoning=True,
+    compression_manager=CompressionManager(
+        model=OpenAIChat(id="gpt-4o-mini"),
+        compress_tool_results_limit=1,
+    ),
+    output_model=OpenAIChat(id="gpt-4o-mini"),
+    output_schema=StockSummary,
+    structured_outputs=True,
+    memory_manager=MemoryManager(model=OpenAIChat(id="gpt-4o-mini"), db=db),
+    update_memory_on_run=True,
+    culture_manager=CultureManager(model=OpenAIChat(id="gpt-4o-mini"), db=db),
+    update_cultural_knowledge=True,
+    session_summary_manager=SessionSummaryManager(model=OpenAIChat(id="gpt-4o-mini")),
+    enable_session_summaries=True,
+    post_hooks=[eval_hook],
+    db=db,
+    session_id="combined-metrics-demo",
+)
+
+# ---------------------------------------------------------------------------
+# Run Agent
+# ---------------------------------------------------------------------------
+if __name__ == "__main__":
+    run_response = agent.run(
+        "Get the stock price and company info for NVDA and summarize it."
+    )
+
+    print("=" * 50)
+    print("RUN METRICS")
+    print("=" * 50)
+    pprint(run_response.metrics)
+
+    print("=" * 50)
+    print("MODEL DETAILS")
+    print("=" * 50)
+    if run_response.metrics and run_response.metrics.details:
+        for model_type, model_metrics_list in run_response.metrics.details.items():
+            print(f"\n{model_type}:")
+            for model_metric in model_metrics_list:
+                pprint(model_metric)
+
+    print("=" * 50)
+    print("SESSION METRICS")
+    print("=" * 50)
+    session_metrics = agent.get_session_metrics()
+    if session_metrics:
+        pprint(session_metrics)
@@ -0,0 +1,47 @@
+"""
+Culture Manager Metrics
+=============================
+
+When an agent uses a CultureManager, the culture model's
+calls are tracked under the "culture_model" detail key.
+"""
+
+from agno.agent import Agent
+from agno.culture.manager import CultureManager
+from agno.db.postgres import PostgresDb
+from agno.models.openai import OpenAIChat
+from rich.pretty import pprint
+
+# ---------------------------------------------------------------------------
+# Create Agent
+# ---------------------------------------------------------------------------
+db = PostgresDb(db_url="postgresql+psycopg://ai:ai@localhost:5532/ai")
+
+agent = Agent(
+    model=OpenAIChat(id="gpt-4o-mini"),
+    culture_manager=CultureManager(model=OpenAIChat(id="gpt-4o-mini"), db=db),
+    update_cultural_knowledge=True,
+    db=db,
+)
+
+# ---------------------------------------------------------------------------
+# Run Agent
+# ---------------------------------------------------------------------------
+if __name__ == "__main__":
+    run_response = agent.run(
+        "Our team always does code reviews before merging. We pair program on complex features."
+    )
+
+    print("=" * 50)
+    print("RUN METRICS")
+    print("=" * 50)
+    pprint(run_response.metrics)
+
+    print("=" * 50)
+    print("MODEL DETAILS")
+    print("=" * 50)
+    if run_response.metrics and run_response.metrics.details:
+        for model_type, model_metrics_list in run_response.metrics.details.items():
+            print(f"\n{model_type}:")
+            for model_metric in model_metrics_list:
+                pprint(model_metric)
@@ -0,0 +1,49 @@
+"""
+Multi-Model Metrics
+=============================
+
+When an agent uses a MemoryManager, each manager's model calls
+are tracked under separate detail keys in metrics.details.
+
+This example shows the "model" vs "memory_model" breakdown.
+"""
+
+from agno.agent import Agent
+from agno.db.postgres import PostgresDb
+from agno.memory.manager import MemoryManager
+from agno.models.openai import OpenAIChat
+from rich.pretty import pprint
+
+# ---------------------------------------------------------------------------
+# Create Agent
+# ---------------------------------------------------------------------------
+db = PostgresDb(db_url="postgresql+psycopg://ai:ai@localhost:5532/ai")
+
+agent = Agent(
+    model=OpenAIChat(id="gpt-4o-mini"),
+    memory_manager=MemoryManager(model=OpenAIChat(id="gpt-4o-mini"), db=db),
+    update_memory_on_run=True,
+    db=db,
+)
+
+# ---------------------------------------------------------------------------
+# Run Agent
+# ---------------------------------------------------------------------------
+if __name__ == "__main__":
+    run_response = agent.run(
+        "My name is Alice and I work at Google as a senior engineer."
+    )
+
+    print("=" * 50)
+    print("RUN METRICS")
+    print("=" * 50)
+    pprint(run_response.metrics)
+
+    print("=" * 50)
+    print("MODEL DETAILS")
+    print("=" * 50)
+    if run_response.metrics and run_response.metrics.details:
+        for model_type, model_metrics_list in run_response.metrics.details.items():
+            print(f"\n{model_type}:")
+            for model_metric in model_metrics_list:
+                pprint(model_metric)
@@ -0,0 +1,49 @@
+"""
+Demonstrates session-level metrics that accumulate across multiple runs.
+"""
+
+from agno.agent import Agent
+from agno.db.postgres import PostgresDb
+from agno.models.openai import OpenAIChat
+from rich.pretty import pprint
+
+# ---------------------------------------------------------------------------
+# Setup
+# ---------------------------------------------------------------------------
+db_url = "postgresql+psycopg://ai:ai@localhost:5532/ai"
+db = PostgresDb(db_url=db_url, session_table="agent_metrics_sessions")
+
+# ---------------------------------------------------------------------------
+# Create Agent
+# ---------------------------------------------------------------------------
+agent = Agent(
+    model=OpenAIChat(id="gpt-4o-mini"),
+    db=db,
+    session_id="session_metrics_demo",
+    add_history_to_context=True,
+)
+
+# ---------------------------------------------------------------------------
+# Run Agent
+# ---------------------------------------------------------------------------
+if __name__ == "__main__":
+    # First run
+    run_output_1 = agent.run("What is the capital of France?")
+    print("=" * 50)
+    print("RUN 1 METRICS")
+    print("=" * 50)
+    pprint(run_output_1.metrics)
+
+    # Second run on the same session
+    run_output_2 = agent.run("What about Germany?")
+    print("=" * 50)
+    print("RUN 2 METRICS")
+    print("=" * 50)
+    pprint(run_output_2.metrics)
+
+    # Session metrics aggregate both runs
+    print("=" * 50)
+    print("SESSION METRICS (accumulated)")
+    print("=" * 50)
+    session_metrics = agent.get_session_metrics()
+    pprint(session_metrics)
@@ -0,0 +1,68 @@
+"""
+Session Summary Metrics
+=============================
+
+When an agent uses a SessionSummaryManager, the summary model's token
+usage is tracked separately under the "session_summary_model" detail key.
+
+This lets you see how many tokens are spent summarizing the session
+versus the agent's own model calls.
+
+The session summary runs after each interaction to maintain a concise
+summary of the conversation so far.
+"""
+
+from agno.agent import Agent
+from agno.db.postgres import PostgresDb
+from agno.models.openai import OpenAIChat
+from agno.session.summary import SessionSummaryManager
+from rich.pretty import pprint
+
+# ---------------------------------------------------------------------------
+# Create Agent
+# ---------------------------------------------------------------------------
+db = PostgresDb(db_url="postgresql+psycopg://ai:ai@localhost:5532/ai")
+
+agent = Agent(
+    model=OpenAIChat(id="gpt-4o-mini"),
+    session_summary_manager=SessionSummaryManager(
+        model=OpenAIChat(id="gpt-4o-mini"),
+    ),
+    enable_session_summaries=True,
+    db=db,
+    session_id="session-summary-metrics-demo",
+)
+
+# ---------------------------------------------------------------------------
+# Run Agent
+# ---------------------------------------------------------------------------
+if __name__ == "__main__":
+    # First run
+    run_response_1 = agent.run("My name is Alice and I work at Google.")
+    print("=" * 50)
+    print("RUN 1 METRICS")
+    print("=" * 50)
+    pprint(run_response_1.metrics)
+
+    # Second run - triggers session summary
+    run_response_2 = agent.run("I also enjoy hiking on weekends.")
+    print("=" * 50)
+    print("RUN 2 METRICS")
+    print("=" * 50)
+    pprint(run_response_2.metrics)
+
+    print("=" * 50)
+    print("MODEL DETAILS (Run 2)")
+    print("=" * 50)
+    if run_response_2.metrics and run_response_2.metrics.details:
+        for model_type, model_metrics_list in run_response_2.metrics.details.items():
+            print(f"\n{model_type}:")
+            for model_metric in model_metrics_list:
+                pprint(model_metric)
+
+    print("=" * 50)
+    print("SESSION METRICS (accumulated)")
+    print("=" * 50)
+    session_metrics = agent.get_session_metrics()
+    if session_metrics:
+        pprint(session_metrics)