Architecture Overview

This document outlines the architecture and design decisions for the CoW Performance Testing Suite.

System Overview

The CoW Performance Testing Suite is designed as an independent, Python-based tool for comprehensive performance testing of the CoW Protocol Playground. The system operates primarily in fork mode, using Anvil to fork mainnet state for realistic testing.

High-Level Architecture

┌─────────────────────────────────────────────────────────────────┐
│                      CLI Interface (Typer)                       │
│                    cow-perf [command] [options]                  │
└───────────────────────────┬─────────────────────────────────────┘
                            │
        ┌───────────────────┼───────────────────┐
        │                   │                   │
        ▼                   ▼                   ▼
┌───────────────┐  ┌────────────────┐  ┌──────────────────┐
│   Scenario    │  │  Benchmarking  │  │     Metrics      │
│  Management   │  │   & Reporting  │  │   & Monitoring   │
└───────┬───────┘  └────────┬───────┘  └────────┬─────────┘
        │                   │                    │
        └───────────────────┼────────────────────┘
                            ▼
                ┌─────────────────────┐
                │  Load Generation    │
                │  - Order Factory    │
                │  - Trader Pool      │
                │  - Strategies       │
                └──────────┬──────────┘
                           │
                           ▼
        ┌──────────────────────────────────────┐
        │    CoW Protocol Services (Docker)     │
        │  ┌────────────┐  ┌─────────────┐    │
        │  │ Orderbook  │  │  Autopilot  │    │
        │  │    API     │  │   Driver    │    │
        │  └────────────┘  │   Solver    │    │
        │                  └─────────────┘    │
        └──────────────────┬───────────────────┘
                           │
                           ▼
                ┌──────────────────┐
                │  Anvil Fork Mode │
                │  (Mainnet State) │
                └──────────────────┘

Core Components

1. CLI Interface (`cli/`)

Responsibility: User interaction and command orchestration

Design:

Built with Typer for rich CLI experience
Commands: run, scenarios, baselines, config
Handles argument parsing and validation
Provides progress feedback and results display

Key Classes:

PerformanceTestCLI: Main CLI application
Command handlers for each subcommand

2. Load Generation (`load_generation/`)

Responsibility: Generate and submit orders to the orderbook

Components:

Order Factory: Creates CoW Protocol compatible orders
- Supports market and limit orders
- Configurable token pairs and amounts
- EIP-712 signing
Trader Pool: Manages test accounts
- Account generation and funding
- Signing operations
- Balance tracking
Submission Strategies: Control order submission patterns
- Constant rate
- Burst patterns
- Ramp-up/ramp-down
- Spike patterns
- Poisson distribution

Key Design Decisions:

Asynchronous architecture using asyncio for concurrent operations
Connection pooling for API requests
Rate limiting to prevent overwhelming the system

3. Benchmarking (`benchmarking/`)

Responsibility: Performance measurement and analysis

Components:

Metrics Collector: Captures performance data
- Order lifecycle tracking
- API response times
- Resource utilization
Baseline Manager: Stores and retrieves performance baselines
- Git-integrated versioning
- JSON storage format
- Metadata tracking
Comparison Engine: Analyzes performance changes
- Statistical comparison
- Regression detection
- Severity classification

Key Design Decisions:

In-memory metrics storage with periodic export
Percentile-based analysis (P50, P90, P95, P99)
Statistical significance testing for regressions

4. Metrics (`metrics/`)

Responsibility: Metrics collection, aggregation, and export

Components:

Order Lifecycle Tracker: Monitors orders from creation to settlement
API Metrics: Tracks API performance
Resource Monitor: Monitors Docker container resources
Prometheus Exporter: Exposes metrics in Prometheus format

Key Design Decisions:

Real-time metrics updates
Thread-safe concurrent access
Efficient data structures (circular buffers)
Prometheus-compatible metric naming

5. Scenarios (`scenarios/`)

Responsibility: Test scenario configuration and execution

Components:

Scenario Loader: Loads and validates scenario configurations
Scenario Executor: Orchestrates test execution
Configuration System: Flexible YAML-based configuration
- Template support
- Inheritance/composition
- Environment variable substitution

Key Design Decisions:

Declarative scenario definitions
Validation with Pydantic
Scenario reusability and composition

Data Flow

Test Execution Flow

1. User runs CLI command
   ↓
2. Load scenario configuration
   ↓
3. Initialize components:
   - Trader pool
   - Order factory
   - Metrics collector
   - Resource monitor
   ↓
4. Execute submission strategy:
   - Generate orders
   - Sign with traders
   - Submit to orderbook API
   - Track order lifecycle
   ↓
5. Collect metrics:
   - Order states
   - API responses
   - Resource usage
   ↓
6. Generate reports:
   - Summary statistics
   - Comparison (if baseline)
   - Export formats (text, JSON, CSV)
   ↓
7. Save baseline (optional)

Metrics Collection Flow

Order Creation
   ↓
Order Submission → API Metrics
   ↓
Orderbook Acceptance
   ↓
Order Filling → Settlement Metrics
   ↓
Settlement Completion
   ↓
Aggregation & Export → Prometheus

Technology Stack

Core Technologies

Python 3.11+: Modern Python with type hints and async support
Typer: CLI framework
Pydantic: Data validation and settings management
aiohttp: Async HTTP client
web3.py: Ethereum interactions
eth-account: Transaction signing

Testing & Quality

pytest: Testing framework
pytest-asyncio: Async test support
black: Code formatting
ruff: Fast Python linter
mypy: Static type checking

DevOps

Poetry: Dependency management
Docker: Containerization
GitHub Actions: CI/CD
pre-commit: Git hooks

Design Principles

1. Asynchronous First

All I/O operations (API calls, file operations) use async/await for maximum concurrency and throughput.

2. Type Safety

Comprehensive type hints throughout the codebase, enforced by mypy in strict mode.

3. Configuration over Code

Test scenarios are defined in YAML configuration files, not hardcoded in Python.

4. Separation of Concerns

Clear boundaries between load generation, metrics collection, benchmarking, and reporting.

5. Testability

Components are designed for easy unit testing with dependency injection and mocking.

6. Observability

Comprehensive logging, metrics export, and progress feedback for visibility into test execution.

Fork Mode Architecture

Environment Setup

┌──────────────────────────────────────────────────┐
│           Docker Compose Environment              │
│                                                   │
│  ┌─────────────┐     ┌──────────────┐           │
│  │   Anvil     │────▶│  Orderbook   │           │
│  │ (Fork Mode) │     │     API      │           │
│  └─────────────┘     └──────┬───────┘           │
│         ▲                    │                   │
│         │            ┌───────▼────────┐          │
│         │            │   Autopilot    │          │
│    Archive Node      │     Driver     │          │
│    (External)        │     Solver     │          │
│         │            └────────────────┘          │
│         │                                        │
│  ┌──────▼──────────────────────────────────┐   │
│  │   Performance Testing Suite Container    │   │
│  │   (runs cow-perf CLI)                    │   │
│  └──────────────────────────────────────────┘   │
│                                                   │
│  ┌──────────────┐     ┌──────────────┐          │
│  │  Prometheus  │────▶│   Grafana    │          │
│  └──────────────┘     └──────────────┘          │
└──────────────────────────────────────────────────┘

Key Characteristics

Realistic State: Tests against actual mainnet state at specific block
Deterministic: Same fork point produces consistent results
Isolated: No mainnet transactions, no gas costs
Fast: Instant mining, no block delays

Extension Points

Custom Submission Strategies

Implement SubmissionStrategy interface:

class CustomStrategy(SubmissionStrategy):
    async def generate_submission_times(self, duration: int):
        # Your implementation
        pass

Custom Metrics

Add to MetricsCollector:

def collect_custom_metric(self, name: str, value: float):
    self.custom_metrics[name] = value

Custom Scenarios

Create YAML scenario files in configs/scenarios/.

Performance Considerations

Scalability

Supports up to 100 concurrent traders
Throughput: 100+ orders/second (hardware dependent)
Metrics overhead: <5% of CPU

Resource Usage

Memory: ~500MB base + ~10MB per concurrent trader
CPU: Scales with order rate and number of traders
Network: Depends on API response sizes

Optimization Strategies

Connection pooling
Batch operations where possible
Efficient data structures
Lazy evaluation of derived metrics

Future Enhancements

Planned Features

Historical trend analysis
Advanced statistical analysis (time series forecasting)
Distributed load generation (multiple test runners)
Real-time dashboard updates
Custom reporter plugins

FilesExpand file tree

architecture.md

Latest commit

History

architecture.md

File metadata and controls

Architecture Overview

System Overview

High-Level Architecture

Core Components

1. CLI Interface (cli/)

2. Load Generation (load_generation/)

3. Benchmarking (benchmarking/)

4. Metrics (metrics/)

5. Scenarios (scenarios/)

Data Flow

Test Execution Flow

Metrics Collection Flow

Technology Stack

Core Technologies

Testing & Quality

DevOps

Design Principles

1. Asynchronous First

2. Type Safety

3. Configuration over Code

4. Separation of Concerns

5. Testability

6. Observability

Fork Mode Architecture

Environment Setup

Key Characteristics

Extension Points

Custom Submission Strategies

Custom Metrics

Custom Scenarios

Performance Considerations

Scalability

Resource Usage

Optimization Strategies

Future Enhancements

Planned Features

Potential Improvements

Security Considerations

Maintenance

Code Organization

Documentation

References

1. CLI Interface (`cli/`)

2. Load Generation (`load_generation/`)

3. Benchmarking (`benchmarking/`)

4. Metrics (`metrics/`)

5. Scenarios (`scenarios/`)