OJHunt Lite

A lightweight async Python tool for querying Online Judge (OJ) statistics across multiple platforms. Track your accepted problems (AC) and total submissions from competitive programming platforms.

Features

Self-contained crawlers: Each crawler can be used independently with minimal dependencies
Async/await support: Built on aiohttp for efficient concurrent requests
Command-line interface: Query multiple OJ platforms simultaneously
Lightweight: Only depends on aiohttp and beautifulsoup4 libraries
Easy to maintain: Simple, readable code with consistent interfaces
BSD-2 Licensed: Free to use and modify

Quick Example

$ uv run ojhunt.py tourist@codeforces tourist@atcoder
Querying CodeForces...
Querying AtCoder...
AtCoder done (1051 solved, 1.25s)
CodeForces done (2962 solved, 2.78s)

Total: 2962 solved / 6437 submissions

================================================================================
Crawler              Username             Solved     Submissions  Status
================================================================================
CodeForces           tourist              2962       5386         OK (2.78s)
AtCoder              tourist              1051       1051         OK (1.25s)
================================================================================
Completed: 2 OK, 0 failed (2.78s total)

Installation

Using uv (recommended)

git clone https://github.com/Liu233w/ojhunt-lite
cd ojhunt-lite
uv sync

Using Container (Podman/Docker)

Pre-built images are available at ghcr.io/liu233w/ojhunt-lite.

CLI mode:

# Query single platform
podman run --rm ghcr.io/liu233w/ojhunt-lite tourist@codeforces

# Query multiple platforms
podman run --rm ghcr.io/liu233w/ojhunt-lite tourist@codeforces tourist@atcoder

# Use default username for multiple queries
podman run --rm ghcr.io/liu233w/ojhunt-lite -d tourist -- codeforces atcoder

Web mode:

# Start web server on port 8080
podman run -p 8080:8080 ghcr.io/liu233w/ojhunt-lite

# With VJudge credentials
podman run -p 8080:8080 -e VJUDGE_USERNAME=user -e VJUDGE_PASSWORD=pass ghcr.io/liu233w/ojhunt-lite

Replace podman with docker if you prefer Docker. Both commands work identically.

Usage

Command Line Interface

Run ojhunt --help to see all available options.

Quick examples:

# Query single crawler
uv run ojhunt.py tourist@codeforces

# Query multiple crawlers
uv run ojhunt.py tourist@codeforces tourist@atcoder

# Use default username for multiple queries
uv run ojhunt.py -d tourist -- codeforces atcoder

# Query all platforms
uv run ojhunt.py -d tourist -a

# List available crawlers with details
uv run ojhunt.py --list

# Query yourself on VJudge (login and query same user)
uv run ojhunt.py myuser:mypass@vjudge

# Query someone else on VJudge (login as you, query them)
uv run ojhunt.py -l myuser:mypass@vjudge -- target_user@vjudge

Login-Required Crawlers

Some crawlers (like VJudge) require authentication to query any user's statistics. You can provide credentials in two ways:

1. Embedded credentials (query yourself):

# Login as yourself, query your own stats
uv run ojhunt.py myuser:mypass@vjudge

2. Using -l flag (query anyone):

# Login as yourself, query someone else
uv run ojhunt.py -l myuser:mypass@vjudge -- target_user@vjudge

# Multiple login-required crawlers
uv run ojhunt.py -l user1:pass1@vjudge -l user2:pass2@otheroj -- target1@vjudge target2@otheroj

Parsing rules for user:pass@crawler:

First : separates username from password
Last @ separates credentials from crawler name
Examples:
- user:pass@vjudge → username=user, password=pass, crawler=vjudge
- user:p@ss:word@vjudge → username=user, password=p@ss:word, crawler=vjudge

Error cases:

Querying a login-required crawler without credentials → error
Using both embedded password and -l flag for same crawler → error (duplicate credentials)
Providing credentials for a crawler that doesn't need them → error

Using Crawlers Directly in Your Code

Each crawler is self-contained and can be imported directly. All crawlers are async functions:

import asyncio
from crawlers.codeforces import query

async def main():
    async with aiohttp.ClientSession() as session:
        result = await query(session, "tourist")
        print(f"Solved: {result['solved']}")
        print(f"Submissions: {result['submissions']}")
        print(f"Problems: {result['solved_list']}")

asyncio.run(main())

Using with aiohttp session for better performance:

import asyncio
import aiohttp
from crawlers import codeforces, atcoder, hdu

async def main():
    async with aiohttp.ClientSession() as session:
        # Crawlers will reuse the session
        results = await asyncio.gather(
            codeforces.query(session, "tourist"),
            atcoder.query(session, "tourist"),
            hdu.query(session, "vjudge4"),
        )
        for result in results:
            print(result)

asyncio.run(main())

Web Interface

Development server (with auto-reload):

uv run fastapi dev web/app.py --port 8080

Production server (multi-worker):

uv run fastapi run web/app.py --port 8080 --workers 4

The web interface will be available at http://127.0.0.1:8080

For VJudge support, set environment variables:

VJUDGE_USERNAME=user VJUDGE_PASSWORD=pass uv run fastapi dev web/app.py --port 8080

API Documentation

Interactive API documentation is available when the web server is running:

Swagger UI: http://127.0.0.1:8080/docs
ReDoc: http://127.0.0.1:8080/redoc

Example API requests:

# List all available crawlers
curl http://127.0.0.1:8080/api/crawlers/

# Query a user on a specific platform
curl http://127.0.0.1:8080/api/crawlers/codeforces/tourist

Supported Platforms

See crawlers module

Archived Crawlers

Some crawlers have been archived due to site closures or technical issues. See archived_crawlers for details.

Return Format

All crawlers return a dictionary with the following structure:

{
    "solved": int,           # Number of accepted problems
    "submissions": int,      # Total number of submissions
    "solved_list": list|None # List of problem IDs (may be None for some platforms)
}

Development

Running Tests

# Run all tests
pytest

# Run specific crawler tests
pytest crawlers/codeforces_test.py

# Run with verbose output
pytest -v

# Exclude network-dependent tests (for CI environments)
pytest -m "not network"

# Run only network tests
pytest -m network

Testing Login-Required Crawlers

For crawlers that require authentication (e.g., VJudge), set environment variables before running tests:

# Set credentials for VJudge tests
export VJUDGE_USERNAME=your_username
export VJUDGE_PASSWORD=your_password

# Run VJudge tests
pytest crawlers/vjudge_test.py

Tests will be automatically skipped if the required environment variables are not set.

Adding a New Crawler

Create crawlers/your_crawler.py with BSD-2 license header (year 2026)
Implement the async def query(session: aiohttp.ClientSession, username: str, password: Optional[str] = None) -> dict function
Add __crawler_meta__ dictionary with platform metadata
Create crawlers/your_crawler_test.py with pytest-asyncio tests
The crawler will be automatically discovered by the CLI

For API-based crawlers:

"""BSD-2 License header..."""
import aiohttp
from typing import Dict, List, Union, Optional

__crawler_meta__ = {
    'title': 'Your OJ',
    'description': 'Description here',
    'url': 'https://your-oj.com/',
}

async def query(session: aiohttp.ClientSession, username: str, password: Optional[str] = None) -> Dict[str, Union[int, List[str], None]]:
    if not username or not username.strip():
        raise ValueError('Please enter username')

    username = username.strip()

    async with session.get(
        f'https://your-oj.com/api/user/{username}',
        timeout=aiohttp.ClientTimeout(total=30)
    ) as response:
        if response.status == 404:
            raise ValueError('The user does not exist')
        data = await response.json()

    return {
        'solved': data['solved'],
        'submissions': data['submissions'],
        'solved_list': data.get('problems', None),
    }

For login-required crawlers (e.g., VJudge):

__crawler_meta__ = {
    'title': 'Your OJ',
    'description': 'Description here',
    'url': 'https://your-oj.com/',
    'requires_login': True,  # Any valid account can query any user
}

async def query(
    session: aiohttp.ClientSession,
    username: str,
    password: Optional[str] = None,      # Embedded: user:pass@crawler
    login_user: Optional[str] = None,    # From -l flag
    login_password: Optional[str] = None,
) -> Dict[str, Union[int, List[str], None]]:
    # Determine which credentials to use
    if login_user and login_password:
        # Using -l flag: login as one user, query another
        actual_user, actual_pass = login_user, login_password
    elif password:
        # Using embedded password: login as target user
        actual_user, actual_pass = username, password
    else:
        raise ValueError('Login credentials required')
    # ... use actual_user and actual_pass for authentication

For HTML-scraping crawlers:

"""BSD-2 License header..."""
import aiohttp
from selectolax.lexbor import LexborHTMLParser
from typing import Dict, List, Union, Optional

__crawler_meta__ = {
    'title': 'Your OJ',
    'description': 'Description here',
    'url': 'https://your-oj.com/',
}

async def query(session: aiohttp.ClientSession, username: str, password: Optional[str] = None) -> Dict[str, Union[int, List[str]]]:
    if not username or not username.strip():
        raise ValueError('Please enter username')

    username = username.strip()

    async with session.get(
        f'https://your-oj.com/user/{username}',
        timeout=aiohttp.ClientTimeout(total=30)
    ) as response:
        if response.status == 404:
            raise ValueError('The user does not exist')
        html = await response.text()

    doc = LexborHTMLParser(html)

    # Use PyQuery for maintainable HTML parsing
    solved = doc.css_first('span.solved-count').text().strip()
    submissions = doc.css_first('span.submission-count').text().strip()

    # Extract problem list
    problem_links = doc.css('.problem-list a.problem-id')
    solved_list = [link.text().strip() for link in problem_links]

    return {
        'solved': solved,
        'submissions': submissions,
        'solved_list': solved_list,
    }

License

BSD 2-Clause License - See individual crawler files for full license text.

Credits

This is a lightweight Python rewrite of OJHunt (acm-statistics), originally inspired by 西北工业大学ACM查询系统 (npuacm.info) by Jiduo Zhang.

OJHunt Lite provides both CLI and web interfaces for querying Online Judge statistics.

Special thanks to test account providers: @leoloveacm, @2013300262

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.github/workflows		.github/workflows
.idea		.idea
archived_crawlers		archived_crawlers
cli		cli
crawlers		crawlers
web		web
.gitignore		.gitignore
.python-version		.python-version
AGENTS.md		AGENTS.md
Containerfile		Containerfile
GOAL.md		GOAL.md
LICENSE		LICENSE
README.md		README.md
docker-entrypoint.sh		docker-entrypoint.sh
ojhunt.py		ojhunt.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OJHunt Lite

Features

Quick Example

Installation

Using uv (recommended)

Using Container (Podman/Docker)

Usage

Command Line Interface

Login-Required Crawlers

Using Crawlers Directly in Your Code

Web Interface

API Documentation

Supported Platforms

Archived Crawlers

Return Format

Development

Running Tests

Testing Login-Required Crawlers

Adding a New Crawler

License

Credits

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

OJHunt Lite

Features

Quick Example

Installation

Using uv (recommended)

Using Container (Podman/Docker)

Usage

Command Line Interface

Login-Required Crawlers

Using Crawlers Directly in Your Code

Web Interface

API Documentation

Supported Platforms

Archived Crawlers

Return Format

Development

Running Tests

Testing Login-Required Crawlers

Adding a New Crawler

License

Credits

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages