Rate Limiting: A Comprehensive Guide

A complete guide to rate limiting algorithms, implementations, and best practices for building robust APIs and distributed systems.

📚 Table of Contents

Introduction
Why Rate Limiting?
Core Concepts
Algorithms
Implementation Examples
Best Practices
Distributed Rate Limiting
Testing
Resources

Introduction

Rate limiting is a critical technique for controlling the rate of requests sent or received by a system. It helps protect services from abuse, ensures fair resource allocation, and maintains system stability under high load.

This repository provides:

Detailed explanations of rate limiting algorithms
Production-ready code examples in multiple languages
Best practices and patterns
Distributed system considerations
Testing strategies

Why Rate Limiting?

Rate limiting serves several crucial purposes:

DoS Protection: Prevent abuse and denial-of-service attacks
Cost Control: Manage infrastructure costs by controlling usage
Fair Usage: Ensure equitable resource distribution among users
Service Quality: Maintain consistent performance for all users
API Monetization: Enable tiered pricing models
Resource Management: Protect downstream services and databases

Core Concepts

Key Terminology

Rate: Maximum number of requests allowed in a time window
Window: Time period for measuring the rate (e.g., per second, per minute)
Identifier: Key used to track rate (e.g., user ID, IP address, API key)
Quota: Total allowance over a longer period
Burst: Temporary spike in traffic above the normal rate

Common Response Patterns

When a rate limit is exceeded, systems typically:

Return HTTP 429 (Too Many Requests)
Include headers: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset
Optionally include Retry-After header

Algorithms

This repository covers the following rate limiting algorithms:

1. Token Bucket

Algorithm Details
Implementation
Best for: Smooth traffic with occasional bursts

2. Leaky Bucket

Algorithm Details
Implementation
Best for: Enforcing strict output rates

3. Fixed Window Counter

Algorithm Details
Implementation
Best for: Simple implementation, lower memory usage

4. Sliding Window Log

Algorithm Details
Implementation
Best for: Precise rate limiting without boundary issues

5. Sliding Window Counter

Algorithm Details
Implementation
Best for: Balance between accuracy and efficiency

6. Concurrent Requests Limiter

Algorithm Details
Implementation
Best for: Limiting simultaneous active requests

Implementation Examples

Code examples are provided in multiple languages:

Typescript: Express middleware, Redis-based
Python: Using Redis, in-memory implementations

Each implementation includes:

Complete working code
Unit tests
Performance benchmarks
Configuration options

Best Practices

Design Principles

Choose the right algorithm for your use case
Communicate limits clearly through headers
Implement graceful degradation
Monitor and alert on rate limit hits
Make limits configurable without code changes
Consider different dimensions: per-user, per-IP, per-endpoint

Production Considerations

Use distributed rate limiting for multi-instance deployments
Implement circuit breakers alongside rate limits
Cache rate limit decisions when possible
Log rate limit violations for analysis
Provide webhooks or notifications for quota exhaustion

Distributed Rate Limiting

When running multiple application instances, you need distributed rate limiting:

Solutions

Redis-based: Centralized counter storage
Memcached: Simple distributed caching
Dedicated Services: Kong, Envoy, API Gateway
Custom Solutions: Consistent hashing, gossip protocols

See Distributed Rate Limiting Guide for details.

Testing

Testing Strategies

Load testing to verify limits
Unit tests for algorithm correctness
Integration tests for distributed scenarios
Chaos testing for failure scenarios

See Testing Guide for examples.

Directory Structure

.
├── README.md
├── docs/
│   ├── algorithms/
│   │   ├── token-bucket.md           ⭐ Complete token bucket guide
│   │   ├── leaky-bucket.md           ⭐ Complete leaky bucket guide
│   │   ├── fixed-window.md           ⭐ Complete fixed window guide
│   │   ├── sliding-window-log.md     ⭐ Complete sliding window log guide
│   │   ├── sliding-window-counter.md ⭐ Complete sliding window counter guide
│   │   └── concurrent-requests.md    ⭐ Concurrent requests limiter guide
│   ├── algorithm-comparison.md       ⭐ Detailed algorithm comparison
│   ├── getting-started.md            ⭐ Quick start guide
│   ├── distributed.md                ⭐ Distributed rate limiting guide
│   ├── best-practices.md             ⭐ Production best practices
│   └── testing.md                    ⭐ Comprehensive testing guide
├── implementations/
│   ├── typescript/
│   │   ├── rate-limiter.ts           ⭐ All 6 algorithms in TypeScript
│   │   ├── express-middleware.ts     ⭐ Express.js middleware
│   │   ├── redis-adapter.ts          ⭐ Redis distributed limiter
│   │   ├── examples.ts               ⭐ 12+ usage examples
│   │   ├── rate-limiter.test.ts      ⭐ Complete test suite
│   │   ├── package.json              ⭐ NPM configuration
│   │   └── tsconfig.json             ⭐ TypeScript config
│   └── python/
│       ├── rate_limiter.py           ⭐ All algorithms in Python
│       └── redis_rate_limiter.py     ⭐ Redis implementation
├── examples/
│   ├── api-gateway/
│   │   └── server.ts                 ⭐ Complete API gateway example
│   ├── microservices/
│   │   └── services.ts               ⭐ Microservices architecture example
│   └── web-application/
│       └── app.ts                    ⭐ Web application example
└── benchmarks/
    └── index.ts                      ⭐ Performance benchmarks

Resources

Articles & Papers

Tools & Libraries

redis-cell - Redis module for rate limiting
express-rate-limit - Node.js middleware
golang.org/x/time/rate - Go rate limiter

Contributing

Contributions are welcome (Need more Python implementations)

License

MIT License - see LICENSE file for details.

⭐ Star this repo if you find it helpful!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Rate Limiting: A Comprehensive Guide

📚 Table of Contents

Introduction

Why Rate Limiting?

Core Concepts

Key Terminology

Common Response Patterns

Algorithms

1. Token Bucket

2. Leaky Bucket

3. Fixed Window Counter

4. Sliding Window Log

5. Sliding Window Counter

6. Concurrent Requests Limiter

Implementation Examples

Best Practices

Design Principles

Production Considerations

Distributed Rate Limiting

Solutions

Testing

Testing Strategies

Directory Structure

Resources

Articles & Papers

Tools & Libraries

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
benchmarks		benchmarks
docs		docs
examples		examples
implementations		implementations
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
tsconfig.json		tsconfig.json

Folders and files

Latest commit

History

Repository files navigation

Rate Limiting: A Comprehensive Guide

📚 Table of Contents

Introduction

Why Rate Limiting?

Core Concepts

Key Terminology

Common Response Patterns

Algorithms

1. Token Bucket

2. Leaky Bucket

3. Fixed Window Counter

4. Sliding Window Log

5. Sliding Window Counter

6. Concurrent Requests Limiter

Implementation Examples

Best Practices

Design Principles

Production Considerations

Distributed Rate Limiting

Solutions

Testing

Testing Strategies

Directory Structure

Resources

Articles & Papers

Tools & Libraries

Contributing

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages