add configs

codelion · codelion · commit 744cf34f4734 · 2025-05-15T21:39:56.000+08:00
diff --git a/README.md b/README.md
@@ -40,24 +40,75 @@ from openevolve import OpenEvolve
 
 # Initialize the system
 evolve = OpenEvolve(
-    initial_program="path/to/initial_program.py",
-    evaluation_function="path/to/evaluator.py",
-    config="path/to/config.yaml"
+    initial_program_path="path/to/initial_program.py",
+    evaluation_file="path/to/evaluator.py",
+    config_path="path/to/config.yaml"
 )
 
 # Run the evolution
-best_program = evolve.run(iterations=1000)
-print(f"Best program found: {best_program.path}")
-print(f"Score: {best_program.score}")
+best_program = await evolve.run(iterations=1000)
+print(f"Best program metrics:")
+for name, value in best_program.metrics.items():
+    print(f"  {name}: {value:.4f}")
 ```
 
+### Command-Line Usage
+
+OpenEvolve can also be run from the command line:
+
+```bash
+python openevolve-run.py path/to/initial_program.py path/to/evaluator.py --config path/to/config.yaml --iterations 1000
+```
+
+## Configuration
+
+OpenEvolve is highly configurable. You can specify configuration options in a YAML file:
+
+```yaml
+# Example configuration
+max_iterations: 1000
+llm:
+  primary_model: "gemini-2.0-flash-lite"
+  secondary_model: "gemini-2.0-flash"
+  temperature: 0.7
+database:
+  population_size: 500
+  num_islands: 5
+```
+
+Sample configuration files are available in the `configs/` directory:
+- `default_config.yaml`: Comprehensive configuration with all available options
+- `matrix_multiplication_config.yaml`: Configuration optimized for matrix multiplication
+- `min_max_distance_config.yaml`: Configuration for geometric optimization
+
+See the [Configuration Guide](configs/default_config.yaml) for a full list of options.
+
 ## Examples
 
 See the `examples/` directory for complete examples of using OpenEvolve on various problems:
-- Matrix multiplication optimization
-- Packing problems
-- Algorithmic discovery
-- Scheduling optimization
+
+### Matrix Multiplication Optimization
+Evolves more efficient matrix multiplication algorithms:
+```bash
+cd examples/matrix_multiplication
+python optimize.py --iterations 100
+```
+
+### Min-Max Distance Optimization
+Finds optimal point configurations that minimize the ratio of maximum to minimum distances:
+```bash
+cd examples/min_max_distance
+python optimize.py --iterations 150 --num-points 16
+```
+
+## Preparing Your Own Problems
+
+To use OpenEvolve for your own problems:
+
+1. **Mark code sections** to evolve with `# EVOLVE-BLOCK-START` and `# EVOLVE-BLOCK-END` comments
+2. **Create an evaluation function** that returns a dictionary of metrics
+3. **Configure OpenEvolve** with appropriate parameters
+4. **Run the evolution** process
 
 ## Citation
 
diff --git a/configs/default_config.yaml b/configs/default_config.yaml
@@ -0,0 +1,108 @@
+# OpenEvolve Default Configuration
+# This file contains all available configuration options with sensible defaults
+# You can use this as a template for your own configuration
+
+# General settings
+max_iterations: 1000                  # Maximum number of evolution iterations
+checkpoint_interval: 50               # Save checkpoints every N iterations
+log_level: "INFO"                     # Logging level (DEBUG, INFO, WARNING, ERROR, CRITICAL)
+log_dir: null                         # Custom directory for logs (default: output_dir/logs)
+random_seed: null                     # Random seed for reproducibility (null = random)
+
+# Evolution settings
+diff_based_evolution: true            # Use diff-based evolution (true) or full rewrites (false)
+allow_full_rewrites: false            # Allow occasional full rewrites even in diff-based mode
+max_code_length: 10000                # Maximum allowed code length in characters
+
+# LLM configuration
+llm:
+  # Primary model (used most frequently)
+  primary_model: "gemini-2.0-flash-lite"
+  primary_model_weight: 0.8           # Sampling weight for primary model
+
+  # Secondary model (used for occasional high-quality generations)
+  secondary_model: "gemini-2.0-flash"
+  secondary_model_weight: 0.2         # Sampling weight for secondary model
+
+  # API configuration
+  api_base: "https://api.openai.com/v1"  # Base URL for API (change for non-OpenAI models)
+  api_key: null                       # API key (defaults to OPENAI_API_KEY env variable)
+
+  # Generation parameters
+  temperature: 0.7                    # Temperature for generation (higher = more creative)
+  top_p: 0.95                         # Top-p sampling parameter
+  max_tokens: 4096                    # Maximum tokens to generate
+
+  # Request parameters
+  timeout: 60                         # Timeout for API requests in seconds
+  retries: 3                          # Number of retries for failed requests
+  retry_delay: 5                      # Delay between retries in seconds
+
+# Prompt configuration
+prompt:
+  template_dir: null                  # Custom directory for prompt templates
+  system_message: "You are an expert coder helping to improve programs through evolution."
+
+  # Number of examples to include in the prompt
+  num_top_programs: 3                 # Number of top-performing programs to include
+  num_diverse_programs: 2             # Number of diverse programs to include
+
+  # Template stochasticity
+  use_template_stochasticity: true    # Use random variations in templates for diversity
+  template_variations:                # Different phrasings for parts of the template
+    improvement_suggestion:
+      - "Here's how we could improve this code:"
+      - "I suggest the following improvements:"
+      - "We can enhance this code by:"
+
+  # Meta-prompting (experimental)
+  use_meta_prompting: false           # Use LLM to generate parts of the prompt
+  meta_prompt_weight: 0.1             # Weight for meta-prompting influence
+
+# Database configuration
+database:
+  # General settings
+  db_path: null                       # Path to persist database (null = in-memory only)
+  in_memory: true                     # Keep database in memory for faster access
+
+  # Evolutionary parameters
+  population_size: 1000               # Maximum number of programs to keep in memory
+  archive_size: 100                   # Size of elite archive
+  num_islands: 5                      # Number of islands for island model
+
+  # Selection parameters
+  elite_selection_ratio: 0.1          # Ratio of elite programs to select
+  exploration_ratio: 0.2              # Ratio of exploration vs exploitation
+  exploitation_ratio: 0.7             # Ratio of exploitation vs random selection
+  diversity_metric: "edit_distance"   # Diversity metric (edit_distance, feature_based)
+
+  # Feature map dimensions for MAP-Elites
+  feature_dimensions:                 # Dimensions for MAP-Elites feature map
+    - "score"                         # Performance score
+    - "complexity"                    # Code complexity (length)
+  feature_bins: 10                    # Number of bins per dimension
+
+# Evaluator configuration
+evaluator:
+  # General settings
+  timeout: 300                        # Maximum evaluation time in seconds
+  max_retries: 3                      # Maximum number of retries for evaluation
+
+  # Resource limits
+  memory_limit_mb: null               # Memory limit for evaluation (null = no limit)
+  cpu_limit: null                     # CPU limit for evaluation (null = no limit)
+
+  # Evaluation strategies
+  cascade_evaluation: true            # Use cascade evaluation to filter bad solutions early
+  cascade_thresholds:                 # Thresholds for advancing to next evaluation stage
+    - 0.5                             # First stage threshold
+    - 0.75                            # Second stage threshold
+    - 0.9                             # Third stage threshold
+
+  # Parallel evaluation
+  parallel_evaluations: 4             # Number of parallel evaluations
+  distributed: false                  # Use distributed evaluation
+
+  # LLM-based feedback (experimental)
+  use_llm_feedback: false             # Use LLM to evaluate code quality
+  llm_feedback_weight: 0.1            # Weight for LLM feedback in final score
diff --git a/configs/matrix_multiplication_config.yaml b/configs/matrix_multiplication_config.yaml
@@ -0,0 +1,69 @@
+# Matrix Multiplication Optimization Configuration
+# This is a specific configuration for optimizing matrix multiplication algorithms
+
+# General settings
+max_iterations: 100                   # Number of iterations for this optimization task
+checkpoint_interval: 10               # Save checkpoints every 10 iterations
+log_level: "INFO"                     # Standard logging level
+random_seed: 42                       # Fixed seed for reproducibility
+
+# Evolution settings
+diff_based_evolution: true            # Use targeted code modifications
+allow_full_rewrites: false            # Don't allow full rewrites for this task
+max_code_length: 5000                 # Limit code length to avoid excessive complexity
+
+# LLM configuration
+llm:
+  primary_model: "gemini-2.0-flash-lite"  # Faster model for most generations
+  primary_model_weight: 0.8
+  secondary_model: "gemini-2.0-flash"     # More powerful model for occasional insights
+  secondary_model_weight: 0.2
+  
+  # Higher temperature encourages more creative optimizations
+  temperature: 0.8
+  top_p: 0.95
+  max_tokens: 4096
+
+# Prompt configuration
+prompt:
+  system_message: "You are an expert algorithmic optimization engineer specializing in numerical computing and matrix operations. Your task is to optimize matrix multiplication algorithms for better performance while maintaining correctness."
+  
+  # Include more top programs to learn from previous successful optimizations
+  num_top_programs: 4
+  num_diverse_programs: 2
+  
+  # Template variations specific to algorithm optimization
+  template_variations:
+    improvement_focus:
+      - "Focus on loop ordering and memory access patterns."
+      - "Consider algorithmic improvements like block-based multiplication."
+      - "Think about SIMD and vectorization opportunities."
+      - "Look for ways to reduce cache misses and improve locality."
+
+# Database configuration
+database:
+  # Smaller population for this focused task
+  population_size: 200
+  archive_size: 20
+  num_islands: 3
+  
+  # More exploitation since we're optimizing a well-known algorithm
+  elite_selection_ratio: 0.2
+  exploitation_ratio: 0.8
+  exploration_ratio: 0.1
+  
+  # Use performance and complexity as feature dimensions
+  feature_dimensions:
+    - "performance"
+    - "complexity"
+
+# Evaluator configuration
+evaluator:
+  # Strict cascade evaluation for matrix multiplication
+  cascade_evaluation: true
+  cascade_thresholds:
+    - 1.0                            # First stage: must be 100% correct
+    - 0.5                            # Second stage: reasonable performance
+  
+  # Parallel evaluation for faster iteration
+  parallel_evaluations: 8
diff --git a/configs/min_max_distance_config.yaml b/configs/min_max_distance_config.yaml
@@ -0,0 +1,66 @@
+# Min-Max Distance Optimization Configuration
+# This is a specific configuration for the geometric optimization problem
+
+# General settings
+max_iterations: 150                  # More iterations for this harder problem
+checkpoint_interval: 15
+log_level: "INFO"
+random_seed: null                    # Use random seeds for more diversity
+
+# Evolution settings
+diff_based_evolution: true
+allow_full_rewrites: true            # Allow occasional full rewrites for this problem
+max_code_length: 3000
+
+# LLM configuration
+llm:
+  primary_model: "gemini-2.0-flash"   # Use more powerful model as primary
+  primary_model_weight: 0.7
+  secondary_model: "gemini-2.0-pro"   # Use most capable model occasionally
+  secondary_model_weight: 0.3
+  
+  # High temperature for creative geometric solutions
+  temperature: 0.9
+  top_p: 0.95
+  max_tokens: 4096
+
+# Prompt configuration
+prompt:
+  system_message: "You are an expert in computational geometry and mathematical optimization. Your task is to design algorithms that find optimal point configurations with minimal ratio between maximum and minimum pairwise distances."
+  
+  num_top_programs: 3
+  num_diverse_programs: 3
+  
+  template_variations:
+    improvement_focus:
+      - "Consider known geometric patterns like Fibonacci spirals or regular polygons."
+      - "Think about symmetry and how it affects the distance ratio."
+      - "Consider optimization techniques like simulated annealing or gradient descent."
+      - "Explore perturbation methods that maintain approximately equal minimum distances."
+
+# Database configuration
+database:
+  # Large population for diverse geometric solutions
+  population_size: 500
+  archive_size: 50
+  num_islands: 7
+  
+  # Balance exploration and exploitation
+  elite_selection_ratio: 0.15
+  exploitation_ratio: 0.6
+  exploration_ratio: 0.25
+  
+  # Use score and stability as feature dimensions
+  feature_dimensions:
+    - "ratio_score"
+    - "stability"
+
+# Evaluator configuration
+evaluator:
+  # Less strict cascade for this problem
+  cascade_evaluation: true
+  cascade_thresholds:
+    - 0.3                            # First stage: modest performance
+    
+  # Multiple parallel evaluations for different random seeds
+  parallel_evaluations: 6