bridge2ai
diff --git a/‎data/extracted_by_column/AI_READI/fairhub_d4d.yaml‎
Lines changed: 70 additions & 12 deletions b/‎data/extracted_by_column/AI_READI/fairhub_d4d.yaml‎
Lines changed: 70 additions & 12 deletions
diff --git a/‎data/extracted_by_column/AI_READI/fairhub_d4d_metadata.yaml‎
Lines changed: 39 additions & 0 deletions b/‎data/extracted_by_column/AI_READI/fairhub_d4d_metadata.yaml‎
Lines changed: 39 additions & 0 deletions
@@ -1,15 +1,73 @@
 # D4D Metadata extracted from: fairhub_row13.json
 # Column: AI_READI
-# Validation: Download ✅ success
-# Relevance: ✅ relevant
-# Generated: 2025-09-08 23:30:40
+# Generated: 2025-09-16 18:31:22 (Retry)
+# Status: Fixed failed extraction
 
-id: "2"
-name: "FAIRhub Dataset"
-title: "FAIRhub Dataset Row 13"
-description: "Dataset extracted from FAIRhub.io corresponding to row 13 (dataset_id 2). It is associated with the AI_READI project and is provided as part of FAIRhub's offerings."
-download_url: "https://fairhub.io/datasets/2"
-keywords:
-  - "AI_READI"
-purposes:
-  - response: "This dataset supports the AI_READI project by providing data for AI research and development."
+dataset:
+  name: null
+  dataset_id: "2"
+  dataset_type: "FAIRhub Dataset"
+  url: "https://fairhub.io/datasets/2"
+  project: "AI_READI"
+  source:
+    file: "fairhub_row13.json"
+    row: 13
+  description: null
+  version: null
+  creators: []
+  contributors: []
+  contacts: []
+motivation:
+  rationale: null
+  tasks: []
+  intended_users: []
+  out_of_scope_uses: []
+  funding_sources: []
+composition:
+  instance_count: null
+  instance_types: []
+  data_fields: []
+  label_description: null
+  labeler_description: null
+  sensitive_content: null
+  languages: []
+  derived_from: []
+  additional_notes: null
+collection:
+  provenance_description: null
+  collection_process: null
+  sampling_strategy: null
+  timeframe: null
+  geographic_coverage: null
+  data_sources: []
+  consent: null
+  privacy: null
+  ethical_review: null
+preprocessing:
+  cleaning_operations: null
+  transformations: null
+  annotation_process: null
+  aggregation: null
+  missing_values: null
+  quality_control: null
+use:
+  intended_uses: []
+  prohibited_uses: []
+  known_risks: []
+  performance_metrics: []
+  evaluation_results: []
+distribution:
+  license: null
+  access_terms: null
+  restrictions: null
+  download_url: "https://fairhub.io/datasets/2"
+  citation: null
+  release_date: null
+  versioning_policy: null
+maintenance:
+  owners: []
+  update_frequency: null
+  maintenance_plan: null
+  contact_for_issues: null
+  errata: null
+  feedback_process: null
@@ -0,0 +1,39 @@
+extraction_metadata:
+  timestamp: '2025-09-16T18:31:22.024402Z'
+  extraction_id: 7682ce872a7e
+  extraction_type: failed_extraction_retry
+input_document:
+  filename: fairhub_row13.json
+  relative_path: fairhub_row13.json
+  format: json
+  size_bytes: 107
+  sha256_hash: ac18ebc8a8067ee4cf32cc56f0b71e717c58aefaed6524f3e9a0d9a67dba88e5
+  project_column: AI_READI
+output_document:
+  filename: fairhub_d4d.yaml
+  relative_path: fairhub_d4d.yaml
+  format: yaml
+datasheets_schema:
+  version: 1.0.0
+  url: https://raw.githubusercontent.com/monarch-initiative/ontogpt/main/src/ontogpt/templates/data_sheets_schema.yaml
+  retrieved_at: '2025-09-16T18:31:22.025539Z'
+d4d_agent:
+  version: 1.0.0
+  implementation: pydantic_ai
+  wrapper: fix_failed_extractions.py
+  wrapper_version: 1.0.0
+llm_model:
+  provider: openai
+  model_name: openai:gpt-5
+  model_version: gpt-5
+  temperature: null
+  max_tokens: null
+processing_environment:
+  platform: Darwin
+  python_version: 3.13.4
+  processor_architecture: arm64
+reproducibility:
+  command: python fix_failed_extractions.py
+  environment_variables:
+    OPENAI_API_KEY: required
+  notes: Retry of failed extraction with improved YAML validation