MCAP 到 LeRobot v2.1

本项目提供将 ROS2 录制的 MCAP 数据集转换为 LeRobot v2.1 训练格式的工具，支持将相机图像合成为视频（MP4 容器，AV1 编码，yuv420p 像素格式，30 FPS），并生成与训练兼容的元数据与分层目录结构。

特性概览

统一采样频率 30 Hz，同步多模态数据
图像直接写入视频，最终转码为 AV1（自动选择 libsvtav1；不可用时回退 libaom-av1）
支持目标分辨率：360p (640x360) 与 720p (1280x720)
输出统一写入 --output/lerobot/ 下的标准分层结构：meta/、data/、videos/
生成训练所需的 info.json、episodes.jsonl、tasks.jsonl、episodes_stats.jsonl

环境要求

操作系统：Linux（建议 Ubuntu 20.04+/22.04）
Python：3.8 及以上
必备系统依赖：
- ffmpeg（需包含 libaom-av1；如包含 libsvtav1，会自动优先使用）
Parquet 引擎：pyarrow 或 fastparquet（必须安装其一以生成 *.parquet）

使用 Conda 管理环境（推荐）

# 创建并激活环境（Python 版本可按需调整）
conda create -n mcap_to_lerobot python=3.10 -y
conda activate mcap_to_lerobot

# 安装 FFmpeg（conda-forge 渠道带 libaom-av1）
conda install -c conda-forge ffmpeg -y
ffmpeg -hide_banner -encoders | grep -i av1  # 应出现 libaom-av1 或 libsvtav1

# 安装常用 Python 依赖（conda 优先安装大件）
conda install -c conda-forge numpy pandas pyarrow opencv tqdm psutil matplotlib -y

# 安装 MCAP 相关（pip）
pip install mcap mcap-ros2-support

# 自检
python -c "import cv2, numpy, pandas, tqdm, psutil; print('Conda OK')"
python -c "import mcap; import mcap_ros2; print('MCAP OK')"

注意：如果 ffmpeg -encoders 中不显示 libaom-av1，请确认使用了 conda-forge 渠道并重新安装 FFmpeg： conda install -c conda-forge ffmpeg --force-reinstall -y

Python 依赖安装（非 Conda）

# 建议在虚拟环境中安装
python3 -m venv .venv
source .venv/bin/activate

pip install -U pip
pip install mcap mcap-ros2-support numpy pandas pyarrow opencv-python tqdm psutil matplotlib

安装系统包：

sudo apt-get update
sudo apt-get install -y ffmpeg

检查是否支持 AV1 编码器：

ffmpeg -hide_banner -encoders | grep -i av1
# 期望至少看到：libaom-av1

如需更快的 AV1 编码（libsvtav1），通常需要自行编译启用；本脚本默认使用 libaom-av1，无需额外编译即可使用。

运行示例

python mcap_to_lerobot.py \
  --input /path/to/your.mcap \
  --output /path/to/out_dir \
  --resolution 720p \
  --no-plot  # 可选：不生成臂与夹爪曲线图

可选参数：

--max-duration <seconds> 限制最大处理时长（秒），默认 0 表示处理完整文件
--resolution {360p,720p} 指定目标分辨率，默认 720p
--no-plot 不生成臂与夹爪曲线图

输出目录结构

转换成功后，--output 下的 lerobot/ 目录中将生成：

lerobot/
  meta/
    info.json
    episodes.jsonl
    tasks.jsonl
    episodes_stats.jsonl
    camera.json          # 若源目录存在则复制；否则跳过

  data/
    chunk-000/
      episode_000000.parquet

  videos/
    chunk-000/
      observation.images.camera_head_rgb/episode_000000.mp4
      observation.images.camera_left_wrist_rgb/episode_000000.mp4
      observation.images.camera_right_wrist_rgb/episode_000000.mp4

视频容器：MP4（mov,mp4）
视频编码：AV1（codec_name=av1，libaom-av1）
像素格式：yuv420p
帧率：30 FPS
分辨率：与 --resolution 一致（默认 1280x720）

视频写入与转码：自动选择编码器（libsvtav1 优先，libaom-av1 回退），像素格式 yuv420p，帧率 30 FPS。

验证输出为 AV1

ffprobe -v error -select_streams v:0 \
  -show_entries stream=codec_name,pix_fmt,avg_frame_rate,height,width,profile \
  -show_entries format=format_name,probe_score \
  -of default=noprint_wrappers=1:nokey=1 \
  /home/kemove/Downloads/mcap_to_lerobot/test/videos/chunk-000/observation.images.head_camera/episode_000000.mp4

期望输出类似：

av1
yuv420p
30/1
1280
720
Main
mov,mp4,m4a,3gp,3g2,mj2
100

工作流程概览

读取 MCAP 并提取消息，优先使用 ROS header.stamp 时间戳，回退到 log_time
解码 sensor_msgs/CompressedImage 为帧（BGR），统一缩放到目标分辨率
写入视频并转码为 AV1（编码器自动选择）
构建训练数据行并生成 Parquet 与元数据（LeRobot v2.1）

常见问题与排查

缺少 ffmpeg 或不含 AV1 编码器：
- 安装：sudo apt-get install ffmpeg
- 检查 AV1 编码器：ffmpeg -hide_banner -encoders | grep -i av1
使用 Conda 时 FFmpeg 优先级：
- 确认路径使用的是 Conda 版本：which ffmpeg 应指向 Conda 环境目录
- 如果仍使用系统 /usr/bin/ffmpeg，请在激活环境后重开终端或运行 hash -r
进度条不显示：确保 tqdm 已安装且 ffprobe 能返回源视频时长；否则转码仍会进行但不显示百分比
Excel 配置未提供：脚本会自动从 MCAP 探测 Topic；如需强制忽略 Excel，使用 --no-excel
缺少 Parquet 引擎：安装 pyarrow 或 fastparquet（至少其一）。示例：conda install -c conda-forge pyarrow -y 或 pip install pyarrow。若出现 Pandas 报错 “Unable to find a usable engine”，说明未安装。
相机命名：当前默认输出键为 observation.images.<camera>，相机名为 head_camera、left_hand_camera、right_hand_camera；若需自定义命名，可在后续版本中添加 CLI 参数支持

性能优化建议（不改变编码方式）

自动选择 libsvtav1（更快）或回退 libaom-av1，并开启多线程
如需更快：在 FFmpeg 启用 libsvtav1；或提高 cpu-used（libaom-av1）
如需更小体积：提高 crf（例如 32），会略微牺牲画质

许可与版权

使用需遵循原数据与依赖库的许可证要求

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
test/GroceryStore_Restrocking_Fallen_20251012_102105_192_168_10_124/GroceryStore_Restrocking_Fallen_20251012_102105_192_168_10_124_0		test/GroceryStore_Restrocking_Fallen_20251012_102105_192_168_10_124/GroceryStore_Restrocking_Fallen_20251012_102105_192_168_10_124_0
README.md		README.md
README_transcode_video.md		README_transcode_video.md
mcap_to_lerobot.py		mcap_to_lerobot.py
transcode_video.py		transcode_video.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MCAP 到 LeRobot v2.1

特性概览

环境要求

使用 Conda 管理环境（推荐）

Python 依赖安装（非 Conda）

运行示例

输出目录结构

验证输出为 AV1

工作流程概览

常见问题与排查

性能优化建议（不改变编码方式）

许可与版权

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

MCAP 到 LeRobot v2.1

特性概览

环境要求

使用 Conda 管理环境（推荐）

Python 依赖安装（非 Conda）

运行示例

输出目录结构

验证输出为 AV1

工作流程概览

常见问题与排查

性能优化建议（不改变编码方式）

许可与版权

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages