TAPIP3D: Tracking Any Point in Persistent 3D Geometry

Bowei Zhang^1,2*, Lei Ke¹*, Adam W. Harley³, Katerina Fragkiadaki¹

¹Carnegie Mellon University ²Peking University ³Stanford University

* Equal Contribution

Overview

TAPIP3D is a method for long-term feed-forward 3D point tracking in monocular RGB and RGB-D video sequences. It introduces a 3D feature cloud representation that lifts image features into a persistent world coordinate space, canceling out camera motion and enabling accurate trajectory estimation across frames.

Installation

Install from source

You can install the package directly from source:

git clone https://github.com/tapip3d/tapip3d.git
cd tapip3d
pip install -e .

Install in development mode

For development, install with optional dependencies:

pip install -e ".[dev]"

Usage

As a Package

After installation, you can use TAPIP3D in your Python code:

import tapip3d

# Run inference on a video file
result_path = tapip3d.run_inference(
    input_path="path/to/your/video.mp4",
    checkpoint="path/to/checkpoint.pth",
    output_dir="outputs/my_results",
    device="cuda",
    num_iters=6,
    resolution_factor=2
)

print(f"Results saved to: {result_path}")

# Visualize the results
tapip3d.visualize(result_path, open_browser=True)

Command Line Interface

The package also provides command-line tools:

# Run inference
tapip3d-inference path/to/video.mp4 --checkpoint path/to/checkpoint.pth --output_dir outputs

# Visualize results
tapip3d-visualize path/to/results.npz --port 8080

Function Parameters

`run_inference` Function

The run_inference function accepts the following parameters:

input_path (str): Path to input video (.mp4, .avi, .mov, .webm) or npz file
output_dir (str, optional): Directory to save results (default: "outputs/inference")
checkpoint (str, optional): Path to model checkpoint
device (str, optional): Device to run inference on (default: "cuda")
num_iters (int, optional): Number of iterations for inference (default: 6)
support_grid_size (int, optional): Grid size for support points (default: 16)
num_threads (int, optional): Number of threads for parallel processing (default: 8)
resolution_factor (int, optional): Resolution scaling factor (default: 2)
vis_threshold (float, optional): Visibility threshold (default: 0.9)
depth_model (str, optional): Depth model to use if depths are not provided (default: "moge")

`visualize` Function

The visualize function accepts the following parameters:

npz_file (str or Path): Path to the input .result.npz file
width (int, optional): Target width for visualization (default: 256)
height (int, optional): Target height for visualization (default: 192)
fps (int, optional): Base frame rate for playback (default: 4)
port (int, optional): Port to serve on (default: random available port)
open_browser (bool, optional): Whether to automatically open browser (default: True)
block (bool, optional): Whether to block until server is stopped (default: True)

Supported Input Formats

Video files: .mp4, .avi, .mov, .webm
NPZ files with pre-computed depths and camera parameters

Output

The function returns a Path object pointing to the saved results NPZ file containing:

video: Original video frames
depths: Depth maps
intrinsics: Camera intrinsic parameters
extrinsics: Camera extrinsic parameters
coords: Tracked 3D coordinates
visibs: Visibility information
query_points: Query points used for tracking

License

This project is licensed under the Apache License 2.0. See the LICENSE file for details.

Citation

If you use this code in your research, please cite:

@misc{tapip3d,
  title={TAPIP3D: 3D Point Tracking and Inference},
  author={TAPIP3D Team},
  url={https://tapip3d.github.io/},
  year={2024}
}

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
demo_inputs		demo_inputs
media		media
tapip3d		tapip3d
.gitignore		.gitignore
LICENSE		LICENSE
PACKAGE_SETUP.md		PACKAGE_SETUP.md
README.md		README.md
example_usage.py		example_usage.py
install.sh		install.sh
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TAPIP3D: Tracking Any Point in Persistent 3D Geometry

Overview

Installation

Install from source

Install in development mode

Usage

As a Package

Command Line Interface

Function Parameters

`run_inference` Function

`visualize` Function

Supported Input Formats

Output

License

Citation

About

Uh oh!

Releases

Packages

Languages

License

daniekpo/TAPIP3D

Folders and files

Latest commit

History

Repository files navigation

TAPIP3D: Tracking Any Point in Persistent 3D Geometry

Overview

Installation

Install from source

Install in development mode

Usage

As a Package

Command Line Interface

Function Parameters

run_inference Function

visualize Function

Supported Input Formats

Output

License

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

`run_inference` Function

`visualize` Function

Packages