Modify Auto Domain for RegularTimeseries (#109)

AlexandreAndr · web-flow · commit dedd91fa1d2c · 2026-03-25T12:00:37.000-04:00
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -33,6 +33,8 @@ The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 ### Changed
 - Change minimum python version to 3.10 ([#93](https://github.com/neuro-galaxy/temporaldata/pull/93))
 - Optimized performance of `Interval.coalesce()` ([#97](https://github.com/neuro-galaxy/temporaldata/pull/97))
+- New auto domain for `RegularTimeseries` to have no impact when doing `rts.slice(rts.domain.start[0], rts.domain.end[-1])` ([#109](https://github.com/neuro-galaxy/temporaldata/pull/109))
+
 
 ## [0.1.3] - 2025-03-21
 ### Added
diff --git a/temporaldata/regular_ts.py b/temporaldata/regular_ts.py
@@ -69,7 +69,7 @@ def __init__(
                 )
             domain = Interval(
                 start=np.array([domain_start]),
-                end=np.array([domain_start + (len(self) - 1) / sampling_rate]),
+                end=np.array([domain_start + len(self) / sampling_rate]),
             )
         self._domain = domain
 
@@ -128,9 +128,7 @@ def _time_to_idx(
         # Determine index and reconstruct the actual timestamp of that sample
         idx = math.ceil(idx_float)
 
-        # For the end index, the reconstruction logic shifts by 1 sample
-        recon_idx = idx if is_start else idx - 1
-        actual_time = domain_start + (recon_idx / self.sampling_rate)
+        actual_time = domain_start + (idx / self.sampling_rate)
 
         return idx, actual_time
 
@@ -285,7 +283,7 @@ def _maybe_first_dim(self):
                 # this is because we are dealing with numerical noise
                 # we know the domain and the sampling rate, we can infer the number of pts
                 domain_length = self.domain.end[-1] - self.domain.start[0]
-                return int(np.round(domain_length * self.sampling_rate)) + 1
+                return int(np.round(domain_length * self.sampling_rate))
 
             # otherwise nothing was loaded, return the first dim of the h5py dataset
             return self.__dict__[self.keys()[0]].shape[0]
diff --git a/tests/test_data.py b/tests/test_data.py
@@ -1,16 +1,18 @@
-import pytest
-import os
 import copy
+import logging
+import os
+import tempfile
+
 import h5py
 import numpy as np
-import tempfile
-import logging
+import pytest
+
 from temporaldata import (
     ArrayDict,
+    Data,
+    Interval,
     IrregularTimeSeries,
     RegularTimeSeries,
-    Interval,
-    Data,
 )
 
 
@@ -569,7 +571,7 @@ def test_data_auto_domain():
     )
 
     assert np.allclose(data.domain.start, np.array([0, 5]))
-    assert np.allclose(data.domain.end, np.array([3.996, 6]))
+    assert np.allclose(data.domain.end, np.array([4, 6]))
 
 
 def test_data_save(tmp_path):
diff --git a/tests/test_regular_ts.py b/tests/test_regular_ts.py
@@ -28,38 +28,38 @@ def _test_regulartimeseries(data):
         assert len(data) == 100
 
         assert data.domain.start[0] == 0.0
-        assert data.domain.end[0] == 9.9
+        assert data.domain.end[0] == 10.0
 
         data_slice = data.slice(2.0, 8.0, reset_origin=False)
         assert np.allclose(data_slice.lfp, data.lfp[20:80])
         assert data_slice.domain.start[0] == 2.0
-        assert data_slice.domain.end[0] == 7.9
+        assert data_slice.domain.end[0] == 8.0
         assert np.allclose(data_slice.timestamps, np.arange(2.0, 8.0, 0.1))
 
         data_slice = data.slice(2.0, 8.0, reset_origin=True)
         assert np.allclose(data_slice.lfp, data.lfp[20:80])
         assert data_slice.domain.start[0] == 0.0
-        assert data_slice.domain.end[0] == 5.9
+        assert data_slice.domain.end[0] == 6.0
         assert np.allclose(data_slice.timestamps, np.arange(0.0, 6.0, 0.1))
 
         # try slicing with skewed start and end
         # the sampling frequency is 10
         data_slice = data.slice(2.03, 8.09, reset_origin=True)
         assert np.allclose(data_slice.lfp, data.lfp[21:81])
         assert np.allclose(data_slice.domain.start, np.array([0.07]))
-        assert np.allclose(data_slice.domain.end, np.array([5.97]))
+        assert np.allclose(data_slice.domain.end, np.array([6.07]))
         assert np.allclose(data_slice.timestamps, np.arange(0.07, 5.98, 0.1))
 
         data_slice = data.slice(4.051, 12.0, reset_origin=True)
         assert np.allclose(data_slice.lfp, data.lfp[41:])
         assert np.allclose(data_slice.domain.start, np.array([0.049]))
-        assert np.allclose(data_slice.domain.end, np.array([5.849]))
+        assert np.allclose(data_slice.domain.end, np.array([5.949]))
         assert np.allclose(data_slice.timestamps, np.arange(0.049, 5.88, 0.1))
 
         data_slice = data.slice(4.051, 12.0, reset_origin=False)
         assert np.allclose(data_slice.lfp, data.lfp[41:])
         assert np.allclose(data_slice.domain.start, np.array([4.1]))
-        assert np.allclose(data_slice.domain.end, np.array([9.9]))
+        assert np.allclose(data_slice.domain.end, np.array([10.0]))
         assert np.allclose(data_slice.timestamps, np.arange(4.1, 10.0, 0.1))
 
         data_slice = data.slice(-10, 20, reset_origin=False)
@@ -68,13 +68,12 @@ def _test_regulartimeseries(data):
         assert np.allclose(data_slice.domain.end, data.domain.end)
         assert np.allclose(data_slice.timestamps, data.timestamps)
 
-        # TODO update when we update the domain convention
         domain_start, domain_end = data.domain.start[0], data.domain.end[-1]
         data_slice = data.slice(domain_start, domain_end, reset_origin=False)
-        assert np.allclose(data_slice.lfp, data.lfp[:-1])
+        assert np.allclose(data_slice.lfp, data.lfp)
         assert np.allclose(data_slice.domain.start, data.domain.start)
-        assert np.allclose(data_slice.domain.end, data.domain.end - 0.1)
-        assert np.allclose(data_slice.timestamps, data.timestamps[:-1])
+        assert np.allclose(data_slice.domain.end, data.domain.end)
+        assert np.allclose(data_slice.timestamps, data.timestamps)
 
     data = RegularTimeSeries(
         lfp=np.random.random((100, 48)), sampling_rate=10, domain="auto"
@@ -103,7 +102,7 @@ def _test_regulartimeseries_with_domain_start(data):
         assert len(data) == 100
 
         assert data.domain.start[0] == 1.0
-        assert data.domain.end[0] == 10.9
+        assert data.domain.end[0] == 11.0
 
         data_slice = data.slice(3.0, 9.0)
         assert np.allclose(data_slice.lfp, data.lfp[20:80])
@@ -210,12 +209,12 @@ def test_lazy_regular_timeseries(test_filepath):
         # even if no other attribute is loaded
         assert len(data.timestamps) == 500
         assert data.domain.start[0] == 1.0
-        assert data.domain.end[0] == 2.996
+        assert data.domain.end[0] == 3.0
         assert np.allclose(data.timestamps, np.arange(1.0, 3.0, 1 / 250.0))
 
         data = data.slice(1.0, 2.0, reset_origin=True)
         assert data.domain.start[0] == 0.0
-        assert data.domain.end[0] == 0.996
+        assert data.domain.end[0] == 1.0
         assert len(data.timestamps) == 250
         assert np.allclose(data.timestamps, np.arange(0.0, 1.0, 1 / 250.0))
 
@@ -259,27 +258,35 @@ def test_slice_numerical_instability():
     end = 1.0 - eps
     sliced_ts = ts.slice(start, end, reset_origin=False)
     assert np.allclose(sliced_ts.timestamps, np.array([0.0, 0.25, 0.5, 0.75]))
+    assert sliced_ts.domain.start[0] == 0.0
+    assert sliced_ts.domain.end[-1] == 1.0
 
     # `end` is infinitesimally larger than an exact timestamp (1.0000001 scenario).
     # As the end is larger due to numerical instability even if the interval is [start, end), 1.0 should still be EXCLUDED
     start = 0.25
     end = 1.0 + eps
     sliced_ts = ts.slice(start, end, reset_origin=False)
     assert np.allclose(sliced_ts.timestamps, np.array([0.25, 0.5, 0.75]))
+    assert sliced_ts.domain.start[0] == 0.25
+    assert sliced_ts.domain.end[-1] == 1.0
 
     # `start` is computed slightly larger than an exact timestamp.
     # As the start is larger due to numerical instability 0.25 should be INCLUDED.
     start = 0.25 + eps
     end = 1.0
     sliced_ts = ts.slice(start, end, reset_origin=False)
     assert np.allclose(sliced_ts.timestamps, np.array([0.25, 0.5, 0.75]))
+    assert sliced_ts.domain.start[0] == 0.25
+    assert sliced_ts.domain.end[-1] == 1.0
 
     # Maximum Precision Limits via np.nextafter
     # np.nextafter gives the very next representable float in memory.
     start = 0.5
     end = np.nextafter(1.0, 0.0)  # The largest possible float strictly less than 1.0
     sliced_ts = ts.slice(start, end, reset_origin=False)
     assert np.allclose(sliced_ts.timestamps, np.array([0.5, 0.75]))
+    assert sliced_ts.domain.start[0] == 0.5
+    assert sliced_ts.domain.end[-1] == 1.0
 
     # Should still treat `end` as 1.0 and EXCLUDED it
     start = 0.5
@@ -295,6 +302,8 @@ def test_slice_numerical_instability():
     end = 1.0
     sliced_ts = ts.slice(start, end, reset_origin=False)
     assert np.allclose(sliced_ts.timestamps, np.array([0.25, 0.5, 0.75]))
+    assert sliced_ts.domain.start[0] == 0.25
+    assert sliced_ts.domain.end[-1] == 1.0
 
     ts = RegularTimeSeries(value=np.zeros((40)), sampling_rate=10, domain="auto")
     # Expected timestamps: [0.0, 0.1, 0.2, ...]
@@ -305,3 +314,5 @@ def test_slice_numerical_instability():
     end = start * 3  # 0.9000000000000001
     sliced_ts = ts.slice(start, end, reset_origin=False)
     assert np.allclose(sliced_ts.timestamps, np.array([0.3, 0.4, 0.5, 0.6, 0.7, 0.8]))
+    assert sliced_ts.domain.start[0] == 0.3
+    assert sliced_ts.domain.end[-1] == 0.9