Linting

BrianMichell · tasansal · commit 99afc364edf7 · 2025-09-17T09:29:00.000-05:00
diff --git a/src/mdio/segy/_disaster_recovery_wrapper.py b/src/mdio/segy/_disaster_recovery_wrapper.py
@@ -4,18 +4,19 @@
 
 from typing import TYPE_CHECKING
 
+from segy.schema import Endianness
+from segy.transforms import ByteSwapTransform
+from segy.transforms import IbmFloatTransform
+
 if TYPE_CHECKING:
-    import numpy as np
-    from segy.file import SegyFile
-    from segy.transforms import Transform, ByteSwapTransform, IbmFloatTransform
     from numpy.typing import NDArray
+    from segy import SegyFile
+    from segy.transforms import Transform
+    from segy.transforms import TransformPipeline
+
 
 def _reverse_single_transform(data: NDArray, transform: Transform, endianness: Endianness) -> NDArray:
     """Reverse a single transform operation."""
-    from segy.schema import Endianness
-    from segy.transforms import ByteSwapTransform
-    from segy.transforms import IbmFloatTransform
-
     if isinstance(transform, ByteSwapTransform):
         # Reverse the endianness conversion
         if endianness == Endianness.LITTLE:
@@ -24,20 +25,19 @@ def _reverse_single_transform(data: NDArray, transform: Transform, endianness: E
         reverse_transform = ByteSwapTransform(Endianness.BIG)
         return reverse_transform.apply(data)
 
-    elif isinstance(transform, IbmFloatTransform):  # TODO: This seems incorrect...
+    # TODO(BrianMichell): #0000 Do we actually need to worry about IBM/IEEE transforms here?
+    if isinstance(transform, IbmFloatTransform):
         # Reverse IBM float conversion
         reverse_direction = "to_ibm" if transform.direction == "to_ieee" else "to_ieee"
         reverse_transform = IbmFloatTransform(reverse_direction, transform.keys)
         return reverse_transform.apply(data)
 
-    else:
-        # For unknown transforms, return data unchanged
-        return data
+    # For unknown transforms, return data unchanged
+    return data
+
 
 def get_header_raw_and_transformed(
-    segy_file: SegyFile,
-    indices: int | list[int] | NDArray | slice,
-    do_reverse_transforms: bool = True
+    segy_file: SegyFile, indices: int | list[int] | NDArray | slice, do_reverse_transforms: bool = True
 ) -> tuple[NDArray | None, NDArray, NDArray]:
     """Get both raw and transformed header data.
 
@@ -54,15 +54,20 @@ def get_header_raw_and_transformed(
 
     # Reverse transforms to get raw data
     if do_reverse_transforms:
-        raw_headers = _reverse_transforms(transformed_headers, segy_file.header.transform_pipeline, segy_file.spec.endianness)
+        raw_headers = _reverse_transforms(
+            transformed_headers, segy_file.header.transform_pipeline, segy_file.spec.endianness
+        )
     else:
         raw_headers = None
 
     return raw_headers, transformed_headers, traces
 
-def _reverse_transforms(transformed_data: NDArray, transform_pipeline, endianness: Endianness) -> NDArray:
+
+def _reverse_transforms(
+    transformed_data: NDArray, transform_pipeline: TransformPipeline, endianness: Endianness
+) -> NDArray:
     """Reverse the transform pipeline to get raw data."""
-    raw_data = transformed_data.copy() if hasattr(transformed_data, 'copy') else transformed_data
+    raw_data = transformed_data.copy() if hasattr(transformed_data, "copy") else transformed_data
 
     # Apply transforms in reverse order
     for transform in reversed(transform_pipeline.transforms):
diff --git a/src/mdio/segy/_workers.py b/src/mdio/segy/_workers.py
@@ -9,7 +9,6 @@
 
 import numpy as np
 from segy import SegyFile
-from segy.indexing import merge_cat_file
 
 from mdio.api.io import to_mdio
 from mdio.builder.schemas.dtype import ScalarType
@@ -82,6 +81,7 @@ def header_scan_worker(
 
     return cast("HeaderArray", trace_header)
 
+
 def trace_worker(  # noqa: PLR0913
     segy_kw: SegyFileArguments,
     output_path: UPath,
@@ -135,11 +135,12 @@ def trace_worker(  # noqa: PLR0913
     if header_key in dataset.data_vars:  # Keeping the `if` here to allow for more worker configurations
         worker_variables.append(header_key)
     if raw_header_key in dataset.data_vars:
-
         do_reverse_transforms = True
         worker_variables.append(raw_header_key)
 
-    raw_headers, transformed_headers, traces = get_header_raw_and_transformed(segy_file, live_trace_indexes, do_reverse_transforms=do_reverse_transforms)
+    raw_headers, transformed_headers, traces = get_header_raw_and_transformed(
+        segy_file, live_trace_indexes, do_reverse_transforms=do_reverse_transforms
+    )
     ds_to_write = dataset[worker_variables]
 
     if header_key in worker_variables:
@@ -168,7 +169,6 @@ def trace_worker(  # noqa: PLR0913
             encoding=ds_to_write[raw_header_key].encoding,  # Not strictly necessary, but safer than not doing it.
         )
 
-
     del raw_headers  # Manage memory
     data_variable = ds_to_write[data_variable_name]
     fill_value = _get_fill_value(ScalarType(data_variable.dtype.name))
diff --git a/src/mdio/segy/blocked_io.py b/src/mdio/segy/blocked_io.py
@@ -280,4 +280,4 @@ def to_segy(
 
         non_consecutive_axes -= 1
 
-    return block_io_records
+    return block_io_records
diff --git a/tests/unit/test_disaster_recovery_wrapper.py b/tests/unit/test_disaster_recovery_wrapper.py
@@ -27,6 +27,7 @@
 
 SAMPLES_PER_TRACE = 1501
 
+
 class TestDisasterRecoveryWrapper:
     """Test cases for disaster recovery wrapper functionality."""
 
@@ -51,17 +52,19 @@ def basic_segy_spec(self) -> SegySpec:
 
         return spec.customize(trace_header_fields=header_fields)
 
-    @pytest.fixture(params=[
-        {"endianness": Endianness.BIG, "data_format": 1, "name": "big_endian_ibm"},
-        {"endianness": Endianness.BIG, "data_format": 5, "name": "big_endian_ieee"},
-        {"endianness": Endianness.LITTLE, "data_format": 1, "name": "little_endian_ibm"},
-        {"endianness": Endianness.LITTLE, "data_format": 5, "name": "little_endian_ieee"},
-    ])
-    def segy_config(self, request) -> dict:
+    @pytest.fixture(
+        params=[
+            {"endianness": Endianness.BIG, "data_format": 1, "name": "big_endian_ibm"},
+            {"endianness": Endianness.BIG, "data_format": 5, "name": "big_endian_ieee"},
+            {"endianness": Endianness.LITTLE, "data_format": 1, "name": "little_endian_ibm"},
+            {"endianness": Endianness.LITTLE, "data_format": 5, "name": "little_endian_ieee"},
+        ]
+    )
+    def segy_config(self, request: pytest.FixtureRequest) -> dict:
         """Parameterized fixture for different SEGY configurations."""
         return request.param
 
-    def create_test_segy_file(
+    def create_test_segy_file(  # noqa: PLR0913
         self,
         spec: SegySpec,
         num_traces: int,
@@ -119,7 +122,7 @@ def extract_header_bytes_from_file(
         self, segy_path: Path, trace_index: int, byte_start: int, byte_length: int
     ) -> NDArray:
         """Extract specific bytes from a trace header in the SEGY file."""
-        with open(segy_path, "rb") as f:
+        with segy_path.open("rb") as f:
             # Skip text header (3200 bytes) + binary header (400 bytes)
             header_offset = 3600
 
@@ -164,18 +167,12 @@ def test_header_validation_configurations(
         for trace_idx in test_indices:
             # Get raw and transformed headers
             raw_headers, transformed_headers, traces = get_header_raw_and_transformed(
-                segy_file=segy_file,
-                indices=trace_idx,
-                do_reverse_transforms=True
+                segy_file=segy_file, indices=trace_idx, do_reverse_transforms=True
             )
 
             # Extract bytes from disk for inline (bytes 189-192) and crossline (bytes 193-196)
-            inline_bytes_disk = self.extract_header_bytes_from_file(
-                segy_path, trace_idx, 189, 4
-            )
-            crossline_bytes_disk = self.extract_header_bytes_from_file(
-                segy_path, trace_idx, 193, 4
-            )
+            inline_bytes_disk = self.extract_header_bytes_from_file(segy_path, trace_idx, 189, 4)
+            crossline_bytes_disk = self.extract_header_bytes_from_file(segy_path, trace_idx, 193, 4)
 
             # Convert raw headers to bytes for comparison
             if raw_headers is not None:
@@ -185,30 +182,30 @@ def test_header_validation_configurations(
                 if raw_headers.ndim == 0:
                     # Single trace case
                     raw_data_bytes = raw_headers.tobytes()
-                    inline_offset = raw_headers.dtype.fields['inline'][1]
-                    crossline_offset = raw_headers.dtype.fields['crossline'][1]
-                    inline_size = raw_headers.dtype.fields['inline'][0].itemsize
-                    crossline_size = raw_headers.dtype.fields['crossline'][0].itemsize
-                    
+                    inline_offset = raw_headers.dtype.fields["inline"][1]
+                    crossline_offset = raw_headers.dtype.fields["crossline"][1]
+                    inline_size = raw_headers.dtype.fields["inline"][0].itemsize
+                    crossline_size = raw_headers.dtype.fields["crossline"][0].itemsize
+
                     raw_inline_bytes = np.frombuffer(
-                        raw_data_bytes[inline_offset:inline_offset+inline_size], dtype=np.uint8
+                        raw_data_bytes[inline_offset : inline_offset + inline_size], dtype=np.uint8
                     )
                     raw_crossline_bytes = np.frombuffer(
-                        raw_data_bytes[crossline_offset:crossline_offset+crossline_size], dtype=np.uint8
+                        raw_data_bytes[crossline_offset : crossline_offset + crossline_size], dtype=np.uint8
                     )
                 else:
                     # Multiple traces case - this test uses single trace index, so extract that trace
                     raw_data_bytes = raw_headers[0:1].tobytes()  # Extract first trace
-                    inline_offset = raw_headers.dtype.fields['inline'][1]
-                    crossline_offset = raw_headers.dtype.fields['crossline'][1]
-                    inline_size = raw_headers.dtype.fields['inline'][0].itemsize
-                    crossline_size = raw_headers.dtype.fields['crossline'][0].itemsize
-                    
+                    inline_offset = raw_headers.dtype.fields["inline"][1]
+                    crossline_offset = raw_headers.dtype.fields["crossline"][1]
+                    inline_size = raw_headers.dtype.fields["inline"][0].itemsize
+                    crossline_size = raw_headers.dtype.fields["crossline"][0].itemsize
+
                     raw_inline_bytes = np.frombuffer(
-                        raw_data_bytes[inline_offset:inline_offset+inline_size], dtype=np.uint8
+                        raw_data_bytes[inline_offset : inline_offset + inline_size], dtype=np.uint8
                     )
                     raw_crossline_bytes = np.frombuffer(
-                        raw_data_bytes[crossline_offset:crossline_offset+crossline_size], dtype=np.uint8
+                        raw_data_bytes[crossline_offset : crossline_offset + crossline_size], dtype=np.uint8
                     )
 
                 print(f"Transformed headers: {transformed_headers.tobytes()}")
@@ -217,10 +214,12 @@ def test_header_validation_configurations(
                 print(f"Crossline bytes disk: {crossline_bytes_disk.tobytes()}")
 
                 # Compare bytes
-                assert np.array_equal(raw_inline_bytes, inline_bytes_disk), \
+                assert np.array_equal(raw_inline_bytes, inline_bytes_disk), (
                     f"Inline bytes mismatch for trace {trace_idx} in {config_name}"
-                assert np.array_equal(raw_crossline_bytes, crossline_bytes_disk), \
+                )
+                assert np.array_equal(raw_crossline_bytes, crossline_bytes_disk), (
                     f"Crossline bytes mismatch for trace {trace_idx} in {config_name}"
+                )
 
     def test_header_validation_no_transforms(
         self, temp_dir: Path, basic_segy_spec: SegySpec, segy_config: dict
@@ -252,7 +251,7 @@ def test_header_validation_no_transforms(
         raw_headers, transformed_headers, traces = get_header_raw_and_transformed(
             segy_file=segy_file,
             indices=slice(None),  # All traces
-            do_reverse_transforms=False
+            do_reverse_transforms=False,
         )
 
         # When transforms are disabled, raw_headers should be None
@@ -262,13 +261,8 @@ def test_header_validation_no_transforms(
         assert transformed_headers is not None
         assert transformed_headers.size == num_traces
 
-    def test_multiple_traces_validation(
-        self, temp_dir: Path, basic_segy_spec: SegySpec, segy_config: dict
-    ) -> None:
+    def test_multiple_traces_validation(self, temp_dir: Path, basic_segy_spec: SegySpec, segy_config: dict) -> None:
         """Test validation with multiple traces at once."""
-        if True:
-            import segy
-            print(segy.__version__)
         config_name = segy_config["name"]
         endianness = segy_config["endianness"]
         data_format = segy_config["data_format"]
@@ -301,20 +295,16 @@ def test_multiple_traces_validation(
         raw_headers, transformed_headers, traces = get_header_raw_and_transformed(
             segy_file=segy_file,
             indices=slice(None),  # All traces
-            do_reverse_transforms=True
+            do_reverse_transforms=True,
         )
 
         first = True
 
         # Validate each trace
         for trace_idx in range(num_traces):
             # Extract bytes from disk
-            inline_bytes_disk = self.extract_header_bytes_from_file(
-                segy_path, trace_idx, 189, 4
-            )
-            crossline_bytes_disk = self.extract_header_bytes_from_file(
-                segy_path, trace_idx, 193, 4
-            )
+            inline_bytes_disk = self.extract_header_bytes_from_file(segy_path, trace_idx, 189, 4)
+            crossline_bytes_disk = self.extract_header_bytes_from_file(segy_path, trace_idx, 193, 4)
 
             if first:
                 print(raw_headers.dtype)
@@ -327,30 +317,30 @@ def test_multiple_traces_validation(
             if raw_headers.ndim == 0:
                 # Single trace case
                 raw_data_bytes = raw_headers.tobytes()
-                inline_offset = raw_headers.dtype.fields['inline'][1]
-                crossline_offset = raw_headers.dtype.fields['crossline'][1]
-                inline_size = raw_headers.dtype.fields['inline'][0].itemsize
-                crossline_size = raw_headers.dtype.fields['crossline'][0].itemsize
-                
+                inline_offset = raw_headers.dtype.fields["inline"][1]
+                crossline_offset = raw_headers.dtype.fields["crossline"][1]
+                inline_size = raw_headers.dtype.fields["inline"][0].itemsize
+                crossline_size = raw_headers.dtype.fields["crossline"][0].itemsize
+
                 raw_inline_bytes = np.frombuffer(
-                    raw_data_bytes[inline_offset:inline_offset+inline_size], dtype=np.uint8
+                    raw_data_bytes[inline_offset : inline_offset + inline_size], dtype=np.uint8
                 )
                 raw_crossline_bytes = np.frombuffer(
-                    raw_data_bytes[crossline_offset:crossline_offset+crossline_size], dtype=np.uint8
+                    raw_data_bytes[crossline_offset : crossline_offset + crossline_size], dtype=np.uint8
                 )
             else:
                 # Multiple traces case
-                raw_data_bytes = raw_headers[trace_idx:trace_idx+1].tobytes()
-                inline_offset = raw_headers.dtype.fields['inline'][1]
-                crossline_offset = raw_headers.dtype.fields['crossline'][1]
-                inline_size = raw_headers.dtype.fields['inline'][0].itemsize
-                crossline_size = raw_headers.dtype.fields['crossline'][0].itemsize
-                
+                raw_data_bytes = raw_headers[trace_idx : trace_idx + 1].tobytes()
+                inline_offset = raw_headers.dtype.fields["inline"][1]
+                crossline_offset = raw_headers.dtype.fields["crossline"][1]
+                inline_size = raw_headers.dtype.fields["inline"][0].itemsize
+                crossline_size = raw_headers.dtype.fields["crossline"][0].itemsize
+
                 raw_inline_bytes = np.frombuffer(
-                    raw_data_bytes[inline_offset:inline_offset+inline_size], dtype=np.uint8
+                    raw_data_bytes[inline_offset : inline_offset + inline_size], dtype=np.uint8
                 )
                 raw_crossline_bytes = np.frombuffer(
-                    raw_data_bytes[crossline_offset:crossline_offset+crossline_size], dtype=np.uint8
+                    raw_data_bytes[crossline_offset : crossline_offset + crossline_size], dtype=np.uint8
                 )
 
             print(f"Raw inline bytes: {raw_inline_bytes.tobytes()}")
@@ -359,18 +349,23 @@ def test_multiple_traces_validation(
             print(f"Crossline bytes disk: {crossline_bytes_disk.tobytes()}")
 
             # Compare
-            assert np.array_equal(raw_inline_bytes, inline_bytes_disk), \
+            assert np.array_equal(raw_inline_bytes, inline_bytes_disk), (
                 f"Inline bytes mismatch for trace {trace_idx} in {config_name}"
-            assert np.array_equal(raw_crossline_bytes, crossline_bytes_disk), \
+            )
+            assert np.array_equal(raw_crossline_bytes, crossline_bytes_disk), (
                 f"Crossline bytes mismatch for trace {trace_idx} in {config_name}"
+            )
 
-    @pytest.mark.parametrize("trace_indices", [
-        0,  # Single trace
-        [0, 2, 4],  # Multiple specific traces
-        slice(1, 4),  # Range of traces
-    ])
+    @pytest.mark.parametrize(
+        "trace_indices",
+        [
+            0,  # Single trace
+            [0, 2, 4],  # Multiple specific traces
+            slice(1, 4),  # Range of traces
+        ],
+    )
     def test_different_index_types(
-        self, temp_dir: Path, basic_segy_spec: SegySpec, segy_config: dict, trace_indices
+        self, temp_dir: Path, basic_segy_spec: SegySpec, segy_config: dict, trace_indices: int | list[int] | slice
     ) -> None:
         """Test with different types of trace indices."""
         config_name = segy_config["name"]
@@ -397,9 +392,7 @@ def test_different_index_types(
 
         # Get headers with different index types
         raw_headers, transformed_headers, traces = get_header_raw_and_transformed(
-            segy_file=segy_file,
-            indices=trace_indices,
-            do_reverse_transforms=True
+            segy_file=segy_file, indices=trace_indices, do_reverse_transforms=True
         )
 
         # Basic validation that we got results

Original file line number	Diff line number	Diff line change
`@@ -280,4 +280,4 @@ def to_segy(`
`280`	`280`
`281`	`281`	`non_consecutive_axes -= 1`
`282`	`282`
`283`		`- return block_io_records`
	`283`	`+ return block_io_records`