TGSAI · tasansal · Nov 20, 2024 · Nov 20, 2024 · Nov 20, 2024 · Nov 20, 2024
diff --git a/pyproject.toml b/pyproject.toml
@@ -88,6 +88,9 @@ select = [
     "PL",  # pylint
     "FLY", # flynt
     "NPY201", # numpy
+    "LOG", # logging
+    "G", # logging-format
+    "PERF", # perflint
 ]
 
 ignore = [

diff --git a/src/segy/accessors.py b/src/segy/accessors.py
@@ -2,6 +2,7 @@
 
 from __future__ import annotations
 
+import logging
 from typing import TYPE_CHECKING
 
 from segy.schema import Endianness
@@ -13,19 +14,25 @@
     from segy.schema import TraceSpec
 
 
+logger = logging.getLogger(__name__)
+
+
 class TraceAccessor:
     """Accessor for applying required transforms for reading SegyArrays and subclasses.
 
     trace_spec: Trace specification as instance of TraceSpec dtype.
     """
 
     def __init__(self, trace_spec: TraceSpec) -> None:
+        logger.debug("Initializing %s", self.__class__.__name__)
+
         self.trace_spec = trace_spec
         self.header_ibm_keys = [
             field.name
             for field in self.trace_spec.header.fields
             if field.format == ScalarType.IBM32
         ]
+
         self.header_decode_pipeline = TransformPipeline()
         self.sample_decode_pipeline = TransformPipeline()
         self.trace_decode_pipeline = TransformPipeline()

diff --git a/src/segy/exceptions.py b/src/segy/exceptions.py
@@ -5,6 +5,10 @@ class SegyError(Exception):
     """Base class for all exceptions in this library."""
 
 
+class SegyFileSpecMismatchError(SegyError):
+    """Raised when file spec with parsed fields don't match file size."""
+
+
 class EndiannessInferenceError(SegyError):
     """Raised when endianness inference has failed."""
 

diff --git a/src/segy/factory.py b/src/segy/factory.py
@@ -2,6 +2,7 @@
 
 from __future__ import annotations
 
+import logging
 from datetime import datetime
 from datetime import timezone
 from typing import TYPE_CHECKING
@@ -12,6 +13,7 @@
 from segy.arrays import HeaderArray
 from segy.arrays import TraceArray
 from segy.constants import REV1_BASE16
+from segy.exceptions import NonSpecFieldError
 from segy.schema.base import Endianness
 from segy.schema.format import ScalarType
 from segy.schema.segy import SegyStandard
@@ -27,6 +29,9 @@
     from segy.schema import SegySpec
 
 
+logger = logging.getLogger(__name__)
+
+
 DEFAULT_TEXT_HEADER_LINES = [
     "C01 File written by the open-source segy library.",
     "C02",
@@ -130,6 +135,7 @@ def create_textual_header(self, text: str | None = None) -> bytes:
 
         text_spec = self.spec.text_header
 
+        logger.info("Serialized text header according to SEG-Y spec.")
         return text_spec.encode(text)
 
     def create_binary_header(self, update: dict[str, Any] | None = None) -> bytes:
@@ -167,8 +173,10 @@ def create_binary_header(self, update: dict[str, Any] | None = None) -> bytes:
 
         if update is not None:
             for key, value in update.items():
+                logger.debug("Updating binary header field %s to %s", key, value)
                 bin_header[key] = value
 
+        logger.info("Serialized binary header according to SEG-Y spec.")
         return bin_header.tobytes()
 
     def create_trace_header_template(
@@ -189,12 +197,15 @@ def create_trace_header_template(
         header_template = HeaderArray(np.zeros(shape=size, dtype=dtype))
 
         # 'names' assumed not None by data structure (type ignores).
-        field_names = header_template.dtype.names
-        if "sample_interval" in field_names:
+        try:
             header_template["sample_interval"] = self.sample_interval
+        except NonSpecFieldError:
+            logger.warning("'sample_interval' not found in binary fields, skipping.")
 
-        if "samples_per_trace" in field_names:
+        try:
             header_template["samples_per_trace"] = self.samples_per_trace
+        except NonSpecFieldError:
+            logger.warning("'samples_per_trace' not found in binary fields, skipping.")
 
         return header_template
 
@@ -246,14 +257,17 @@ def create_traces(self, headers: NDArray[Any], samples: NDArray[Any]) -> bytes:
                 "Data array must be 2-dimensional with rows as traces "
                 "and columns as data samples."
             )
+            logger.error(msg)
             raise AttributeError(msg)
 
         if samples.shape[1] != self.samples_per_trace:
             msg = f"Trace length must be {self.samples_per_trace}."
+            logger.error(msg)
             raise ValueError(msg)
 
         if len(headers) != len(samples):
             msg = "Header array must have the same number of rows as data array."
+            logger.error(msg)
             raise ValueError(msg)
 
         header_pipeline = TransformPipeline()
@@ -263,16 +277,19 @@ def create_traces(self, headers: NDArray[Any], samples: NDArray[Any]) -> bytes:
         target_format = trace_spec.data.format
 
         if target_endian == Endianness.BIG:
+            logger.debug("Added big endian conversion before serialization.")
             byte_swap = TransformFactory.create("byte_swap", target_endian)
             header_pipeline.add_transform(byte_swap)
             data_pipeline.add_transform(byte_swap)
 
         if target_format == ScalarType.IBM32:
+            logger.debug("Added IBM float conversion before serialization.")
             ibm_float = TransformFactory.create("ibm_float", "to_ibm")
             data_pipeline.add_transform(ibm_float)
 
         trace = TraceArray(np.zeros(shape=headers.size, dtype=trace_spec.dtype))
         trace["header"] = header_pipeline.apply(headers)
         trace["data"] = data_pipeline.apply(samples)
 
+        logger.info("Serialized %s traces according to SEG-Y spec.", len(samples))
         return trace.tobytes()