fbr logger: improve types and kwargs supported

leej3 · leej3 · commit cd42f96c842d · 2024-04-23T15:32:56.000+01:00
diff --git a/ignite/handlers/fbresearch_logger.py b/ignite/handlers/fbresearch_logger.py
@@ -1,18 +1,29 @@
 """FBResearch logger and its helper handlers."""
 
 import datetime
-from typing import Any, Optional
-
-# from typing import Any, Dict, Optional, Union
+import numbers
+from typing import Any, Callable, List, Optional
 
 import torch
 
+from ignite import utils
 from ignite.engine import Engine, Events
 from ignite.handlers import Timer
+from ignite.handlers.utils import global_step_from_engine  # noqa
 
 
 MB = 1024.0 * 1024.0
 
+__all__ = ["FBResearchLogger", "global_step_from_engine"]
+
+
+def is_iterable(obj):
+    try:
+        iter(obj)
+        return True
+    except TypeError:
+        return False
+
 
 class FBResearchLogger:
     """Logs training and validation metrics for research purposes.
@@ -60,32 +71,32 @@ class FBResearchLogger:
         .. code-block:: text
 
             2024-04-22 12:05:47,843 trainer INFO: Train: start epoch [1/4]
-            2024-04-22 12:05:47,861 trainer INFO: Epoch [1/4]  [20/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5999  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,877 trainer INFO: Epoch [1/4]  [40/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9297  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,893 trainer INFO: Epoch [1/4]  [60/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9985  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,910 trainer INFO: Epoch [1/4]  [80/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9785  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,925 trainer INFO: Epoch [1/4]  [100/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.6211  Iter time: 0.0008 s  Data prep time: 0.0000 s  
+            2024-04-22 12:05:47,861 trainer INFO: Epoch [1/4]  [20/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5999  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,877 trainer INFO: Epoch [1/4]  [40/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9297  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,893 trainer INFO: Epoch [1/4]  [60/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9985  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,910 trainer INFO: Epoch [1/4]  [80/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9785  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,925 trainer INFO: Epoch [1/4]  [100/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.6211  Iter time: 0.0008 s  Data prep time: 0.0000 s
             2024-04-22 12:05:47,927 trainer INFO: Train: Epoch [1/4]  Total time: 0:00:00  (0.0008 s / it)
             2024-04-22 12:05:47,930 trainer INFO: Train: start epoch [2/4]
-            2024-04-22 12:05:47,949 trainer INFO: Epoch [2/4]  [19/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5981  Iter time: 0.0009 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,965 trainer INFO: Epoch [2/4]  [39/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9013  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,981 trainer INFO: Epoch [2/4]  [59/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9811  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:47,997 trainer INFO: Epoch [2/4]  [79/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9434  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,016 trainer INFO: Epoch [2/4]  [99/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.6116  Iter time: 0.0008 s  Data prep time: 0.0000 s  
+            2024-04-22 12:05:47,949 trainer INFO: Epoch [2/4]  [19/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5981  Iter time: 0.0009 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,965 trainer INFO: Epoch [2/4]  [39/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9013  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,981 trainer INFO: Epoch [2/4]  [59/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9811  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:47,997 trainer INFO: Epoch [2/4]  [79/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9434  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,016 trainer INFO: Epoch [2/4]  [99/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.6116  Iter time: 0.0008 s  Data prep time: 0.0000 s
             2024-04-22 12:05:48,017 trainer INFO: Train: Epoch [2/4]  Total time: 0:00:00  (0.0009 s / it)
             2024-04-22 12:05:48,020 trainer INFO: Train: start epoch [3/4]
-            2024-04-22 12:05:48,038 trainer INFO: Epoch [3/4]  [18/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5972  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,055 trainer INFO: Epoch [3/4]  [38/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.8753  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,076 trainer INFO: Epoch [3/4]  [58/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9657  Iter time: 0.0009 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,092 trainer INFO: Epoch [3/4]  [78/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9112  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,108 trainer INFO: Epoch [3/4]  [98/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.6035  Iter time: 0.0008 s  Data prep time: 0.0000 s  
+            2024-04-22 12:05:48,038 trainer INFO: Epoch [3/4]  [18/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5972  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,055 trainer INFO: Epoch [3/4]  [38/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.8753  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,076 trainer INFO: Epoch [3/4]  [58/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9657  Iter time: 0.0009 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,092 trainer INFO: Epoch [3/4]  [78/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9112  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,108 trainer INFO: Epoch [3/4]  [98/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.6035  Iter time: 0.0008 s  Data prep time: 0.0000 s
             2024-04-22 12:05:48,109 trainer INFO: Train: Epoch [3/4]  Total time: 0:00:00  (0.0009 s / it)
             2024-04-22 12:05:48,112 trainer INFO: Train: start epoch [4/4]
-            2024-04-22 12:05:48,129 trainer INFO: Epoch [4/4]  [17/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5969  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,145 trainer INFO: Epoch [4/4]  [37/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.8516  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,161 trainer INFO: Epoch [4/4]  [57/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9521  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,181 trainer INFO: Epoch [4/4]  [77/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.8816  Iter time: 0.0008 s  Data prep time: 0.0000 s  
-            2024-04-22 12:05:48,205 trainer INFO: Epoch [4/4]  [97/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5966  Iter time: 0.0009 s  Data prep time: 0.0000 s  
+            2024-04-22 12:05:48,129 trainer INFO: Epoch [4/4]  [17/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5969  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,145 trainer INFO: Epoch [4/4]  [37/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.8516  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,161 trainer INFO: Epoch [4/4]  [57/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.9521  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,181 trainer INFO: Epoch [4/4]  [77/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.8816  Iter time: 0.0008 s  Data prep time: 0.0000 s
+            2024-04-22 12:05:48,205 trainer INFO: Epoch [4/4]  [97/100]:  ETA: 0:00:00  lr: 0.00100  total_loss: 1.5966  Iter time: 0.0009 s  Data prep time: 0.0000 s
             2024-04-22 12:05:48,207 trainer INFO: Train: Epoch [4/4]  Total time: 0:00:00  (0.0009 s / it)
             2024-04-22 12:05:48,209 trainer INFO: Train: run completed  Total time: 0:00:00
     """
@@ -98,16 +109,27 @@ def __init__(self, logger: Any, delimiter: str = "  ", show_output: bool = False
         self.show_output: bool = show_output
 
     def attach(
-        self, engine: Engine, name: str, every: int = 1, optimizer: Optional[torch.optim.Optimizer] = None
+        self,
+        engine: Engine,
+        name: str,
+        every: int = 1,
+        output_transform: Optional[Callable] = None,
+        state_attributes: Optional[List[str]] = None,
+        optimizer: Optional[torch.optim.Optimizer] = None,
     ) -> None:
         """Attaches all the logging handlers to the given engine.
 
         Args:
             engine: The engine to attach the logging handlers to.
             name: The name of the engine (e.g., "Train", "Validate") to include in log messages.
             every: Frequency of iterations to log information. Logs are generated every 'every' iterations.
+            output_transform: A function to select the value to log.
+            state_attributes: A list of attributes to log.
             optimizer: The optimizer used during training to log current learning rates.
         """
+        self.name = name
+        self.output_transform = output_transform
+        self.state_attributes = state_attributes
         engine.add_event_handler(Events.EPOCH_STARTED, self.log_epoch_started, engine, name)
         engine.add_event_handler(Events.ITERATION_COMPLETED(every=every), self.log_every, engine, optimizer=optimizer)
         engine.add_event_handler(Events.EPOCH_COMPLETED, self.log_epoch_completed, engine, name)
@@ -151,10 +173,15 @@ def log_every(self, engine: Engine, optimizer: Optional[torch.optim.Optimizer] =
         outputs = []
         if self.show_output and engine.state.output is not None:
             output = engine.state.output
-            if isinstance(output, dict):
+            if self.output_transform is not None:
+                outputs.append(str(self.output_transform(output)))
+            elif isinstance(output, dict):
                 outputs += [f"{k}: {v:.4f}" for k, v in output.items()]
+            elif isinstance(output, str):
+                outputs.append(output)
             else:
-                outputs += [f"{v:.4f}" if isinstance(v, float) else f"{v}" for v in output]  # type: ignore
+                # allow numbers or nested iterables of numbers
+                outputs.extend(utils.apply_to_type(output, numbers.Number, lambda x: f"{x:.4f}"))
 
         lrs = ""
         if optimizer is not None:
@@ -164,6 +191,9 @@ def log_every(self, engine: Engine, optimizer: Optional[torch.optim.Optimizer] =
                 for i, g in enumerate(optimizer.param_groups):
                     lrs += f"lr [g{i}]: {g['lr']:.5f}"
 
+        state_attrs = []
+        if self.state_attributes is not None:
+            state_attrs.append(str({name: getattr(engine.state, name, None) for name in self.state_attributes}))
         msg = self.delimiter.join(
             [
                 f"Epoch [{engine.state.epoch}/{engine.state.max_epochs}]",
@@ -172,6 +202,7 @@ def log_every(self, engine: Engine, optimizer: Optional[torch.optim.Optimizer] =
                 f"{lrs}",
             ]
             + outputs
+            + state_attrs
             + [
                 f"Iter time: {iter_avg_time:.4f} s",
                 f"Data prep time: {self.data_timer.value():.4f} s",
diff --git a/tests/ignite/handlers/test_fbresearch_logger.py b/tests/ignite/handlers/test_fbresearch_logger.py
@@ -3,9 +3,13 @@
 from unittest.mock import MagicMock
 
 import pytest
+import torch
+import torch.nn as nn
+import torch.optim as optim
 
-from ignite.engine import Engine, Events
-from ignite.handlers.fbresearch_logger import FBResearchLogger  # Adjust the import path as necessary
+from ignite.engine import create_supervised_trainer, Engine, Events
+from ignite.handlers.fbresearch_logger import FBResearchLogger
+from ignite.utils import setup_logger
 
 
 @pytest.fixture
@@ -56,3 +60,47 @@ def test_output_formatting(mock_engine, fb_research_logger, output, expected_pat
 
     actual_output = fb_research_logger.logger.info.call_args_list[0].args[0]
     assert re.search(expected_pattern, actual_output)
+
+
+def test_logger_type_support():
+    model = nn.Linear(10, 5)
+    opt = optim.SGD(model.parameters(), lr=0.001)
+    criterion = nn.CrossEntropyLoss()
+
+    data = [(torch.rand(4, 10), torch.randint(0, 5, size=(4,))) for _ in range(100)]
+
+    trainer = create_supervised_trainer(model, opt, criterion)
+
+    logger = setup_logger("trainer", level=logging.INFO)
+    logger = FBResearchLogger(logger=logger, show_output=True)
+    logger.attach(trainer, name="Train", every=20, optimizer=opt)
+
+    trainer.run(data, max_epochs=4)
+    trainer.state.output = {"loss": 4.2}
+    trainer.fire_event(Events.ITERATION_COMPLETED)
+    trainer.state.output = "4.2"
+    trainer.fire_event(Events.ITERATION_COMPLETED)
+    trainer.state.output = [4.2, 4.2]
+    trainer.fire_event(Events.ITERATION_COMPLETED)
+    trainer.state.output = (4.2, 4.2)
+    trainer.fire_event(Events.ITERATION_COMPLETED)
+
+
+def test_fbrlogger_with_output_transform(mock_logger):
+    trainer = Engine(lambda e, b: 42)
+    fbr = FBResearchLogger(logger=mock_logger, show_output=True)
+    fbr.attach(trainer, "Training", output_transform=lambda x: {"loss": x})
+    trainer.run(data=[10], epoch_length=1, max_epochs=1)
+    assert "{'loss': 42}" in fbr.logger.info.call_args_list[-2].args[0]
+
+
+def test_fbrlogger_with_state_attrs(mock_logger):
+    trainer = Engine(lambda e, b: 42)
+    fbr = FBResearchLogger(logger=mock_logger, show_output=True)
+    fbr.attach(trainer, "Training", state_attributes=["alpha", "beta", "gamma"])
+    trainer.state.alpha = 3.899
+    trainer.state.beta = torch.tensor(12.21)
+    trainer.state.gamma = torch.tensor([21.0, 6.0])
+    trainer.run(data=[10], epoch_length=1, max_epochs=1)
+    attrs = "{'alpha': 3.899, 'beta': 12.2100, 'gamma': [21.,  6.]}"
+    assert attrs in fbr.logger.info.call_args_list[-2].args[0]