fix LLM attribution related mypy issues (#1200)

aobo-y · facebook-github-bot · commit f4663ce5b247 · 2023-10-30T21:59:06.000-07:00
Summary:

as title

Reviewed By: vivekmig

Differential Revision: D50715178
diff --git a/captum/attr/_core/llm_attr.py b/captum/attr/_core/llm_attr.py
@@ -153,7 +153,7 @@ def _format_model_input(self, model_input: Union[str, Tensor]):
         raw text and text token tensors
         """
         # return tensor(1, n_tokens)
-        if type(model_input) is str:
+        if isinstance(model_input, str):
             return self.tokenizer.encode(model_input, return_tensors="pt").to(
                 self.device
             )
diff --git a/captum/attr/_utils/interpretable_input.py b/captum/attr/_utils/interpretable_input.py
@@ -210,14 +210,24 @@ def __init__(
         if baselines is None:
             # default baseline is to remove the element
             baselines = [""] * len(values)
-        elif dict_keys:
-            assert isinstance(baselines, dict), (
-                "if values is dict, the baselines must also be a dict, "
-                f"received: {type(baselines)}"
-            )
+        elif not callable(baselines):
+            if dict_keys:
+                assert isinstance(baselines, dict), (
+                    "if values is a dict, the baselines must also be a dict "
+                    "or a callable which return a dict, "
+                    f"received: {type(baselines)}"
+                )
 
-            # convert dict to list
-            baselines = [baselines[k] for k in self.dict_keys]
+                # convert dict to list
+                baselines = [baselines[k] for k in dict_keys]
+            else:
+                assert isinstance(baselines, list), (
+                    "if values is a list, the baselines must also be a list "
+                    "or a callable which return a list, "
+                    f"received: {type(baselines)}"
+                )
+
+        self.baselines = baselines
 
         if mask is None:
             n_itp_features = n_features
@@ -247,14 +257,13 @@ def __init__(
         if isinstance(template, str):
             template = template.format
         else:
-            assert isinstance(template, Callable), (
+            assert callable(template), (
                 "the template must be either a string or a callable, "
                 f"received: {type(template)}"
             )
             template = template
         self.format_fn = template
 
-        self.baselines = baselines
         self.mask = mask
 
     def to_tensor(self) -> torch.Tensor:
@@ -265,13 +274,23 @@ def to_model_input(self, perturbed_tensor: Optional[Tensor] = None) -> str:
         values = list(self.values)  # clone
 
         if perturbed_tensor is not None:
-            baselines = self.baselines
-            if isinstance(baselines, Callable):
+            if callable(self.baselines):
                 # a placeholder for advanced baselines
                 # TODO: support callable baselines
                 baselines = self.baselines()
                 if self.dict_keys:
+                    assert isinstance(baselines, dict), (
+                        "if values is a dict and the baselines is a callable"
+                        f"it must return a dict, received: {type(baselines)}"
+                    )
                     baselines = [baselines[k] for k in self.dict_keys]
+                else:
+                    assert isinstance(baselines, list), (
+                        "if values is a list and the baselines is a callable"
+                        f"it must return a list, received: {type(baselines)}"
+                    )
+            else:
+                baselines = self.baselines
 
             for i in range(len(values)):
                 itp_idx = i
@@ -284,8 +303,8 @@ def to_model_input(self, perturbed_tensor: Optional[Tensor] = None) -> str:
                     values[i] = baselines[i]
 
         if self.dict_keys:
-            values = dict(zip(self.dict_keys, values))
-            input_str = self.format_fn(**values)
+            dict_values = dict(zip(self.dict_keys, values))
+            input_str = self.format_fn(**dict_values)
         else:
             input_str = self.format_fn(*values)
 
diff --git a/tests/attr/test_interpretable_input.py b/tests/attr/test_interpretable_input.py
@@ -16,8 +16,8 @@ class TestTextTemplateInput(BaseTest):
             ),
         ]
     )
-    def test_input(self, template, inputs) -> None:
-        tt_input = TextTemplateInput(template, inputs)
+    def test_input(self, template, values) -> None:
+        tt_input = TextTemplateInput(template, values)
 
         expected_tensor = torch.tensor([[1.0] * 4])
         assertTensorAlmostEqual(self, tt_input.to_tensor(), expected_tensor)
@@ -37,11 +37,11 @@ def test_input(self, template, inputs) -> None:
             ),
         ]
     )
-    def test_input_with_baselines(self, template, inputs, baselines) -> None:
+    def test_input_with_baselines(self, template, values, baselines) -> None:
         perturbed_tensor = torch.tensor([[1.0, 0.0, 1.0, 0.0]])
 
         # single instance baselines
-        tt_input = TextTemplateInput(template, inputs, baselines=baselines)
+        tt_input = TextTemplateInput(template, values, baselines=baselines)
         self.assertEqual(tt_input.to_model_input(perturbed_tensor), "a b x d e z")
 
     @parameterized.expand(
@@ -54,8 +54,8 @@ def test_input_with_baselines(self, template, inputs, baselines) -> None:
             ),
         ]
     )
-    def test_input_with_mask(self, template, inputs, mask) -> None:
-        tt_input = TextTemplateInput(template, inputs, mask=mask)
+    def test_input_with_mask(self, template, values, mask) -> None:
+        tt_input = TextTemplateInput(template, values, mask=mask)
 
         expected_tensor = torch.tensor([[1.0] * 2])
         assertTensorAlmostEqual(self, tt_input.to_tensor(), expected_tensor)
@@ -75,8 +75,8 @@ def test_input_with_mask(self, template, inputs, mask) -> None:
             ),
         ]
     )
-    def test_format_attr(self, template, inputs, mask) -> None:
-        tt_input = TextTemplateInput(template, inputs, mask=mask)
+    def test_format_attr(self, template, values, mask) -> None:
+        tt_input = TextTemplateInput(template, values, mask=mask)
 
         attr = torch.tensor([[0.1, 0.2]])
 

Original file line number	Diff line number	Diff line change
`@@ -153,7 +153,7 @@ def _format_model_input(self, model_input: Union[str, Tensor]):`
`153`	`153`	`raw text and text token tensors`
`154`	`154`	`"""`
`155`	`155`	`# return tensor(1, n_tokens)`
`156`		`- if type(model_input) is str:`
	`156`	`+ if isinstance(model_input, str):`
`157`	`157`	`return self.tokenizer.encode(model_input, return_tensors="pt").to(`
`158`	`158`	`self.device`
`159`	`159`	`)`
Original file line number	Diff line number	Diff line change
`@@ -16,8 +16,8 @@ class TestTextTemplateInput(BaseTest):`
`16`	`16`	`),`
`17`	`17`	`]`
`18`	`18`	`)`
`19`		`- def test_input(self, template, inputs) -> None:`
`20`		`- tt_input = TextTemplateInput(template, inputs)`
	`19`	`+ def test_input(self, template, values) -> None:`
	`20`	`+ tt_input = TextTemplateInput(template, values)`
`21`	`21`
`22`	`22`	`expected_tensor = torch.tensor([[1.0] * 4])`
`23`	`23`	`assertTensorAlmostEqual(self, tt_input.to_tensor(), expected_tensor)`
`@@ -37,11 +37,11 @@ def test_input(self, template, inputs) -> None:`
`37`	`37`	`),`
`38`	`38`	`]`
`39`	`39`	`)`
`40`		`- def test_input_with_baselines(self, template, inputs, baselines) -> None:`
	`40`	`+ def test_input_with_baselines(self, template, values, baselines) -> None:`
`41`	`41`	`perturbed_tensor = torch.tensor([[1.0, 0.0, 1.0, 0.0]])`
`42`	`42`
`43`	`43`	`# single instance baselines`
`44`		`- tt_input = TextTemplateInput(template, inputs, baselines=baselines)`
	`44`	`+ tt_input = TextTemplateInput(template, values, baselines=baselines)`
`45`	`45`	`self.assertEqual(tt_input.to_model_input(perturbed_tensor), "a b x d e z")`
`46`	`46`
`47`	`47`	`@parameterized.expand(`
`@@ -54,8 +54,8 @@ def test_input_with_baselines(self, template, inputs, baselines) -> None:`
`54`	`54`	`),`
`55`	`55`	`]`
`56`	`56`	`)`
`57`		`- def test_input_with_mask(self, template, inputs, mask) -> None:`
`58`		`- tt_input = TextTemplateInput(template, inputs, mask=mask)`
	`57`	`+ def test_input_with_mask(self, template, values, mask) -> None:`
	`58`	`+ tt_input = TextTemplateInput(template, values, mask=mask)`
`59`	`59`
`60`	`60`	`expected_tensor = torch.tensor([[1.0] * 2])`
`61`	`61`	`assertTensorAlmostEqual(self, tt_input.to_tensor(), expected_tensor)`
`@@ -75,8 +75,8 @@ def test_input_with_mask(self, template, inputs, mask) -> None:`
`75`	`75`	`),`
`76`	`76`	`]`
`77`	`77`	`)`
`78`		`- def test_format_attr(self, template, inputs, mask) -> None:`
`79`		`- tt_input = TextTemplateInput(template, inputs, mask=mask)`
	`78`	`+ def test_format_attr(self, template, values, mask) -> None:`
	`79`	`+ tt_input = TextTemplateInput(template, values, mask=mask)`
`80`	`80`
`81`	`81`	`attr = torch.tensor([[0.1, 0.2]])`
`82`	`82`