fix bug

n1ck-guo · n1ck-guo · commit 4c45d10adbd9 · 2025-02-24T08:41:10.000-05:00
Signed-off-by: n1ck-guo &lt;heng.guo@intel.com&gt;
diff --git a/neural_compressor/adaptor/torch_utils/gptq.py b/neural_compressor/adaptor/torch_utils/gptq.py
@@ -745,6 +745,7 @@ def tmp(_, inp, out):
             for j in range(len(self.dataloader)):
                 cache_keyword_batch = self.gather_single_batch_from_dict(self.cache_key_arguments, j)
                 cache_positional_batch = self.gather_single_batch_from_list(self.cache_positional_arguments, j)
+                transformer_block.to(cache_positional_batch[0].dtype)
                 out = transformer_block(*cache_positional_batch, **cache_keyword_batch)
                 out = self.track_hidden_states(out)
                 outs.append(out)
@@ -967,7 +968,6 @@ def fasterquant(self, W, blocksize=128, percdamp=0.01, groupsize=-1, act_order=F
                     if not static_groups:
                         if (i1 + i) % groupsize == 0:
                             self.quantizer.find_params(W[:, (i1 + i) : (i1 + i + groupsize)], weight=True)
-                            scale.append(self.quantizer.scale)
                             zero.append(self.quantizer.zero)
                     else:
                         idx = i1 + i