change sign

Yuheng Tu · Yuheng Tu · commit 7c6088fb9d2a · 2025-03-23T08:46:18.000-07:00
diff --git a/src/helm/benchmark/reeval_runner.py b/src/helm/benchmark/reeval_runner.py
@@ -82,7 +82,7 @@ def _estimate_model_ability(
     ) -> float:
         def closure():
             optim.zero_grad()
-            probs = torch.sigmoid(ability - difficulties)
+            probs = torch.sigmoid(ability + difficulties)
             loss = -torch.distributions.Bernoulli(probs=probs).log_prob(responses).mean()
             loss.backward()
             return loss