mlr-org
diff --git a/‎NAMESPACE
+3 b/‎NAMESPACE
+3
diff --git a/‎NEWS.md
+2-4 b/‎NEWS.md
+2-4
diff --git a/‎R/bibentries.R
+9-1 b/‎R/bibentries.R
+9-1
diff --git a/‎R/learner_prioritylasso_classif_priority_lasso.R
+138 b/‎R/learner_prioritylasso_classif_priority_lasso.R
+138
diff --git a/‎R/learner_prioritylasso_regr_priority_lasso.R
+132 b/‎R/learner_prioritylasso_regr_priority_lasso.R
+132
@@ -27,6 +27,7 @@ export(LearnerClassifLightGBM)
 export(LearnerClassifMob)
 export(LearnerClassifOneR)
 export(LearnerClassifPART)
+export(LearnerClassifPriorityLasso)
 export(LearnerClassifRandomForest)
 export(LearnerClassifRandomForestSRC)
 export(LearnerDensKDEks)
@@ -59,6 +60,7 @@ export(LearnerRegrLmer)
 export(LearnerRegrM5Rules)
 export(LearnerRegrMars)
 export(LearnerRegrMob)
+export(LearnerRegrPriorityLasso)
 export(LearnerRegrRSM)
 export(LearnerRegrRVM)
 export(LearnerRegrRandomForest)
@@ -87,6 +89,7 @@ export(LearnerSurvObliqueRSF)
 export(LearnerSurvPCHazard)
 export(LearnerSurvParametric)
 export(LearnerSurvPenalized)
+export(LearnerSurvPriorityLasso)
 export(LearnerSurvRandomForestSRC)
 export(LearnerSurvRanger)
 export(LearnerSurvSVM)
 
@@ -1,13 +1,11 @@
-# mlr3extralearners 0.6.1
-
-
 # mlr3extralearners 0.6.0-9000
 
 * BREAKING CHANGE: lightgbm's early stopping mechanism now uses the task's test set.
 * feat: Add two new learners `regr.abess` and `classif.abess` (thanks to @bbayukari)
 * feat: Added learner `LearnerClassifImbalancedRandomForestSRC` (thanks to
   @HarutyunyanLiana)
-
+ * Feat: Added learners `LearnerClassifPriorityLasso`, `LearnerRegrPriorityLasso`, `LearnerSurvPriorityLasso` (thanks to
+  @HarutyunyanLiana)
 
 # mlr3extralearners 0.6.0
 
 
@@ -550,6 +550,14 @@ bibentries = c( # nolint start
     pages = "1--17",
     year = "2010"
   ),
+  klau2018priolasso = bibentry("article",
+    title = "Priority-Lasso: a simple hierarchical approach to the prediction of clinical outcome using multi-omics data",
+    author = "Klau Simon, Jurinovic Vindi, Hornung Roman, Herold Tobias, Boulesteix Anne-Laure",
+    journal = "BMC Bioinformatics",
+    volume = "19",
+    year = "2018",
+    doi = "10.1186/s12859-018-2344-6"
+  ),
   obrien2019imbrfsrc = bibentry("article",
     title = "A random forests quantile classifier for class imbalanced data",
     author = "Robert O\xe2\x80\x99Brien and Hemant Ishwaran",
@@ -566,4 +574,4 @@ bibentries = c( # nolint start
     month = "01",
     journal = "University of California, Berkeley"
   )
-) # nolint end
+) # nolint end
@@ -0,0 +1,138 @@
+#' @title Classification Priority Lasso Learner
+#' @author HarutyunyanLiana
+#' @name mlr_learners_classif.priority_lasso
+#'
+#' @description
+#' Patient outcome prediction based on multi-omics data taking practitioners’ preferences into account.
+#' Calls [prioritylasso::prioritylasso()] from \CRANpkg{prioritylasso}.
+#'
+#' @templateVar id classif.priority_lasso
+#' @template learner
+#'
+#' @references
+#' `r format_bib("klau2018priolasso")`
+#'
+#' @template seealso_learner
+#' @template example
+#' @export
+LearnerClassifPriorityLasso = R6Class("LearnerClassifPriorityLasso",
+  inherit = LearnerClassif,
+  public = list(
+    #' @description
+    #' Creates a new instance of this [R6][R6::R6Class] class.
+    initialize = function() {
+      param_set = ps(
+        blocks               = p_uty(default = NULL, tags = c("train", "required")),
+        type.measure         = p_fct(default = "class", levels = c("class", "auc"), tags = c("train", "required")),
+        max.coef             = p_uty(default = NULL, tags = "train"),
+        block1.penalization  = p_lgl(default = TRUE, tags = "train"),
+        lambda.type          = p_fct(default = "lambda.min", levels = c("lambda.min", "lambda.1se"), tags = c("train", "predict")), #nolint
+        standardize          = p_lgl(default = TRUE, tags = "train"),
+        nfolds               = p_int(default = 5L, lower = 1L, tags = "train"),
+        foldid               = p_uty(default = NULL, tags = "train"),
+        cvoffset             = p_lgl(default = FALSE, tags = "train"),
+        cvoffsetnfolds       = p_int(default = 10, lower = 1L, tags = "train"),
+
+        # params from cv.glmnet
+        alignment            = p_fct(c("lambda", "fraction"), default = "lambda", tags = "train"),
+        alpha                = p_dbl(0, 1, default = 1, tags = "train"),
+        big                  = p_dbl(default = 9.9e35, tags = "train"),
+        devmax               = p_dbl(0, 1, default = 0.999, tags = "train"),
+        dfmax                = p_int(0L, tags = "train"),
+        eps                  = p_dbl(0, 1, default = 1.0e-6, tags = "train"),
+        epsnr                = p_dbl(0, 1, default = 1.0e-8, tags = "train"),
+        exclude              = p_uty(tags = "train"),
+        exmx                 = p_dbl(default = 250.0, tags = "train"),
+        fdev                 = p_dbl(0, 1, default = 1.0e-5, tags = "train"),
+        gamma                = p_uty(tags = "train"),
+        grouped              = p_lgl(default = TRUE, tags = "train"),
+        intercept            = p_lgl(default = TRUE, tags = "train"),
+        keep                 = p_lgl(default = FALSE, tags = "train"),
+        lambda               = p_uty(tags = "train"),
+        lambda.min.ratio     = p_dbl(0, 1, tags = "train"),
+        lower.limits         = p_uty(default = -Inf, tags = "train"),
+        maxit                = p_int(1L, default = 100000L, tags = "train"),
+        mnlam                = p_int(1L, default = 5L, tags = "train"),
+        mxit                 = p_int(1L, default = 100L, tags = "train"),
+        mxitnr               = p_int(1L, default = 25L, tags = "train"),
+        nlambda              = p_int(1L, default = 100L, tags = "train"),
+        offset               = p_uty(default = NULL, tags = "train"),
+        parallel             = p_lgl(default = FALSE, tags = "train"),
+        penalty.factor       = p_uty(tags = "train"),
+        pmax                 = p_int(0L, tags = "train"),
+        pmin                 = p_dbl(0, 1, default = 1.0e-9, tags = "train"),
+        prec                 = p_dbl(default = 1e-10, tags = "train"),
+        predict.gamma        = p_dbl(default = "gamma.1se", special_vals = list("gamma.1se", "gamma.min"), tags = "predict"), #nolint
+        relax                = p_lgl(default = FALSE, tags = "train"),
+        s                    = p_dbl(0, 1, special_vals = list("lambda.1se", "lambda.min"), default = "lambda.1se", tags = "predict"), #nolint
+        standardize.response = p_lgl(default = FALSE, tags = "train"),
+        thresh               = p_dbl(0, default = 1e-07, tags = "train"),
+        trace.it             = p_int(0, 1, default = 0, tags = "train"),
+        type.gaussian        = p_fct(c("covariance", "naive"), tags = "train"),
+        type.logistic        = p_fct(c("Newton", "modified.Newton"), default = "Newton", tags = "train"),
+        type.multinomial     = p_fct(c("ungrouped", "grouped"), default = "ungrouped", tags = "train"),
+        upper.limits         = p_uty(default = Inf, tags = "train")
+      )
+
+      super$initialize(
+        id = "classif.priority_lasso",
+        packages = "prioritylasso",
+        feature_types = c("logical", "integer", "numeric"),
+        predict_types = c("response", "prob"),
+        param_set = param_set,
+        properties = c("weights", "selected_features", "twoclass"),
+        man = "mlr3extralearners::mlr_learners_classif.priority_lasso",
+        label = "Priority Lasso"
+      )
+    },
+
+    #' @description
+    #' Selected features, i.e. those where the coefficient is positive.
+    #' @return `character()`.
+    selected_features = function() {
+      if (is.null(self$model)) {
+        stopf("No model stored")
+      }
+      coefs = self$model$coefficients
+      coefs = coefs[coefs != 0]
+      names(coefs)
+    }
+  ),
+  private = list(
+    .train = function(task) {
+      # get parameters for training
+      pars = self$param_set$get_values(tags = "train")
+      pars$family = "binomial"
+
+      if ("weights" %in% task$properties) {
+        pars$weights = task$weights$weight
+      }
+      data = as_numeric_matrix(task$data(cols = task$feature_names))
+      target = task$truth()
+      invoke(prioritylasso::prioritylasso,
+             X = data, Y = target,
+             .args = pars)
+    },
+    .predict = function(task) {
+      newdata = as_numeric_matrix(ordered_features(task, self))
+      pv = self$param_set$get_values(tags = "predict")
+      pv = rename(pv, "predict.gamma", "gamma")
+
+      p = invoke(predict, self$model,
+        newdata = newdata, type = "response",
+        .args = pv)
+      p = drop(p)
+      classnames = self$model$glmnet.fit[[1L]]$classnames
+      if (self$predict_type == "response") {
+        response = ifelse(p <= 0.5, classnames[1L], classnames[2L])
+        list(response = drop(response))
+      } else {
+        prob = cbind(1 - p, p)
+        colnames(prob) = classnames
+        list(prob = prob)
+      }
+    }
+  )
+)
+
+.extralrns_dict$add("classif.priority_lasso", LearnerClassifPriorityLasso)
@@ -0,0 +1,132 @@
+#' @title Regression Priority Lasso Learner
+#' @author HarutyunyanLiana
+#' @name mlr_learners_regr.priority_lasso
+#'
+#' @description
+#' Patient outcome prediction based on multi-omics data taking practitioners’ preferences into account.
+#' Calls [prioritylasso::prioritylasso()] from \CRANpkg{prioritylasso}.
+#'
+#'
+#' @templateVar id regr.priority_lasso
+#' @template learner
+#'
+#' @references
+#' `r format_bib("klau2018priolasso")`
+#'
+#' @template seealso_learner
+#' @template example
+#' @export
+LearnerRegrPriorityLasso = R6Class("LearnerRegrPriorityLasso",
+  inherit = LearnerRegr,
+  public = list(
+    #' @description
+    #' Creates a new instance of this [R6][R6::R6Class] class.
+    initialize = function() {
+      param_set = ps(
+        blocks               = p_uty(default = NULL, tags = c("train", "required")), 
+        max.coef             = p_uty(default = NULL, tags = "train"),
+        block1.penalization  = p_lgl(default = TRUE, tags = "train"),
+        lambda.type          = p_fct(default = "lambda.min", levels = c("lambda.min", "lambda.1se"), tags = c("train", "predict")),
+        standardize          = p_lgl(default = TRUE, tags = "train"),
+        nfolds               = p_int(default = 5L, lower = 1L, tags = "train"),
+        foldid               = p_uty(default = NULL, tags = "train"),
+        cvoffset             = p_lgl(default = FALSE, tags = "train"),
+        cvoffsetnfolds       = p_int(default = 10, lower = 1L, tags = "train"),
+
+        # params from cv.glmnet
+        alignment            = p_fct(c("lambda", "fraction"), default = "lambda", tags = "train"),
+        alpha                = p_dbl(0, 1, default = 1, tags = "train"),
+        big                  = p_dbl(default = 9.9e35, tags = "train"),
+        devmax               = p_dbl(0, 1, default = 0.999, tags = "train"),
+        dfmax                = p_int(0L, tags = "train"),
+        eps                  = p_dbl(0, 1, default = 1.0e-6, tags = "train"),
+        epsnr                = p_dbl(0, 1, default = 1.0e-8, tags = "train"),
+        exclude              = p_uty(tags = "train"),
+        exmx                 = p_dbl(default = 250.0, tags = "train"),
+        fdev                 = p_dbl(0, 1, default = 1.0e-5, tags = "train"),
+        gamma                = p_uty(tags = "train"),
+        grouped              = p_lgl(default = TRUE, tags = "train"),
+        intercept            = p_lgl(default = TRUE, tags = "train"),
+        keep                 = p_lgl(default = FALSE, tags = "train"),
+        lambda               = p_uty(tags = "train"),
+        lambda.min.ratio     = p_dbl(0, 1, tags = "train"),
+        lower.limits         = p_uty(default = -Inf, tags = "train"),
+        maxit                = p_int(1L, default = 100000L, tags = "train"),
+        mnlam                = p_int(1L, default = 5L, tags = "train"),
+        mxit                 = p_int(1L, default = 100L, tags = "train"),
+        mxitnr               = p_int(1L, default = 25L, tags = "train"),
+        nlambda              = p_int(1L, default = 100L, tags = "train"),
+        offset               = p_uty(default = NULL, tags = "train"),
+        parallel             = p_lgl(default = FALSE, tags = "train"),
+        penalty.factor       = p_uty(tags = "train"),
+        pmax                 = p_int(0L, tags = "train"),
+        pmin                 = p_dbl(0, 1, default = 1.0e-9, tags = "train"),
+        prec                 = p_dbl(default = 1e-10, tags = "train"),
+        predict.gamma        = p_dbl(default = "gamma.1se", special_vals = list("gamma.1se", "gamma.min"), tags = "predict"),
+        relax                = p_lgl(default = FALSE, tags = "train"),
+        s                    = p_dbl(0, 1, special_vals = list("lambda.1se", "lambda.min"), default = "lambda.1se", tags = "predict"),
+        standardize.response = p_lgl(default = FALSE, tags = "train"),
+        thresh               = p_dbl(0, default = 1e-07, tags = "train"),
+        trace.it             = p_int(0, 1, default = 0, tags = "train"),
+        type.gaussian        = p_fct(c("covariance", "naive"), tags = "train"),
+        type.logistic        = p_fct(c("Newton", "modified.Newton"), default = "Newton", tags = "train"),
+        type.multinomial     = p_fct(c("ungrouped", "grouped"), default = "ungrouped", tags = "train"),
+        upper.limits         = p_uty(default = Inf, tags = "train")
+      )
+
+      super$initialize(
+        id = "regr.priority_lasso",
+        packages = "prioritylasso",
+        feature_types = c("logical", "integer", "numeric"),
+        predict_types = "response",
+        param_set = param_set,
+        properties = c("weights", "selected_features"),
+        man = "mlr3extralearners::mlr_learners_regr.priority_lasso",
+        label = "Priority Lasso"
+      )
+    },
+
+    #' @description
+    #' Selected features when coef is positive
+    #' @return `character()`.
+    selected_features = function() {
+      if (is.null(self$model)) {
+        stopf("No model stored")
+      }
+      coefs = self$model$coefficients
+      coefs = coefs[coefs != 0]
+      names(coefs)
+    }
+  ),
+  private = list(
+    .train = function(task) {
+      # get parameters for training
+      pars = self$param_set$get_values(tags = "train")
+      pars$family = "gaussian"
+      pars$type.measure = "mse"
+
+      if ("weights" %in% task$properties) {
+        pars$weights = as.numeric(task$weights$weight)
+      }
+      data = as.matrix(task$data(cols = task$feature_names))
+      target = task$truth()
+      invoke(prioritylasso::prioritylasso,
+             X = data, Y = target,
+             .args = pars)
+    },
+    .predict = function(task) {
+      # get parameters with tag "predict"
+      pars = self$param_set$get_values(tags = "predict")
+      pars = rename(pars, "predict.gamma", "gamma")
+
+      # get newdata and ensure same ordering in train and predict
+      newdata = as.matrix(ordered_features(task, self))
+
+      pred = invoke(predict, self$model, newdata = newdata, type = "response", .args = pars)
+
+      list(response = pred)
+    }
+  )
+)
+
+.extralrns_dict$add("regr.priority_lasso", LearnerRegrPriorityLasso)