Линейная регрессия и L1/L2-регуляризация

Sign up for the full Machine Learning in Python course at [email protected] Linear regression can be written in general as: y = a0 + a1*x1 + ... + an*xn Where y is the value of the unknown variable, and xi are the known parameters. One option for optimizing linear regression hyperparameters is to eliminate the intercept (a0), meaning we assume that the dependent, predicted process is completely determined by the independent variables. Another option for optimizing linear regression hyperparameters is regularization—that is, intentionally shifting the weights in the model to reduce statistical error. Naturally, to minimize the weights, the input data must be normalized. The coefficients ai are calculated to minimize the error, i.e., Minimize the expression: L = Σ(y - yi)^2 What if we add another term to this expression to somehow reduce the values ​​of the coefficients ai? For example, instead of L, we could minimize the expression: L1 = Σ(y - yi)^2 + λ1*Σ|ai| or another option L2 = Σ(y - yi)^2 + λ2*Σ(ai)^2 What have we done here? We've added a penalty to our expression for large values ​​of ai. And the magnitude of this penalty is proportional to the parameter λ, which we can now use to tune our algorithm. The first option is called L1 regularization (LASSO regression in English literature), the second option is L2 regularization, or Tikhonov regularization, or ridge regularization. Combining these two approaches yields ElasticNet: L = Σ(y - yi)^2 + λ1*Σ|ai| + λ2*Σ(ai)^2 Since the values ​​of λ can be arbitrary, a "greedy" search is typically performed over a logarithmic grid of values, from 0.01 to 100, and then the resulting optimal pair of values ​​is refined.

BIC и AIC
▶︎

BIC и AIC

Dropout и регуляризация: почему без них ML не работает
▶︎

Dropout и регуляризация: почему без них ML не работает

Линейная регрессия. Что спросят на собеседовании? ч.1
▶︎

Линейная регрессия. Что спросят на собеседовании? ч.1

Логистическая функция потерь и кросс-энтропия
▶︎

Логистическая функция потерь и кросс-энтропия

Аппроксимация данных
▶︎

Аппроксимация данных

Функционалы потерь и метрики регрессии. Простым языком!
▶︎

Функционалы потерь и метрики регрессии. Простым языком!

Регуляризация простыми словами | L1, L2, Elastic Net | Lasso, Ridge | Машинное обучение
▶︎

Регуляризация простыми словами | L1, L2, Elastic Net | Lasso, Ridge | Машинное обучение

Обратное распространение ошибки
▶︎

Обратное распространение ошибки

Regularization Part 1: Ridge (L2) Regression
▶︎

Regularization Part 1: Ridge (L2) Regression

Elastic Net Regression in scikit-learn: Balancing L1 and L2 Optimizations
▶︎

Elastic Net Regression in scikit-learn: Balancing L1 and L2 Optimizations

Почему L1 регуляризация отбирает признаки? Понятное объяснение
▶︎

Почему L1 регуляризация отбирает признаки? Понятное объяснение

Логистическая регрессия, самое простое объяснение!
▶︎

Логистическая регрессия, самое простое объяснение!

Авторегрессия
▶︎

Авторегрессия

Лекция 6. Регуляризация. Назначение и примеры использования
▶︎

Лекция 6. Регуляризация. Назначение и примеры использования

L1 and L2 Regularization
▶︎

L1 and L2 Regularization

Логистическая регрессия
▶︎

Логистическая регрессия

Градиентный спуск
▶︎

Градиентный спуск

ML Training. Lecture 2: Linear Regression and Regularization
▶︎

ML Training. Lecture 2: Linear Regression and Regularization

What is linear regression? Dushkin will explain
▶︎

What is linear regression? Dushkin will explain

Регуляризация в Sklearn | L1, L2, Elastic Net | Lasso, Ridge, LogisticRegression | Машинное обучение
▶︎

Регуляризация в Sklearn | L1, L2, Elastic Net | Lasso, Ridge, LogisticRegression | Машинное обучение