Régression linéaire : une définition
La régression linéaire est une technique statistique de modélisation des relations entre différentes variables (dépendantes et indépendantes). Utilisée pour décrire et analyser les valeurs ou données, la régression linéaire a pour objectif de réaliser des prédictions ou des prévisions.
Exemple de régression linéaire
Les moindres carrés ordinaires (MCO)
De manière générale, la régression linéaire a recours à la méthode d’estimation par les moindres carrés ordinaires (MCO) qui établissent une équation linéaire en réduisant la somme des valeurs résiduelles mises au carré.
Régression linéaire et de corrélation
Les analyses de régression et de corrélation font partie des techniques analytiques multivariées. Elles sont utilisées dans des domaines très différents (sciences naturelles, statistiques, finance et marketing digital) afin d’analyser et prédire de manière partielle toutes sortes d’actions, d’événements ou de quantités.
Fonctionnement d’une régression linéaire
La régression linéaire utilise une technique d’estimation choisie, une variable dépendante et une ou plusieurs variables explicatives pour former une équation linéaire estimant les valeurs de la variable dépendante. Ceci en supposant qu’il existe une relation de causalité entre les deux variables.
Exemple de régression linéaire
À titre d’exemple : vous cherchez à déterminer comment vos investissements publicitaires agissent sur le niveau de vos ventes. Pour ce faire, on utilisera une régression linéaire pour examiner la relation entre les deux variables (investissements et ventes). Elle servira de prévision si cette relation est clairement représentée.
Les principaux objectifs des régressions linéaires
- Identifier les variables explicatives qui sont associées à la variable dépendante
- Comprendre la relation entre les variables dépendantes et explicatives
- Faire des prévisions
Applications et types de régression linéaire
Exemples d’applications
- La modélisation des accidents de la circulation en fonction de la vitesse, de l’état des routes et autres pour informer les services de la police routière.
- La modélisation des taux de maintien au lycée pour mieux comprendre les facteurs qui contribuent à l’abandon scolaire.
- La modélisation des pertes immobilières par incendie comme fonction de variables : le degré d’implication des pompiers, le temps de réaction ou les valeurs mobilières.
Les différents types de régression
- La régression simple
- La régression multiple
- La régression linéaire
- La régression non-linéaire
Crédit image : Aron Vellekoop León – Dribble