Statistiques non euclidiennes : au-delà de la régression linéaire
Les universitaires, les chercheurs, l’industrie et les militants tentent d’influencer les politiques publiques en utilisant l’analyse des données. En économie, la régression linéaire est le cheval de bataille de la recherche quantitative. La régression linéaire nécessite une série d’hypothèses ainsi qu’un ensemble de restrictions sur les types de données et les relations entre ces données qui peuvent exister. Et s’il existait d’autres méthodes pour analyser les relations entre les variables qui ne nécessiteraient pas ces hypothèses ou restrictions? Cela ouvrirait un nouvel ensemble de données et permettrait potentiellement la découverte d’un nouvel ensemble de résultats qui pourraient aboutir à de meilleures politiques.
Cet article de la Brookings Institution considère l’application d’un type de modèle statistique avancé qui n’utilise pas la régression linéaire et même ne prend pas une forme spécifique derrière les relations fonctionnelles entre les variables. L’article détaille trois exemples pour démontrer sa capacité à détecter des relations dans des données qui ne présentent initialement ni une échelle numérique ni une échelle ordinale. Ces trois exemples, soit le statut socio-économique, l’évolution des cours des actions dans le temps et les habitudes de vote au sein du Congrès américain, n’ont aucune relation intrinsèque les uns avec les autres. Ils ont été étudiés et analysés ensemble pour montrer la capacité de ce modèle à détecter et quantifier des relations intéressantes.
Plus précisément, ce modèle d’intelligence artificielle utilise des techniques statistiques non euclidiennes afin d’inférer des échelles quantitatives pour les variables et d’estimer les distances métriques entre les attributs. Le modèle évalue l’ajustement par chi carré, un modèle d’erreur statistiquement différent de la distribution normale, qui est couramment utilisée dans la régression linéaire. En évitant l’utilisation de techniques de régression et de statistiques, ce modèle a le potentiel de découvrir de nouvelles perspectives. Il amène également la question plus large de savoir où l’analyse future peut migrer, car les capacités mathématiques et informatiques créent des possibilités pour des outils analytiques plus sophistiqués que l’analyse de régression.
Les universitaires, les chercheurs, l’industrie et les militants tentent d’influencer les politiques publiques en utilisant l’analyse des données. En économie, la régression linéaire est le cheval de bataille de la recherche quantitative. La régression linéaire nécessite une série d’hypothèses ainsi qu’un ensemble de restrictions sur les types de données et les relations entre ces données qui peuvent exister. Et s’il existait d’autres méthodes pour analyser les relations entre les variables qui ne nécessiteraient pas ces hypothèses ou restrictions? Cela ouvrirait un nouvel ensemble de données et permettrait potentiellement la découverte d’un nouvel ensemble de résultats qui pourraient aboutir à de meilleures politiques.
Cet article de la Brookings Institution considère l’application d’un type de modèle statistique avancé qui n’utilise pas la régression linéaire et même ne prend pas une forme spécifique derrière les relations fonctionnelles entre les variables. L’article détaille trois exemples pour démontrer sa capacité à détecter des relations dans des données qui ne présentent initialement ni une échelle numérique ni une échelle ordinale. Ces trois exemples, soit le statut socio-économique, l’évolution des cours des actions dans le temps et les habitudes de vote au sein du Congrès américain, n’ont aucune relation intrinsèque les uns avec les autres. Ils ont été étudiés et analysés ensemble pour montrer la capacité de ce modèle à détecter et quantifier des relations intéressantes.
Plus précisément, ce modèle d’intelligence artificielle utilise des techniques statistiques non euclidiennes afin d’inférer des échelles quantitatives pour les variables et d’estimer les distances métriques entre les attributs. Le modèle évalue l’ajustement par chi carré, un modèle d’erreur statistiquement différent de la distribution normale, qui est couramment utilisée dans la régression linéaire. En évitant l’utilisation de techniques de régression et de statistiques, ce modèle a le potentiel de découvrir de nouvelles perspectives. Il amène également la question plus large de savoir où l’analyse future peut migrer, car les capacités mathématiques et informatiques créent des possibilités pour des outils analytiques plus sophistiqués que l’analyse de régression.