Accueil l'audio Comment les entreprises pourraient-elles utiliser des modèles forestiers aléatoires pour les prévisions?

Comment les entreprises pourraient-elles utiliser des modèles forestiers aléatoires pour les prévisions?

Anonim

Q:

Comment les entreprises pourraient-elles utiliser des modèles forestiers aléatoires pour les prévisions?

UNE:

Les entreprises utilisent souvent des modèles de forêt aléatoires afin de faire des prédictions avec des processus d'apprentissage automatique. La forêt aléatoire utilise plusieurs arbres de décision pour effectuer une analyse plus globale d'un ensemble de données donné.

Un arbre de décision unique fonctionne sur la base de la séparation d'une ou de plusieurs variables selon un processus binaire. Par exemple, lors de l'évaluation d'ensembles de données liés à un ensemble de voitures ou de véhicules, un seul arbre de décision pourrait trier et classer chaque véhicule en fonction de son poids, en les séparant en véhicules lourds ou légers.

La forêt aléatoire s'appuie sur le modèle d'arbre de décision et le rend plus sophistiqué. Les experts parlent de forêts aléatoires comme représentant une «discrimination stochastique» ou la méthode de «supposition stochastique» sur des données appliquées à des espaces multidimensionnels. La discrimination stochastique tend à être un moyen d'améliorer l'analyse des modèles de données au-delà de ce qu'un arbre de décision unique peut faire.

Fondamentalement, une forêt aléatoire crée de nombreux arbres de décision individuels travaillant sur des variables importantes avec un certain ensemble de données appliqué. Un facteur clé est que dans une forêt aléatoire, l'ensemble de données et l'analyse variable de chaque arbre de décision se chevauchent généralement. C'est important pour le modèle, car le modèle de forêt aléatoire prend les résultats moyens pour chaque arbre de décision et les factorise dans une décision pondérée. Essentiellement, l'analyse prend tous les votes des divers arbres de décision et établit un consensus pour offrir des résultats productifs et logiques.

Un exemple d'utilisation productive d'un algorithme de forêt aléatoire est disponible sur le site R-blogger, où l'écrivain Teja Kodali prend l'exemple de la détermination de la qualité du vin à l'aide de facteurs tels que l'acidité, le sucre, les niveaux de dioxyde de soufre, le pH et la teneur en alcool. Kodali explique comment un algorithme de forêt aléatoire utilise un petit sous-ensemble aléatoire de caractéristiques pour chaque arbre individuel, puis utilise les moyennes résultantes.

Dans cet esprit, les entreprises souhaitant utiliser des algorithmes d'apprentissage automatique des forêts aléatoires pour la modélisation prédictive isoleront d'abord les données prédictives qui doivent être résumées dans un ensemble de productions, puis les appliqueront au modèle forestier aléatoire en utilisant un certain ensemble de formations. Les données. Les algorithmes d'apprentissage automatique prennent ces données de formation et travaillent avec elles pour évoluer au-delà des contraintes de leur programmation d'origine. Dans le cas des modèles forestiers aléatoires, la technologie apprend à former des résultats prédictifs plus sophistiqués en utilisant ces arbres de décision individuels pour construire son consensus forestier aléatoire.

Une façon d'appliquer cela aux entreprises consiste à prendre diverses variables de propriété du produit et à utiliser une forêt aléatoire pour indiquer l'intérêt potentiel du client. Par exemple, s'il existe des facteurs d'intérêt connus des clients tels que la couleur, la taille, la durabilité, la portabilité ou toute autre chose pour laquelle les clients ont indiqué leur intérêt, ces attributs peuvent être introduits dans les ensembles de données et analysés sur la base de leur propre impact unique pour le multifacteur. une analyse.

Comment les entreprises pourraient-elles utiliser des modèles forestiers aléatoires pour les prévisions?