Table des matières:
Définition - Que signifie le Web Mining?
L'exploration Web est le processus d'utilisation de techniques et d'algorithmes d'exploration de données pour extraire des informations directement du Web en les extrayant des documents et services Web, du contenu Web, des hyperliens et des journaux de serveur. L'objectif de l'exploration Web est de rechercher des modèles dans les données Web en collectant et en analysant des informations afin de mieux comprendre les tendances, l'industrie et les utilisateurs en général.Techopedia explique le Web Mining
L'exploration Web est une branche de l'exploration de données se concentrant sur le World Wide Web en tant que source de données principale, y compris tous ses composants à partir du contenu Web, les journaux du serveur pour tout le reste. Le contenu des données extraites du Web peut être une collection de faits que les pages Web sont censées contenir, et celles-ci peuvent être constituées de texte, de données structurées telles que des listes et des tableaux, et même des images, de la vidéo et de l'audio.
Catégories de Web mining:
- Exploration de contenu Web - Il s'agit du processus d'extraction d'informations utiles à partir du contenu de pages Web et de documents Web, qui sont principalement du texte, des images et des fichiers audio / vidéo. Les techniques utilisées dans cette discipline sont fortement inspirées du traitement du langage naturel (PNL) et de la recherche d'informations.
- Exploration de la structure Web - Il s'agit du processus d'analyse des nœuds et de la structure de connexion d'un site Web à l'aide de la théorie des graphes. Il y a deux choses qui peuvent être obtenues à partir de cela: la structure d'un site Web en termes de connexion à d'autres sites et la structure de document du site Web lui-même, en ce qui concerne la façon dont chaque page est connectée.
- Exploration de l'utilisation du Web - Il s'agit du processus d'extraction de modèles et d'informations à partir des journaux du serveur pour obtenir un aperçu de l'activité des utilisateurs, notamment de la provenance des utilisateurs, du nombre de clics sur quel élément du site et des types d'activités effectuées sur le site.
