Accueil Les tendances Qu'est-ce que Apache Nutch? - définition de techopedia

Qu'est-ce que Apache Nutch? - définition de techopedia

Table des matières:

Anonim

Définition - Que signifie Apache Nutch?

Apache Nutch est un logiciel de robot d'indexation Web qui peut être utilisé pour agréger les données du Web. Il est utilisé conjointement avec d'autres outils Apache, tels que Hadoop, pour l'analyse des données.

Techopedia explique Apache Nutch

Apache Nutch est un produit open source sous licence de la Apache Software Foundation. Cette communauté de développeurs détient des licences pour une gamme d'outils logiciels Apache qui peuvent trier et analyser les données. Une des technologies centrales est Apache Hadoop, un outil d'analyse du Big Data très populaire dans le monde des affaires.

Outre des outils comme Apache Hadoop et des fonctionnalités de stockage, d'analyse et plus encore, le rôle de Nutch est de collecter et de stocker des données sur le Web grâce à l'utilisation d'algorithmes d'analyse Web.

Les utilisateurs peuvent profiter de commandes simples dans Apache Nutch pour collecter des informations sous des URL. Les utilisateurs utilisent généralement Apache Nutch avec un autre outil open-source, un framework appelé Apache Solr, qui peut servir de référentiel pour les données collectées avec Apache Nutch.

Qu'est-ce que Apache Nutch? - définition de techopedia