Combiner les sources de données dans Hadoop est une entreprise complexe. Certaines des raisons de ceci incluent:
- Les scripts personnalisés spécifiques à la source qui combinent des sources de données posent problème.
- L'utilisation d'outils d'intégration de données ou de science des données introduit trop d'incertitude.
- L'ajout de données provenant de sources externes est presque impossible.
Aujourd'hui, je vais discuter de la façon dont l'analyse Hadoop est améliorée grâce à des technologies indépendantes des sources qui facilitent la combinaison des sources de données internes et externes. En plus de décrire le fonctionnement des méthodes indépendantes de la source, j'expliquerai également pourquoi les analyses Hadoop ont besoin de capacités intégrées de transfert d'intelligence et de connaissances, d'une compréhension des relations et des caractéristiques des données, et d'une architecture évolutive et hautes performances.
Webinaire: Matrices de signification: relier les points dans Hadoop - Inscrivez - vous ici |