Table des matières:
Le traitement en continu des données est un domaine émergent. Cela signifie traiter les données presque instantanément (avec une latence très faible) lors de leur génération. Jusqu'à présent, la plupart des traitements de données étaient basés sur des systèmes de traitement par lots, où le traitement, l'analyse et la prise de décision étaient un processus retardé. Aujourd'hui, à mesure que les nouvelles technologies et plates-formes évoluent, les organisations se tournent progressivement vers une approche basée sur les flux plutôt que sur les anciens systèmes par lots. Apache Flink est un projet open source de streaming de traitement de données. Il aide les organisations à effectuer des analyses en temps réel et à prendre des décisions en temps opportun.
Webinaire: Standing at the Edge: Streaming Analytics in Action Inscrivez-vous ici |
Qu'est-ce que Apache Flink?
Apache Flink peut être défini comme une plate-forme open source capable de faire un traitement de flux distribué et de données par lots. Le cœur d'Apache Flink est un moteur de flux de données en streaming, qui prend en charge la communication, la distribution et la tolérance aux pannes pour le traitement des données de flux distribué. Apache Flink est la seule plate-forme hybride pour prendre en charge le traitement par lots et par flux. Il prend en charge différents cas d'utilisation basés sur le traitement en temps réel, les projets d'apprentissage automatique, le traitement par lots, l'analyse de graphiques et autres.
Flink comprend les composants suivants pour créer des applications réelles ainsi que pour prendre en charge l'apprentissage automatique et les capacités de traitement graphique: