Q:
Quels sont les principaux problèmes à prendre en compte dans une stratégie de stockage de Big Data?
UNE:L'un des plus grands problèmes qui est ignoré pour le stockage de Big Data est l'accessibilité pour les équipes qui en ont besoin. Les données sont stockées régulièrement sans documentation, dans des endroits difficilement accessibles ou où les équipes concernées ignorent qu'elles existent. En fin de compte, le stockage de Big Data devrait adopter une première stratégie ouverte où les équipes sont informées de son existence, de la nature des données et de la manière d'y accéder afin que les équipes puissent en faire usage dans le logiciel si elles en ont besoin.
Un autre problème critique que je trouve est la qualité des données qui sont stockées. Les données doivent être stockées sous la forme de la plus haute qualité dans laquelle elles peuvent exister à leur emplacement de stockage final. Le stockage de données de faible qualité dans un lac de données est généralement bien, mais au fur et à mesure de sa progression dans le pipeline de données, chaque étape devrait augmenter la qualité des données de sorte qu'elles soient stockées sous la forme de la plus haute qualité dans un système comme un entrepôt de données ou une base de données analytique. Cela augmentera la qualité des systèmes qui consomment le lieu de repos des données.