Autrefois, en pensant aux données numériques, il était logique de séparer les données entre les données transactionnelles, les données capturées dans les applications commerciales, stockées dans les tables de base de données et présentées par les outils de BI, et toutes les autres données: courriels, pages Web, images, vidéo etc. De nos jours, nous avons tendance à désigner ces «autres données» comme des données non structurées.
Néanmoins, il était analysable et un logiciel permettant de tirer de la valeur de ces données a franchi le gouffre. C'est cet impératif analytique plus que toute autre chose qui a donné naissance au concept original d'un lac de données, un magasin de données pour les deux espèces de données et, en outre, pour les données récoltées à partir de multiples sources externes à l'entreprise, dont certaines étaient inévitablement non structurées.
Dans cet article, nous examinerons comment le nouvel écosystème créé par le lac de données ne sera plus entièrement composé des transactions (ou événements) de l'entreprise. Il comprendra également des données provenant d'autres sources, que l'entreprise utilise pour effectuer des analyses et informer ses utilisateurs d'informations importantes sur lesquelles les décisions peuvent être fondées. Le système d'enregistrement sera, comme il l'a toujours été, la copie d'or des données de l'entreprise et la piste d'audit des activités informatiques de l'entreprise.