Accueil Les tendances Bilan de santé: maintenir une entreprise saine bi

Bilan de santé: maintenir une entreprise saine bi

Anonim

Par Techopedia Staff, 29 mars 2017

À retenir: l' hôte Eric Kavanagh discute de l'intelligence d'affaires avec le Dr Robin Bloor et Stan Geiger de l'IDERA.

Vous n'êtes actuellement pas connecté. Veuillez vous connecter ou vous inscrire pour voir la vidéo.

Eric Kavanagh: Mesdames et messieurs, je vous souhaite de nouveau la bienvenue, nous sommes mercredi à 16 h 00, heure de l'Est et depuis deux ans, cela signifie qu'il est temps pour Hot Technologies, oui, en effet. Je m'appelle Eric Kavanagh, je serai votre hôte pour l'émission d'aujourd'hui. J'adore ce sujet: «Health Check: Maintaining Healthy Enterprise BI», c'est de cela que nous allons parler aujourd'hui. Il y a vraiment une place dans la vôtre.

Cette année, il fait chaud - Hot Technologies a été vraiment conçu pour définir des types de technologie particuliers et vous pouvez imaginer que dans le monde des logiciels d'entreprise, il y a beaucoup de fournisseurs qui vendent toutes sortes de produits différents et ce qui se passe est là sont ces mots à la mode qui finissent par s'habituer et se faire glomper par divers fournisseurs pour des choses très différentes. Et donc, le but de cette émission est vraiment d'aider nos amis vendeurs et d'aider notre public à identifier et à comprendre nos spécificités en termes de technologies spécifiques et ce que ces mots signifient tous lorsque vous vous retrouvez sur le marché.

Donc, je vais remplacer l'un des analystes aujourd'hui, nous avons également le Dr Robin Bloor en ligne et Stan Geiger de l'IDERA. Parlons rapidement de l'importance de la Business Intelligence et de l'analyse juste en général. Il s'agit d'un arbre de décision de base, si vous voulez, ou d'un organigramme qui explique en quelque sorte comment vous traitez les problèmes dans votre entreprise, en discutant de différents sujets, en préparant des propositions et en découvrant ce que les gens pensent. Sont-ils d'accord? Sont-ils en désaccord? Quel est le consensus, si vous en avez, et comment suivez-vous ce processus?

Eh bien, tout cela est évidemment très générique, mais c'est un bon rappel du processus par lequel nous proposons des idées dans les entreprises, prenons nos décisions et ensuite allons de l'avant. Et l'essentiel est que des données sont nécessaires pour chacun de ces composants. C'est encore plus vrai de nos jours dans le monde des mégadonnées, car bien sûr, les mégadonnées sont comme ce moteur de vérité géant. Le Big Data est vraiment ce qui se passe; c'est représentatif de qui est où, ce qu'ils font, ce qu'ils achètent, ce que leur gestion des médias sociaux est, tweeting par exemple. Bien sûr, tout cela peut être piraté - vous devez faire attention à cela - mais le fait est que les données sont l'architecture de référence, si vous voulez, pour la réalité.

Donc, vous voulez des données à chaque étape de ce processus décisionnel. Maintenant, le consensus est important. Si vous voulez des utilisateurs satisfaits, un patron peut parfois devoir aller à l'encontre de ce que tout le monde veut. Nous parlions juste de Steve Jobs juste avant le début de cette webémission et il était connu pour ce genre de chose. Il a une citation célèbre où il recommande aux gens de noyer le bruit qu'ils entendent et de s'en tenir à leur vision, s'ils savent que ce qu'ils font est bien. Donc, vous n'avez pas toujours besoin d'un consensus, mais c'est généralement une assez bonne idée. Mais le but général de cette diapositive et de ce commentaire est de souligner l'importance que nous voulons prendre nos décisions en fonction des données, pas seulement par instinct, bien que l'intestin soit généralement très bon pour vous aider à savoir où vous voulez aller, puis vous cherchez vraiment à valider cela ou à invalider cela avec vos données. Et je dirais n'ayez pas peur de regarder en arrière à travers cela, juste comme un joli petit marqueur, ou rappelez-vous que lorsque vous regardez en arrière à l'occasion, vous pouvez au moins obtenir un cadre de référence et comprendre où vous avez été venir et être honnête au sujet des erreurs que vous avez faites. Nous avons tous fait des erreurs, ça arrive.

Donc, si vous avez des problèmes de performances dans vos systèmes de Business Intelligence, eh bien, il y a la vieille expression «la patience est une vertu», pas dans le monde de l'informatique, je peux vous le dire tout de suite. Si les utilisateurs attendent longtemps que leurs requêtes reviennent, ou qu'ils n'obtiennent pas leurs rapports, cela érode la confiance, et lorsque la confiance a disparu, il est très difficile de la récupérer. Donc, j'ai mis une ligne ici - environ 40 secondes de nos jours, c'est comme 40 minutes dans de nombreux cas - si une requête va prendre 40 secondes, les gens oublient de quoi ils parlent, ce qu'ils demandaient des données. Imaginez dans une conversation si vous demandez à quelqu'un, disons à votre patron, vous dites: «Hé, j'aimerais savoir pourquoi nous allons sur cette voie.» Et vous avez dû attendre 40 secondes dans une conversation. obtenir une réponse? Vous sortiriez de la pièce! On pourrait penser que votre patron a perdu la raison. Donc, cette latence que nous avons dans certains systèmes d'information, quand il y a des problèmes de performance, cela va tronquer le processus analytique, le flux analytique ou, comme certains l'appellent, la conversation que vous avez avec vos données. Vous devez accélérer dans ces systèmes, quoi que vous ayez à faire pour le faire, et nous allons en parler aujourd'hui, c'est ce que vous devez faire, car sans ce flux fluide d'idées d'avant en arrière, vous êtes endommageant vraiment tout le processus d'analyse. Alors, et encore une fois, je rejette ce commentaire: le manque de confiance est un tueur silencieux. Les gens ne lèveront pas trop la main s'ils ne vous font pas confiance, mais ils vont juste vous regarder de côté et se demander ce qui se passe. Et une fois que cette confiance aura disparu, vous aurez beaucoup de mal à la récupérer.

Donc, l'intelligence artificielle, eh bien, nous entendons toujours parler de machine learning et d'intelligence artificielle et "Oh, ça ne va pas résoudre tous ces problèmes?" Robin et moi entendons depuis des années maintenant des bases de données à réglage automatique et toutes ces choses amusantes - il se passe une partie de cela, mais posez-vous simplement la question: à quelle fréquence Siri le fait-il pour vous? Combien de fois Siri a-t-il accidentellement surgi et dit: «Je suis désolé, je n'ai pas compris.» C'est parce que je ne vous demandais rien. J'ai juste accidentellement appuyé sur ce sacré bouton. Il y a donc encore beaucoup de défauts, et à propos du côté gauche, c'est la puce ASIC d'un Apple Newton - vous vous souvenez de ce chiot d'années et d'années? C'était l'un des premiers appareils intelligents, et il y a quelque temps, c'est comme au début des années 90 ou au milieu des années 90, je veux dire. Que le Newton soit sorti et que ce n'était pas très bon, mais il avait la vision; ils savaient où ils allaient, mais même maintenant, avec l'iPhone AI et l'apprentissage automatique, ce sont des concepts largement mal compris, je dirais.

Et certainement en ce qui concerne l'apprentissage automatique, il peut être très utile et peut être utilisé dans certains de ces environnements où vous essayez de comprendre ce qui se passe avec votre architecture d'informations complexe, où les choses vont mal. L'apprentissage automatique peut être très utile dans ce contexte, mais seulement s'il est appliqué de manière très aiguë. Donc, je venais, en fait, d'un grand événement en Californie, l'un des grands distributeurs Hadoop Cloudera a eu son sommet d'analystes et je parlais avec leur directeur de la stratégie et j'ai dit: «Vous savez, il me semble, que en réalité, l'apprentissage automatique ne fait que deux choses: il segmente et il affine. »Cela signifie qu'il vous donnera différents segments ou grappes d'activités, y compris des anomalies, qui seraient un segment. Et il affine, ce qui signifie qu'il vous aide à améliorer un certain type de décision. L'exemple classique dont vous entendez parler est qu'il y a un être humain sur cette photo, par exemple. C'est donc quelque chose que l'apprentissage automatique peut faire, et il est utile dans certains contextes, lorsque vous parlez de dépannage, car vous pouvez rechercher des modèles de comportement dans l'utilisation du processeur, de la mémoire, de la vitesse du disque et de ce que font les disques. et tout ce genre de trucs amusants. Cela peut donc être utile, mais c'est vraiment quelque chose qui doit être très ciblé pour générer de la valeur.

Donc, une de mes autres choses préférées dont je dois parler - et nous en verrons un peu, je pense, lorsque nous prendrons notre démo aujourd'hui d'IDERA - à bien des égards, je pense que les êtres humains apprennent encore à parler le silicium . Il y a une science des matériaux en dessous de tout cela, et pour ceux d'entre vous qui ont fait du dépannage et qui ont vraiment regardé de près les architectures d'informations complexes, lorsque vous essayez de comprendre ce qui se passe, même dans un cluster Hadoop par exemple, vraiment vous regardez généralement des histogrammes. Et puis vous devez corréler ce que ces différents histogrammes signifient à un moment donné, et cela demande de l'intelligence; qui prend l'intelligence humaine et l'expérience. Donc, je ne crains pas du tout que le ML, l'apprentissage automatique ou l'IA suppriment de trop nombreux emplois dans ce monde de si tôt. Je pense qu'il y aura toujours un besoin pour les êtres humains, qui savent franchement de quoi ils parlent pour nous aider et faire en sorte que tout cela se produise.

Alors, continuons d'avancer. Alors, que se passe-t-il si vous n'êtes pas axé sur les données? Il s'agit d'un tableau célèbre, "The Blind Leading the Blind" - ce n'est pas ce que vous cherchez, les amis. Vous ne voulez pas ce genre d'environnement dans votre organisation. Donc, ce que nous voulons, c'est que nous voulons que nos décisions soient motivées par des données et que nous voulons que les décisions soient motivées par de bonnes données, des données de bonne qualité et que cela ne se produira que si vous collectez les données correctes, si elles sont agréables et propres, et si vos systèmes fonctionnent correctement, si vos systèmes de BI sont sains, vos systèmes d'analyse sont sains et les utilisateurs obtiennent ce qu'ils veulent en temps opportun.

Donc, avec cela, je vais conclure et passer la main à l'inimitable Robin Bloor. Robin, emporte-le.

Robin Bloor: D'accord, eh bien, merci de me passer le ballon. Je pensais pendant que vous parliez, Eric, je pensais juste à la BI et il y avait une présentation de fournisseur à laquelle j'ai assisté récemment quand quelqu'un a remarqué que chez un fournisseur particulier, exécutant un système particulier dans un gros entrepôt de données, ils le feraient, à un un moment donné pourrait effectuer 70 000 transactions BI qui entraîneraient la présentation d'informations à un grand nombre de personnes. Il m'est venu à l'esprit que si en fait vous avez ce genre de charge de travail, et que vous perdez même quelques secondes en termes d'exécution du logiciel, alors cela va en fait être très cher, et si vous perdez des minutes, ce sera horriblement cher. Et puis je me suis souvenu qu'une grande partie du monde fonctionnait sur des feuilles de calcul - il y en a, je pense qu'on les appelait des «systèmes fantômes», n'est-ce pas? Dans le premier cas, où les gens assembleraient simplement des systèmes à l'aide de feuilles de calcul et de courrier électronique, et ils feraient bouger les choses, car le service informatique ne peut pas créer des applications pour tout le monde, alors ils le font en quelque sorte. Et beaucoup de BI, je pense, s'implique de toute façon dans des systèmes comme ça.

Quoi qu'il en soit, après avoir dit cela, passons à parler de ce dont je vais parler. La BI est une boucle de rétroaction pour les systèmes d'entreprise, c'est vraiment aussi simple ou compliqué, selon exactement le rôle qu'elle joue dans l'organisation. Mais si nous regardons ceci, c'est un diagramme d'il y a environ quatre ans, lorsque nous essayions d'une manière ou d'une autre de comprendre ce qui se passait du côté de l'analyse. Mais à peu près, tout ce qui est rétrospectivement, en regardant ce qui s'est passé auparavant, et tout ce qui est de la surveillance, en termes de fonctionnement du système, a tendance à être BI. Ce n'était pas le cas auparavant, ce qui était de la prospective, de l'analyse prédictive était la BI, mais c'est en fait de plus en plus le cas. Eric a mentionné le machine learning, beaucoup de machine learning peuvent en fait d'une manière ou d'une autre être exécutés sur un flux de données et peuvent vous fournir des analyses prédictives pour les cinq prochaines minutes, voire presque en temps réel, afin que vous puissiez répondre à un client, avec une connaissance calculée de ce qui se passe réellement.

Mais au centre de ce diagramme, l'intérieur provient de l'analyse. Ce qui se passe normalement, c'est que diverses activités analytiques sont dirigées vers des collections particulières de données et quelque chose de nouveau est appris, des connaissances sont apprises sur l'entreprise. Et ce savoir est ensuite attaché aux processus métier qui peuvent en découler. Et généralement, cela se manifeste d'une manière ou d'une autre sous la forme d'alertes BI apparaissant, ou simplement de diverses choses placées sur les tableaux de bord, etc. Lorsque nous avons fait cela, il y a quatre termes et ils se terminent par le mot «vue», ce qui est très agréable. Mais en réalité, ce n'est pas tout dans le domaine de ce que les gens veulent faire, il y a aussi le problème de l'optimisation et l'optimisation ne donne pas de simples analyses. C'est un problème très complexe et beaucoup de problèmes d'optimisation ne sont pas uniquement solubles. Vous ne pouvez avoir que de bonnes solutions, vous ne pouvez pas prouver que vous avez une meilleure solution. Et c'est un domaine d'activité, où il y a de l'activité, mais c'est moins le cas que la plupart des autres domaines de l'analyse. Donc, les gens disent que nous vivons à l'ère de l'analyse - enfin, nous le faisons par rapport à il y a dix ans, mais cela peut aller beaucoup plus loin que ce n'est déjà le cas.

Ainsi, l'engendrement de la BI, le désir de connaissances engendre les demandes des utilisateurs, qui engendrent des projets d'analyse, et les projets d'analyse engendrent des lacs de données, et les lacs de données ainsi que l'analyse engendrent des informations et des informations engendrent la BI. C'est une histoire que je viens de raconter; Je pensais juste que j'écrirais ça. Ce que j'ai fait ici, je veux dire, le but de cette diapositive et de la plupart des autres diapositives est simplement de souligner la complexité du monde de la Business Intelligence. Ce n'est pas une chose simple, j'aurais pu rendre cette diapositive particulière plus compliquée qu'elle ne l'est en réalité, mais vous avez en bas ici, vous avez des données externes et internes qui d'une manière ou d'une autre vont être mises en scène zone, qui de nos jours c'est une sorte de substance de lac de données, bien que tout le monde ne dispose pas de lacs de données. Et les gens qui n'en ont pas forcément réussissent. Et puis, il y a une activité de nettoyage d'ingestion et une activité de gouvernance requises sur les données avant de pouvoir réellement les utiliser. Et puis, vous servez ces données et vous en ferez un rapport ou les analyserez et l'analyse mènera à l'action.

Et si vous regardez réellement les différents types d'analyses qui existent, c'est une liste incroyablement longue, mais ce n'est pas nécessairement une liste complètement complète, c'est juste ce que j'ai pensé écrire, quand je créais cette diapositive. Donc, il y a beaucoup de choses qui se passent dans un environnement BI que les visualisations, OLAP, la gestion des performances, les tableaux de bord, les tableaux de bord, divers types de prévisions, les lacs de données, l'exploration de texte, l'exploration vidéo, les choses prédictives, il y a un large éventail de choses qui continue en fait. Si vous regardez les choses différemment, la réalité de l'entreprise, en fait c'est vraiment un schéma similaire au dernier, c'est juste fait d'une manière différente. J'ai séparé ce que vous appelleriez BI parce qu'il est régulier et que l'on sait ce qui est requis, cela ne signifie pas que ce qui se passe réellement est efficace, mais au moins vous aurez des choses régulières qui se passent dans, disons Tableau, ou dans Click, ou dans Cognos, il existe une source de sujet, et ainsi de suite et ainsi de suite, divers rapports ou capacités réguliers seront en cours. Et puis vous avez les applications d'analyse et elles sont différentes. Parce que les applications d'analyse visent vraiment à explorer les données et, dans mon esprit, cela équivaut en quelque sorte à la recherche et au développement. Et puis vous avez un workflow. Dans le cadre du flux de travail, mélangez vos trucs avec des applications opérationnelles et des applications bureautiques, si cela est nécessaire - et c'est la réalité de l'entreprise telle que je la vois - bien que dans la plupart des organisations, ce n'est pas si bien organisé.

Donc, la perturbation de la BI, ce n'est qu'un ensemble de choses à mentionner rend la BI plus difficile qu'elle ne l'était, car l'ancien monde de la BI consistait principalement en des ensembles de données assez propres qui étaient capturés d'une manière ou d'une autre, probablement à partir d'un entrepôt de données et alimentés dans des Logiciel BI. Et à cette époque, je parle vraiment il y a cinq ou dix ans, mais à cette époque, les volumes de données n'augmentaient pas, les sources de données étaient connues. La vitesse d'arrivée des données était connue, bien que souvent, certains BI ne se produisent pas assez rapidement au goût de certains utilisateurs. Il n'y avait pas de données non structurées, il n'y avait presque pas de données sociales, certainement pas de données IoT, vous ne vous souciiez pas de la provenance des données. La valeur informatique n'avait pas de parallélisme en termes d'infrastructure afin de pouvoir d'une manière ou d'une autre faire les choses extraordinairement rapidement. Vous n'aviez pas d'apprentissage automatique et le nombre de charges de travail analytiques était assez mince. Et tout cela a changé, le volume de données peut maintenant augmenter de façon très spectaculaire. Le nombre de sources de données ne cesse d'augmenter. Oui, l'arrivée de données en streaming très rapidement, beaucoup de données non structurées, certainement des données sociales qui auront besoin d'être nettoyées, mais d'autres données qui pourraient avoir besoin d'être nettoyées, certainement des données IoT, sont l'affaire maintenant.

La provenance des données est un problème et nous nous en soucions. La puissance informatique est là, ce qui est bien, car cela rend toutes sortes de choses réalisables, et vous avez maintenant l'apprentissage automatique comme un phénomène qui conduit à la création de plus de capacités de BI et de nouvelles charges de travail analytiques qui feront de même. Donc, la BI n'est pas une situation statique et je pense que c'est la dernière chose que je vais dire, avant de la remettre à Stan. Oh non, ce n'est pas le cas, il y a autre chose. Futur paysage BI, Internet des objets, architectures événementielles, tout en temps réel, OK. C'est assez de BI de l'utilisateur, par l'utilisateur, pour l'utilisateur, les problèmes en résumé. Rapidité d'exécution des flux de données, couverture des données, nettoyage des données, compétences d'accès aux données, visualisation, partage et actionnabilité.

Alors maintenant, je peux le transmettre à Stan, à moins que le service BI ne soit fiable et opportun, ce n'est pas un service. Stan?

Eric Kavanagh: D'accord, Stan, je te donne le ballon, prends-le.

Stan Geiger: D' accord. Donc, ce dont je vais parler est juste mon parcours. Je suis cadre supérieur chez IDERA dans la gestion de produits et l'une de mes responsabilités est notre produit offrant de l'intelligence d'affaires. Je vais donc développer un peu ce dont Robin parlait et parler du domaine clé de l'intelligence d'affaires, c'est la surveillance de la santé de votre plateforme. C'est comme il l'a dit, maintenant, c'était là que nous avions toutes ces données et il fallait des semaines pour analyser, puis nous revenions avec des rapports et des choses. Mais le paysage de la BI change de telle sorte que nous nous rapprochons maintenant de l'analyse presque en temps réel. Et dans de nombreux cas, des analyses en temps réel réelles. Donc, je parle un peu de cette diapositive, c'est juste une sorte d'aperçu - et tout comme une divulgation complète, c'est que je vais en parler du point de vue de Microsoft, mais tous ces concepts traversent si votre BI les plates-formes sont dans Oracle, ou vous utilisez Informatica et Oracle, ou tout simplement en mode hybride, des environnements hybrides. Je vais juste utiliser en référence à l'environnement Microsoft, mais c'est assez standard.

Robin avait une diapositive là-dedans qui touchait à cela, c'est que vous avez des systèmes source, où j'ai toutes mes données, et maintenant c'était auparavant toutes dans des bases de données relationnelles et un stockage de données comme ça, mais nous avons maintenant Hadoop, Internet et d'autres choses, et toutes ces données non structurées, et nous pouvons maintenant les intégrer dans cette architecture de BI. Donc, le niveau intermédiaire qui parle un peu est le stockage de données en agrégation; c'est là que nous récupérons les données, nous pouvons les nettoyer, nous pouvons les restructurer, puis mettre un certain type de magasin de données, puis la couche de présentation se trouve au-dessus de cela, et c'est là que vos utilisateurs ont accès. Et nous faisons des analyses sur ces données dans ces magasins de données, et nous faisons des tableaux de bord, et nous avons Tableau assis là-dessus, des services de rapports, des choses comme ça. Je ris toujours parce que quand j'étais architecte BA, on riait toujours d'Excel, car avouons-le, Excel est toujours l'outil BI des masses.

Donc, un petit aperçu ici, mais juste pour parler du type d'architecture de la plate-forme, vous avez vos données source et j'en ai parlé dans plusieurs magasins de données. Et puis j'ai mon stockage en agrégation dans le monde Microsoft, vous aurez votre base de données SQL Server, peut-être où se trouve votre entrepôt de données, vous avez peut-être votre entrepôt de données dans le cloud, avec comme entrepôt de données. Vous avez des services d'analyse, qui sont vos tubes OLAP et des choses comme ça pour faire des agrégations et des choses autour de regarder des choses à travers plusieurs dimensions et des choses comme ça. Ensuite, vous avez votre couche de présentation, dont j'ai parlé brièvement, de toutes ces choses qui se trouvent au-dessus de ces magasins de données et de ces agrégations. Et j'aime toujours cette citation: «Vous ne savez pas ce que vous ne savez pas», ce qui est vrai. Si vous ne surveillez pas et que vous ne regardez pas ce qui se passe, dans tous ces domaines de votre plateforme de BI, comment savoir quand vous avez un problème autre que lorsque les utilisateurs commencent à vous envoyer des courriels désagréables et que le téléphone démarre sonner pourquoi mes rapports ne fonctionnent pas? Pourquoi tout prend-il si longtemps?

Donc, dans cette veine, ce que vous avez à faire, vous devez être en mesure de surveiller vos plates-formes à partir desquelles vous utilisez l'intelligence d'affaires. Et j'ai essentiellement divisé cela en trois domaines: vous avez la disponibilité, les performances et l'utilisation. La disponibilité signifie que la ressource est disponible: est-elle à la hausse ou à la baisse? Assez simple là-bas. Mais en regardant également quand vous en avez, vous pouvez avoir la plate-forme disponible, mais vous pouvez avoir des problèmes là-bas, vous devez donc être en mesure d'identifier la cause racine; vous devez être en mesure d'alerter et de faire savoir à quelqu'un ce qui se passe avant que les choses n'atteignent un état critique. Cela mène également au côté des performances, vous avez des choses à partir d'un niveau de mesure des performances, au niveau du serveur, où les services ou les services de BI ou les plateformes de BI sont hébergés; vous avez des performances au niveau des ressources où j'accède peut-être aux données à partir d'un SAN, par exemple. Le SAN étant la ressource, les ressources réseau, vous devez être en mesure de surveiller les performances de tout cela, pour être en mesure d'identifier les goulots d'étranglement et de garder vos utilisateurs satisfaits, et si vous êtes dans un environnement où vous faites vraiment l'analyse du temps, vous devez être en mesure d'identifier les goulots d'étranglement ou les problèmes avant qu'ils ne se produisent.

Et la dernière théorie est l'utilisation: que font les utilisateurs? Qui est connecté à mes sources BI? Qui dirige quoi? Quelles requêtes exécutent-ils? Quels rapports exécutent-ils? La connaissance de ces informations permet de déterminer et de planifier la capacité, par exemple. Il montre également ce qui est utilisé dans votre environnement de BI. Nous avions un client qui voulait notre produit de surveillance pour la BI juste pour qu'il sache quelles parties de l'environnement de BI ils utilisaient afin de pouvoir déplacer les ressources. Par exemple, s'ils n'utilisaient pas certains rapports ou certains cubes de services d'analyse, ils déplaceraient les ressources de cela vers d'autres domaines qui étaient très utilisés. Une autre citation que j'aime, j'aime vraiment les grands films comme "Tremors", alors dites-moi mon film, donc j'aime cette citation de Burt Gummer, qui a été joué par Michael Gross, il est en quelque sorte le type de pistolet de survie et il dit, il se montre et il sort cet énorme fusil de sniper de calibre 50, et l'un des gars dit: "Merde, Bert." Et il répond par "Quand vous en avez besoin et que vous ne l'avez pas, vous chantez un air différent. "En d'autres termes, vous savez quoi? Il était prêt à tout et il était prêt à tout, et donc ce que je veux dire par là, c'est que si vous ne surveillez pas votre environnement de BI à partir des ressources et de l'utilisation et des choses dont je viens de parler, alors vous ne réalisez pas que vous avez besoin d'un outil ou un environnement ou une structure qui le surveille jusqu'à ce que vous ne l'ayez pas. Et puis vous vous rendez compte que j'en avais vraiment besoin à l'avenir, et c'est un peu le cas de beaucoup de nos clients.

Cela dit, nous allons passer à l'étape suivante et nous verrons ce que nous faisons ici à IDERA pour résoudre certains de ces problèmes. Et-

Eric Kavanagh: D'accord, voilà, je le vois.

Stan Geiger: Vous le voyez? D'accord. Donc, ce que nous avons ici, c'est notre produit BI Manager. Et nous surveillons, IDERA a traditionnellement été une entreprise dans l'environnement SQL Server, Microsoft SQL Server. Et puis nous avons acheté à Embarcadero, alors maintenant nous nous sommes étendus à d'autres plates-formes, mais notre produit BI surveille traditionnellement la pile BI dans l'environnement Microsoft. Et ce serait des services d'analyse pour votre analyse multidimensionnelle et tabulaire, des services de reporting, un outil de reporting, puis des services d'intégration, qui est une plate-forme ETL, similaire à Informatica.

Et grâce à notre produit, vous êtes en mesure de surveiller ces trois environnements via un seul produit, et ce que vous voyez ici est le tableau de bord global, et la chose à noter ici est quand j'ai parlé d'alerte, c'est une chose à surveiller, mais cela ne suffit pas - vous devez avoir un mécanisme d'alerte. En d'autres termes, je dois pouvoir être averti avant que les choses n'atteignent un état critique. Donc, ce que nous faisons ici, il y a tout un ensemble de métriques que nous capturons qui sont configurables car selon votre environnement, certains seuils, vous pouvez être d'accord avec un temps de lecture de trente millisecondes, dans votre environnement. Dans d'autres environnements, il peut être plus critique que ce seuil soit plus bas, il est donc important non seulement d'avoir des alertes, mais de les configurer car les environnements sont différents selon les ressources.

Donc, en gros, c'est un aperçu de tous les environnements qui sont surveillés ici, et j'ai trois instances ici: une pour les services d'analyse, une pour les services d'intégration, une pour les services de reporting. Et vous voyez, j'ai quelques alertes ici. Et parce que ceux-ci sont rouges, cela me dit que ceux-ci sont critiques, car j'ai plusieurs niveaux que je peux définir ces alertes, et les alertes peuvent être envoyées par e-mail aux personnes chargées de rechercher le problème. Donc, brièvement, nous allons jeter un coup d'œil et je reviendrai sur les alertes, afin que nous puissions entrer dans la partie des services d'analyse et c'est, je suis sûr qu'il attend d'être chargé ici. Et fondamentalement, ce que nous faisons, nous avons une collecte de données; il y va périodiquement et va là-bas et recueille et prend des clichés de ce que font vos environnements. Donc, j'ai mis le mien pour toutes les six minutes, donc toutes les six minutes il sort et sonde l'environnement. J'ai eu ma VM endormie pendant un certain temps, donc ça va prendre une seconde pour que ça revienne. Et voilà.

Donc, nous jetons un coup d'œil à la partie des services d'analyse et je vais donc cliquer sur mon instance ici, et rappelez-vous que j'ai parlé de l'une des choses que nous surveillons, c'est les performances au niveau du serveur, car beaucoup de gens ont plusieurs choses en cours d'exécution sur leur serveur. Je peux avoir une base de données en cours d'exécution sur mon serveur, ainsi que des services d'analyse, par exemple. Donc, si quelque chose se passe dans la base de données ou si j'ai un problème au niveau du serveur, cela aura un impact sur tout ce qui s'y passe. Donc, nous surveillerons les choses à travers le serveur au niveau du serveur, des choses comme comment sont les performances du disque, et vous pouvez voir que nous capturons des mesures autour de tout cela. Et tout cela est configurable. Et je regarde ce qui se passe, au niveau du processeur, juste et encore, c'est au niveau du serveur, pas au niveau des services d'analyse dans mon exemple ici. Mais en fait au niveau du serveur.

Et je peux regarder des choses comme quelle est la mémoire, l'utilisation globale de la mémoire par exemple, ce qui est disponible? Alors maintenant, j'ai une idée de la santé du serveur lui-même. Ensuite, nous pouvons commencer à jeter un oeil à des choses qui sont particulières, dans ce cas, les services d'analyse. Je peux regarder et voir comment mon traitement de cube se déroule ici, par exemple, et cela me donne une mesure de la santé. Si je commence à voir que le traitement prend plus de temps, ou que ce ne sont pas les lignes qui ne sont pas écrites presque aussi rapidement, alors je peux commencer à regarder - et cela va à la pièce de corrélation dont je crois que Robin parlait, est-ce que il faut encore un être humain pour pouvoir faire tout cela. Nous parlons d'IA, d'apprentissage automatique, mais il faut encore un humain pour pouvoir corréler ces événements autour des choses. Nous pouvons jeter un oeil à des choses comme ce qui se passe en ce qui concerne les requêtes, quelles requêtes sont exécutées et combien de temps prennent-elles? Je peux trier, donc je peux commencer à avoir une idée des requêtes qui prennent le plus de temps. Vous pouvez jeter un oeil ici au temps écoulé, je peux jeter un oeil et voir OK, quelle était cette requête et qui exécutait cette requête à ce moment-là?

Donc, je peux commencer à raconter une histoire autour de cela aussi loin que lorsque je commence à voir les choses commencer à augmenter, je peux revenir en arrière et regarder et voir ce que les utilisateurs faisaient à ce moment-là. Et vous verrez l'une des choses que nous faisons, c'est que nous mettons ce sélecteur de temps ici pour vous permettre de choisir une fenêtre de temps. Ainsi, par exemple, je peux revenir à ces alertes, et c'était en fait un lien sur ces alertes sur lesquelles je cliquais, et cela me prendrait à ce moment-là lorsque cette alerte s'est produite. Et puis je peux commencer à reconstituer l'histoire ensemble, je peux voir oh, eh bien, les lectures de disque étaient en hausse, ou avaient des problèmes de mémoire ou autre chose, puis je peux sauter par-dessus l'activité de requête au même moment et je peux réellement commencer corrélant qui exécutait quelles requêtes qui auraient pu provoquer ces pics. Et puis, vous pouvez commencer à faire des choses comme je peux commencer à régler, c'est là que je commence à régler. C'est comme une voiture, si vous construisez une voiture de course et que vous laissez tomber le moteur et démarrez la clé, le moteur peut démarrer, mais si je dois parcourir 180 miles par heure pour gagner, je dois savoir que le moteur peut fonctionner à 100 miles par heure et je dois y aller et commencer à régler ce moteur afin de pouvoir y arriver. Et c'est ce que cela vous permet de faire, c'est de pouvoir vous donner suffisamment d'informations pour commencer à régler votre environnement, augmenter la santé et la production de cet environnement, et l'efficacité.

Et puis, nous surveillons les choses à travers la mémoire qui est particulière aux services d'analyse, dans ce cas. Et c'est là que vous pouvez commencer à voir où les choses pourraient commencer à mal tourner, lorsque vous commencez à voir des choses monter en flèche entre vos limites de mémoire, des choses comme ça. L'autre chose qu'il est bon de regarder, chaque fois que vous exécutez n'importe quel type de requêtes, vous voulez que les données soient mises en cache, car lorsqu'elles sont mises en cache, elles sont en mémoire et n'ont pas à lire à partir du disque, ce qui est beaucoup plus efficace que d'avoir à lire les données du disque. Vous pouvez donc commencer à jeter un œil aux choses qui se passent, excusez-moi, dans le cache de données par exemple. J'ai eu un tas de requêtes en cours d'exécution plus tôt, pour obtenir ces données, et vous pouvez voir que j'ai eu la plupart du temps, les accès au cache et les recherches se chevauchent, ce qui est bien. Mais j'ai eu une période ici où les hits étaient beaucoup plus bas que ce que les recherches étaient, ce qui me dit que quelque chose se passait et qui consommait beaucoup de mémoire, de sorte que le cache se vidait beaucoup plus rapidement, donc les données devaient être lire à partir du disque. Et nous pouvons le voir lorsque nous examinons le moteur de stockage. C'est le même point dans le temps que cet autre graphique, et vous pouvez voir le pic là, où les requêtes à partir du fichier ont vraiment augmenté pendant cette période. Et cela signifie que les données étaient lues sur le disque. Maintenant, je peux revenir en arrière et ensuite corréler cela aux requêtes qui étaient en cours d'exécution, et non pour faire saigner les oreilles de tout le monde, mais dans les services d'analyse, il utilise un langage appelé MDX, il existe des moyens d'écrire des requêtes plus efficacement, donc il utilise le cache plus efficacement et moins de stockage. Il y a donc un exemple de réglage de ce moteur et de vous donner toutes les pièces nécessaires pour pouvoir corréler cela.

Très rapidement, nous pouvons également l'inverser, lorsque nous regardons les requêtes, nous pouvons maintenant regarder les sessions, qui est actuellement connecté à ce moment et que sont-elles en cours d'exécution? Donc, ce genre de vous donne la vue opposée des requêtes et qui les exécute. C'est qui est connecté et je peux voir ce qu'ils exécutent actuellement. L'autre chose, juste pour passer rapidement en revue, est que vous pouvez voir tous les objets dans mes cubes MOLAP multidimensionnels. Et je peux obtenir des informations à ce sujet. Ainsi, par exemple, je peux trier par cette colonne de lecture, et je peux voir que l'objet le plus utilisé est la dimension temps et le deuxième plus utilisé est la dimension client. Et cela aide les gens qui développent et construisent des choses à construire plus efficacement leurs cubes. Je peux vouloir changer ma stratégie de partitionnement des données, par exemple, sur ces dimensions très utilisées dans mon cube, et donc cela va augmenter les performances des requêtes, par exemple. Cela peut diminuer les performances de traitement du cube, car maintenant j'ai plus de partitions, mais du point de vue de l'utilisateur, il va régler ce moteur, pour être plus efficace pour utiliser ces objets.

Alors, passez à autre chose, parlez des services d'intégration ici. Les services d'intégration, j'ai mentionné, sont une plate-forme ETL dans un environnement Microsoft. Ce que nous faisons ici - et cela est cohérent - nous surveillons les performances du serveur, et ce seraient les mêmes mesures que nous avons examinées, car tous mes services s'exécutent sur le même serveur. Mais encore une fois, c'est un aperçu de ce qui se passe sur le serveur. Et puis je peux regarder l'activité des services d'intégration, mes processus ETL. Donc, je peux avoir une idée du moment où ces processus se sont déroulés, qu'ils aient réussi ou non, je peux mettre en évidence une exécution particulière d'un processus ETL, puis il me montrera la répartition des étapes de ce processus ETL, s'il a réussi ou non et combien de temps cela a pris.

Maintenant, si j'avais un package ETL échoué ici, je pouvais descendre dans les détails et voir le message d'erreur et cela me montrerait quelle étape de ce package où ce processus ETL a échoué, ainsi que tous les messages associés à cela. Donc, ce que cela fait, c'est que cela me donne, et je peux recevoir une alerte en cas d'échec, donc si je reçois une alerte, je peux aller ici, voir, aller à cette alerte, voir l'échec du package, regarder les étapes, voyez où cela a échoué, regardez le message d'erreur et je sais immédiatement ce que je dois faire pour résoudre ce problème: redéployez-le puis recommencez. Donc, ce que cela vous permet de faire, c'est ce que nous appelons raccourcir cette fenêtre entre l'identification du problème et sa résolution. Donc, dans la vie antérieure, lorsque j'étais responsable de ce genre de chose, nous avions un processus ETL qui s'exécutait la nuit pour charger notre entrepôt de données. Si j'avais ces informations, la première chose le matin quand je suis arrivé, si quelque chose échouait, je pourrais rapidement y remédier et récupérer ce processus pour m'assurer que l'entrepôt de données était opérationnel et actualisé au moment où les utilisateurs est entré et a commencé à accéder aux rapports.

L'autre chose est que j'ai deux processus qui s'exécutent, c'est de regarder et de voir comment cela s'est déroulé au fil du temps. C'est important parce que si je commence à voir ces processus, par exemple, prendre plus de temps, voir ces temps s'accélérer, alors je devrai peut-être jeter un œil à, par exemple, ma fenêtre de maintenance, je peux avoir des choses qui se passent sur ce serveur . Prenez, par exemple, les sauvegardes; J'ai peut-être une sauvegarde en cours qui fait attendre mon processus jusqu'à ce qu'il soit terminé. Il se peut que je doive reprogrammer ou jongler avec mes processus autour de choses qui commencent à avoir un impact sur mon ETL.

Et le dernier élément concerne les services de signalement. Les services de création de rapports appartiennent à Microsoft, essentiellement leur outil de création de rapports d'entreprise. Et certaines choses, encore une fois, nous pouvons regarder les choses au niveau du serveur, nous pouvons regarder les choses à travers le serveur de rapports, le serveur de services de rapports lui-même. Je n'ai pas beaucoup de choses en cours d'exécution ici; J'ai des abonnements qui s'exécutent toutes les 15 minutes pour exécuter un rapport. Ainsi, vous ne verrez pas beaucoup de connexions actives car il s'allume, se connecte, exécute le rapport, se déconnecte et l'envoie.

Mais dans les environnements transactionnels élevés où de nombreux rapports sont effectués, il est essentiel de pouvoir surveiller ces éléments. Donc, vous pouvez voir où j'ai eu des choses ici, donc cela vous donne une assez bonne idée de ce qui se passe, au niveau du service et de la plate-forme. Et puis, comme je l'ai mentionné dans les diapositives, qui dirige quoi et que fait-il? Et l'un de nos clients a acheté ce produit juste pour cette pièce parce qu'il voulait savoir quels rapports les gens exécutaient et qui exécutait ces rapports. C'est donc l'une des choses de l'exécution de ce rapport que vous pouvez voir ici. Je peux voir quel rapport, je peux voir tous les paramètres qui étaient dans ce rapport, je peux voir qui l'exécute, je peux voir le format du rapport. Et puis j'ai toutes ces mesures autour d'elle, donc si encore une fois, je peux classer ces choses, par exemple, quel rapport a pris le plus de temps pour récupérer des données, et je peux aller directement à cela et voir de quel rapport il s'agit. Et encore une fois, tout cela me donne des données pour être, pour régler à nouveau ce moteur. Maintenant, je peux commencer à ajuster mon environnement de reporting autour de cela.

Et la dernière chose, est-ce que je peux jeter un oeil à l'activité de l'utilisateur, qui est connecté à nouveau actuellement, que font-ils? Je peux en fait, dans un environnement où j'avais plusieurs utilisateurs, ils sont tous triables, donc je peux classer, je peux voir qui utilise le plus l'environnement. Donc, juste pour revenir rapidement en arrière et jeter un œil à ces alertes. Voici cette alerte; Je peux cliquer sur ce lien ici et cela m'amènera au graphique pour l'instant et me montrera lequel était sous alerte. Donc, vous pouvez voir ici, c'est celui qui cause la moyenne des millisecondes pour l'écriture, par exemple, la lecture et l'écriture. Donc, encore une fois, juste essayer d'obtenir ce point d'identification des problèmes. Et il est vraiment important d'avoir un outil holistique, pas seulement quelque chose qui se penche sur cette seule chose, parce que les humains doivent venir ici et corréler ces événements qui se produisent, vous devez donc être en mesure de regarder ce qui se passait à ce sujet ponctuelle dans les multiples domaines de cet environnement, et c'est l'une des choses que nous faisons à travers ce sélecteur de temps ici.

Eric Kavanagh: Oui, c'est Eric ici juste avec une question rapide, parce que je pense que vous avez probablement mis le doigt sur la tête, et c'est ce dont je parlais en haut de l'heure, qu'un être humain doit venir et dessiner ces corrélations entre différents environnements. Je suis curieux de savoir, y a-t-il du matériel éducatif que vous pouvez partager, ou peut-être faites-vous une sorte d'engagement avec les gens pour les aider à identifier certains de ces modèles? Comme vous en aviez un très bon exemple il y a une minute, à propos du moment où l'un de ces pics vous indique que quelque chose se passe en mémoire car il a continué d'essayer de vider la mémoire. Et cela vous donne un indice, mais comment les gens comparent-ils ces statistiques aux problèmes du monde réel, est la vraie question.

Stan Geiger: Oui, c'est un bon point et l'une des choses dont je viens de parler, la feuille de route pour le produit, est que plus tard cette année, nous allons publier une version et l'une des choses que nous allons commencer à ajouter est à chacun de ces graphiques, est une description de ce que signifie ce graphique et pourquoi vous devriez vous soucier, et quel est l'impact de cela. Vous pouvez donc cliquer sur un point d'interrogation ou quelque chose sur ce graphique, puis ouvrir une fenêtre qui vous donnera beaucoup de ces informations et vous dira que ce sont les causes possibles, ce sont les domaines qui sont touchés, et pour vous guider vous dans le sens de pouvoir aller dans ce cas, comme vous l'avez dit, voici ce pic, je sais par mon expérience personnelle ce que cela signifie. Et puis je peux commencer à aller et commencer à forer dans une zone et à trouver la cause profonde.

Maintenant, nous en avons beaucoup, en fait, dans notre produit de gestionnaire de diagnostic pour SQL Server, pour la base de données réelle. Nous avons beaucoup de ce type de fonctionnalités dans un produit comme celui-ci, et nous avons également des boulons d'analyse pour le gestionnaire de diagnostic qui vous permettent de découvrir beaucoup plus rapidement. Et c'est là que nous allons sur la route avec ce produit.

Eric Kavanagh: Et je suppose qu'il y a des signatures pour certains types d'activités. Cet outil vous permet-il d'identifier quand un certain type d'événement a eu lieu et de le cataloguer, de sorte qu'au fil du temps, il va reconnaître un modèle similaire sur la ligne et vous aider à déterminer peut-être s'il s'agit d'un nouvel utilisateur, par exemple, en utilisant le même outil? Vous aider à comprendre, oh, c'est parce que ces serveurs sont tombés en panne ou parce que cette région est tombée en panne? Existe-t-il un moyen de cataloguer les signatures de problèmes, de sorte que vous puissiez facilement les identifier ultérieurement?

Stan Geiger: Non, en fait, mais c'est en fait un concept intéressant, car c'est presque comme, qu'est-ce que c'est - l'analyse des composants principaux, je suppose - où vous identifiez les modèles et vous enregistrez ces modèles et donc si vous les revoyez, vous pouvez revenir en arrière et voyez, OK, c'était la cause à ce moment-là. Oui, c'est quelque chose, ce n'est pas sur la feuille de route mais c'est quelque chose auquel j'ai pensé du point de vue de la gestion des produits.

Eric Kavanagh: Je peux imaginer. Oh, allez-y.

Stan Geiger: Non, j'allais dire - et nous recevons beaucoup de demandes, parce que je ne sais pas quelle est votre expérience - mais ce que nous trouvons, c'est que les DBA connaissent des bases de données comme le dos de leur main, mais le BI est un peu comme une boîte noire en ce qui concerne la santé de la plate-forme. Et il n'y en a pas, ils n'ont pas beaucoup de connaissances à ce sujet. Je le fais, juste après y avoir travaillé pendant cinq à dix ans, non? Mais les gens typiques qui sont chargés de les trouver, ou de recevoir des alertes et de comprendre ce qui se passait, c'est une sorte de boîte noire pour eux.

Eric Kavanagh: Oui, je peux imaginer. Je serais curieux de savoir aussi, donc vous montriez sur cet écran comment vous pouvez voir toutes les requêtes qui arrivent, combien de temps elles ont duré et qui les a générées. Pouvez-vous également voir la structure réelle de la requête SQL elle-même et faire une analyse à ce sujet? Comme peut-être parfois, les gens assemblent des requêtes SQL qui sont un peu volumineuses, disons, et lourdes, par opposition à un maître qui élabore vraiment une belle requête serrée. Est-ce quelque chose que vous pouvez visualiser grâce à cet outil et ensuite vous aider à résoudre le problème?

Stan Geiger: Oui, donc ce que vous pouvez faire, comme ce que j'ai fait ici, c'est que je viens de trier par temps écoulé, par exemple. Je peux donc voir ceux qui ont pris le plus de temps et puis je reçois le texte, mais ensuite c'est à quelqu'un qui est plus ou moins l'expert en la matière de regarder cela et de dire: «Oh, OK, voici pourquoi cela a pris si longtemps . "C'est quelque chose que nous avons une sorte d'analyse de la charge de travail, nous l'appelons SQL Workload Analyzer pour le côté base de données, que j'ai dupé avec l'idée de peut-être sur la route à venir avec quelque chose de similaire, afin qu'il identifie ces requêtes et vous donne ensuite des recommandations sur la façon de régler ces requêtes. Mais l'un des problèmes est que cette requête MDX est un langage assez spécialisé.

Eric Kavanagh: Oui, je peux imaginer. Mais vous pouvez voir, par exemple, qui sont les personnes, il n'est donc pas trop difficile de déterminer si une personne, si un gars est responsable de dix des requêtes de processus les plus longues, alors si rien d'autre, vous pouvez l'appeler ou appeler son manager ou quelqu'un et dire: «Hé, ce gars mâche beaucoup de bande passante», et peut-être que ce sont les requêtes les plus précieuses pour l'entreprise, non? Vous devez le mettre dans le contexte de la valeur commerciale, à partir des requêtes elles-mêmes, ce n'est pas seulement un jeu de chiffres clair, non? C'est pour savoir, eh bien, ce gars est notre grand utilisateur, et c'est lui qui change l'entreprise, non?

Stan Geiger: Non, vous avez tout à fait raison. Je veux dire, c'est l'une des façons dont les clients utilisent cela, c'est de pouvoir le faire. Comme vous l'avez dit, vous pouvez trouver un domaine, car l'une des choses dont je parle, je scorie toujours sur Excel, mais vous pouvez vous connecter aux services d'analyse dans Excel et exécuter des tableaux croisés dynamiques hors d'OLAP, et il génère ses propres requêtes, et les envoie et parfois ce n'est pas la meilleure forme, vous pouvez donc revenir en arrière et les identifier et les réécrire et les donner à l'utilisateur et les laisser les exécuter à l'extérieur de sorte que cela ne prenne pas une demi-heure pour de revenir à leur tableau croisé dynamique.

Eric Kavanagh: Exactement. Et quand nous parlons de requêtes, vous les gars couvrent toute la gamme des requêtes, donc vous avez mentionné MDX, qu'en est-il de certaines des autres requêtes comme une requête DAX, ou de certaines de ces autres …?

Stan Geiger: Oui, nous couvrons, oui, tous les DAX et MDX. Donc, l'une des choses que je n'ai pas mentionnées, ou que j'ai fait, peut-être, mais nous prenons en charge les tableaux et OLAP dans Microsoft et DAX étant - je pense que vous et moi en avons parlé il y a quelque temps - est que nous voyons beaucoup plus tabulaire maintenant que nous sommes OLAP. Parce que c'est juste plus facile de faire apparaître les modèles tabulaires et des choses comme ça, et donc vous allez évidemment voir des requêtes DAX, mais nous les reprendrons également.

Eric Kavanagh: Oui, c'est intéressant. Avez-vous un contexte pour expliquer pourquoi cela se produit? Est-ce peut-être parce que de plus en plus de gens se lancent dans ce genre de choses et parce qu'OLAP, bien sûr, n'est pas quelque chose de nouveau, cela existe depuis au moins une trentaine d'années?

Stan Geiger: Bon, eh bien, c'est une sorte de combinaison, l'une des choses est que la conception de cubes est un art. Et les cubes ont été construits pour pré-agréger les données, il est donc très rapide d'extraire les données, mais le traitement du cube prend du temps car il doit faire toutes ces agrégations. Et puis, le matériel est devenu moins cher et la mémoire est devenue moins chère, puis tout le monde sortait avec un magasin en colonnes et des bases de données en mémoire, vraiment. Et aussi tabulaire est probablement le plus proche des bases de données relationnelles traditionnelles et il est juste beaucoup plus facile et plus rapide de faire apparaître des modèles tabulaires qu'avec OLAP. Mais l'inconvénient est qu'il réside en mémoire, le tout réside en mémoire, donc c'est très gourmand en mémoire et les données ne s'agrègent pas jusqu'à ce que vous le demandiez. Donc, mais après avoir dit tout cela, nous commençons à voir beaucoup plus de tableaux là-bas.

Eric Kavanagh: C'est intéressant. C'est peut-être aussi parce que cette industrie est en train de s'aplatir un peu, et ce que je veux dire par là, c'est que nous recevons beaucoup plus de personnes qui interagissent avec les données et utilisent divers outils, et certainement quand vous parlez de Microsoft, je pense c'est certainement le cas que vous avez beaucoup, beaucoup plus d'utilisateurs pour les petites et moyennes entreprises, et même certaines grandes organisations qui creusent dans le truc, obtenir l'accès aux outils, exécuter des requêtes, et ils ne sont peut-être pas aussi familiers avec le tout le processus et les technologies autour de la construction de cubes, à votre point, non? Parce que cela demande une certaine réflexion, et c'est aussi cher, non? Cela prend du temps, il faut de l'énergie pour construire ces cubes à moins que vous n'utilisiez certaines des technologies les plus récentes. Par exemple, nous avons parlé à des entreprises comme Snowflake, par exemple, il fait des trucs assez intéressants, mais je pense que vous avez beaucoup plus de gens qui utilisent ces trucs et ils vont probablement avec ce que vous venez de décrire, qui est le format tabulaire, par opposition à la construction formelle de cubes, non?

Stan Geiger: Ouais, eh bien je veux dire, je suppose qu'Excel - quand c'était quoi, Power Pivot, je crois - c'est en fait tabulaire, si vous y regardez; c'est la façon dont vous créez des modèles tabulaires. Et puis l'itération suivante a été, je peux vous dire mes modèles tabulaires que je construis et je les déploie jusqu'à SQL Server afin de pouvoir les partager avec tout le monde. Donc, c'est une sorte d'extension naturelle hors d'Excel presque.

Eric Kavanagh: Oui, c'est un bon point. Ce que nous avons vu au cours des dernières années, je dirais cinq à sept ans, n'est qu'une formidable expansion de l'utilisation de ces technologies, n'est-ce pas? Et franchement, Microsoft a été un pionnier dans ce domaine, démocratisant vraiment les données d'alimentation par le biais de services d'analyse et de Power Pivot, non? Je veux dire, cela a changé la donne pour l'industrie, non?

Stan Geiger: Ouais, non, tu as tout à fait raison. Je veux dire, j'ai une diapositive lorsque je donne une présentation plus longue qui montre la transition du passage du modèle sémantique, qui était l'OLAP, au tableau. Et je pense avoir une citation de Microsoft; ils veulent que les données soient entre les mains des utilisateurs, pas seulement par-dessus le mur de la boutique informatique, ils veulent mettre davantage de données entre les mains des personnes qui les consomment.

Eric Kavanagh: Et cela revient directement à la première diapositive très simple que j'ai montrée, qui était le processus décisionnel de base pour toute organisation, et maintenant - et je pense que c'est une bonne chose - nous obtenons de plus en plus de personnes de toute la hiérarchie de l'organisation en prêtant attention à ce qui se passe, en apportant leur histoire à la table et vous le faites avec des données, c'est l'essentiel, je veux dire, vous pouvez utiliser d'autres moyens, mais si vous sauvegardez votre histoire avec des données, vous allez avoir des arguments beaucoup plus forts que ceux qui n'en ont pas, non?

Stan Geiger: Exactement, oui. Comme, oui, c'est exactement ça. Je veux dire, c'est pourquoi maintenant, c'était «Hey, j'ai besoin de ce rapport», alors maintenant je dois passer par la demande de rapport et je dois passer par ici, et obtenir mon rapport, et maintenant je peux m'asseoir là juste à mon bureau et vraiment juste, j'ai accès aux données générées, prendre mes décisions commerciales.

Eric Kavanagh: C'est vrai. Vous savez, je suis revenu d'une conférence la semaine dernière et il y a eu un commentaire hystérique d'un gars qui gère un environnement de BI plutôt important pour le magasin Target, et il faisait référence à l'analyse en libre-service et à la BI en libre-service, et évidemment c'est un gros problème de nos jours. Je suis sûr que c'est quelque chose qui stimule beaucoup d'activité pour ce que vous faites chez IDERA parce que lorsque vous voulez déployer le libre-service, vous devez d'abord avoir un environnement de BI sain, non? Si vous voulez que toutes sortes de gens posent toutes sortes de questions de toutes sortes de manières, vous voudrez avoir quelque chose comme cet outil ici, pour pouvoir comprendre qui pose quelles questions et où. Et la citation amusante que je vais jeter juste pour les coups de pied ici, comme vous l'avez dit, "Il y a une fine ligne entre la BI en libre-service et F vous-même."

Stan Geiger: Ouais.

Eric Kavanagh: Je pensais que c'était hystérique. Mais voyez-vous que la tendance du libre-service suscite vraiment beaucoup de sensibilisation autour de ce que vous faites avec la technologie?

Stan Geiger: Oui, parce que, comme vous l'avez dit, si vous autorisez la BI en libre-service, vous allez probablement rencontrer des problèmes de performances, à cause de: A) la quantité d'accès, le nombre de personnes au niveau des données, et B) le nombre de requêtes mal formées et les moyens d'y accéder que vous avez. Donc, vraiment, il est vraiment impératif que vous surveilliez l'environnement afin de pouvoir satisfaire tout le monde qui essaie de consommer les données, non?

Eric Kavanagh: Oui, je pense que c'est exactement ça. C'est une bénédiction et une malédiction: c'est bien que les gens essaient d'utiliser les trucs, mais encore une fois, à votre point, si vous n'avez pas le bon outil à l'époque, vous allez être un campeur malheureux parce que rouler en libre-service sans outil comme celui-ci, il me semble que cela demande juste une montagne de problèmes.

Stan Geiger: Oui, je veux dire, c'est comme lorsque je construisais des entrepôts de données, c'est comme si vous n'aviez pas correctement vos dimensions et vos tableaux de faits, puis vous les aviez désactivés pour des rapports ad hoc, vous pourriez vouloir explorer sous un Roche.

Eric Kavanagh: C'est génial. Oui, c'est bon, encore une fois, c'est une bonne nouvelle que les gens utilisent ce genre de choses, mais je pense que je dois croire que le libre-service va conduire beaucoup d'activités pour ce que vous faites, parce que vous parlez de rampe la quantité de tension et la pression sur ces systèmes par ordre de grandeur. Pas seulement par un ou par deux ordres de grandeur et c'est à ce moment-là que vous voulez vraiment avoir une certaine visibilité et que vous voulez pouvoir voir qui fait quoi, où, quand, comment et pourquoi. Posez ces questions, puis prenez des décisions sur la façon dont vous pouvez surveiller et changer l'environnement et changer vos politiques de qui a accès à quoi, non?

Stan Geiger: D' accord. Et vous savez, cela aussi, sachant, en voyant que l'utilisation vous permet également d'aller là-bas, et le potentiel, comme je l'ai mentionné l'objet dans le cube, je peux faire des choses pour améliorer cela, autant que la façon dont je construis et conçois des choses. Il est donc impératif non seulement de regarder les performances des choses, mais aussi de pouvoir voir comment votre schéma et votre conception fonctionnent à ce niveau, afin de pouvoir y apporter des modifications. Et cela va devenir de plus en plus important, car des choses comme Power BI sont désormais un gros problème, avec Microsoft, donc maintenant je peux créer mes propres tableaux de bord, widgets et autres, et je n'ai plus besoin d'être un développeur BI.

Eric Kavanagh: C'est vrai. Oui, c'est une bonne chose, ça va partout, mais vous allez avoir besoin d'un moyen de gérer cet environnement ou vous allez avoir des utilisateurs mécontents. Cela conduit à une gestion malheureuse, ce qui conduit à des licenciements. Il y a un effet domino assez clair lorsque les choses commencent à tomber, mais c'est génial.

J'ai donc un peu mâché les cinq dernières minutes ici. Robin, aviez-vous des questions?

Robin Bloor: Eh bien, je pense que c'est fascinant, en fait, pour être honnête. Cela me fait penser au fait que nous avions des environnements très contraints et le libre-service est en train de changer le monde et beaucoup de cela se produit réellement parce que beaucoup plus de données sont entrées dans l'environnement qu'auparavant. La seule question, parce que nous n'avons pas beaucoup de temps, mais la seule question que je serais intéressé de poser est que vous expliquiez la façon dont - parce que je pensais que c'était une très bonne démo - la façon dont le La surveillance BI fonctionne. Je me demandais ce que font réellement les gens qui n'ont pas ce genre de choses? Parce que cela doit être très difficile, il y a un certain nombre de choses où vous faites la différence, la cause racine est bien, vous n'atteignez pas nécessairement toujours la cause racine, mais vous pouvez y arriver avec certaines des choses que vous regardez, que lorsque vous avez dit qu'un certain nombre de personnes achètent l'outil juste pour savoir qui dirige quoi, et que mon esprit tourne, parce que c'est comme si vous ne savez pas qui dirige quoi, alors tout est hors de contrôle. Alors, à quoi ressemble l'environnement quand il est hors de contrôle?

Stan Geiger: Je veux dire, vous pouvez obtenir toutes ces informations que nous avons dans l'outil vous-même, mais vous devez écrire un tas de scripts locaux et parce que les données sont là, c'est juste que vous devez savoir où l'obtenir, ce qui nécessite un niveau d'expertise, non? Donc, dans des environnements où vous n'avez pas ce niveau d'expertise, en gros, ce que vous obtenez, c'est bon, est-ce à la hausse ou à la baisse? Je ne sais vraiment pas si ça fonctionne efficacement ou non, mais ça marche, non? Et puis je commence à recevoir des appels téléphoniques ou des gens qui disent: «Hé, mon rapport n'est pas dans ma boîte de réception, que se passe-t-il?» Ou «Je viens de soumettre ce rapport via les services de rapports» ou ils peuvent faire une requête ici dans les services d'analyse, mais cela prenait environ une demi-heure, et cela ne prenait que 30 secondes, que se passe-t-il? Eh bien, maintenant vous devez faire l'exercice d'incendie et essayer de le comprendre, et sans outil, cela devient très difficile.

Robin Bloor: Eh bien, c'est cela qui devenait de plus en plus évident pour moi, car vous avez démontré chacune des dimensions de ce que vous avez réellement ici. L'autre chose, c'est comme à un niveau très, très primitif, si vous n'avez pas d'alertes qui vous disent que tout va mal, alors c'est juste cher - vous vous retrouvez dans une situation coûteuse, en essayant de guérir ce qui s'est passé, parce que vous ne le découvre pas avant que les choses ne tombent mal, non?

Stan Geiger: D' accord, vous ne savez pas ce que vous ne savez pas.

Eric Kavanagh: Vous l'avez compris. Eh bien, les amis, nous avons brûlé une heure et changé, ici. Un grand merci à notre propre Robin Bloor et bien sûr à notre ami Stan Geiger d'IDERA Software. Ils vont être à Enterprise Data World, en fait, si l'un d'entre vous y va, le vôtre sera également là à Atlanta. Notre bon ami, Tony Shaw, fait un excellent travail en dirigeant cette conférence depuis quatre ans maintenant, et bon, ce qui est vieux est nouveau. C'est tout chaud. J'espère que nous vous verrons là-bas, sinon, revenez avec nous la semaine prochaine, nous avons un tas d'autres webcasts alignés.

Toujours curieux d'entendre vos pensées, envoyez un e-mail à, qui me va directement, si vous avez des questions ou des suggestions, ou d'autres technologies que vous aimeriez découvrir dans Hot Technologies. Et avec ça, vous allez vous dire adieu, les amis. Merci encore de vous joindre à nous, nous vous parlerons la prochaine fois. Prends soin de toi. Bye Bye.

Bilan de santé: maintenir une entreprise saine bi