Accueil Bases de données L'élan en avant: aller au-delà du traditionnel

L'élan en avant: aller au-delà du traditionnel

Anonim

Par Techopedia Staff, 8 juin 2016

À retenir: l' animateur Eric Kavanaugh discute des innovations dans la technologie des bases de données avec les experts Dez Blanchfield, Robin Bloor et Bert Scalzo.

Vous n'êtes actuellement pas connecté. Veuillez vous connecter ou vous inscrire pour voir la vidéo.

Eric Kavanagh: Mesdames et messieurs, c'est mercredi, à quatre heures de l'Est. Je suis à la Nouvelle-Orléans, l'été arrive, ça veut dire qu'il fait chaud! Il est temps pour Hot Technologies, oui en effet, oui en effet. Je m'appelle Eric Kavanagh, je serai votre hôte. Je vais lancer le ballon ici pour Hot Technologies. Le sujet d'aujourd'hui est «L'élan vers l'avant: faire évoluer le relationnel au-delà du traditionnel». Chers amis, nous avons trois experts en bases de données au téléphone aujourd'hui, donc toutes les questions que vous avez, envoyez-leur les plus dures, ne soyez pas timides. Nous avons un tas de bons contenus alignés pour vous aujourd'hui. Il y a vraiment la tache sur la vôtre, assez sur moi. Bien sûr, cette année est chaude. Nous parlons tous de technologies chaudes dans cette émission, qui est un partenariat avec nos amis de Techopedia. Et nous allons jusqu'à la base de la gestion de l'information aujourd'hui, qui est bien sûr la base de données. Nous allons parler de la façon dont nous sommes arrivés ici, de ce qui se passe aujourd'hui et de ce qui se passe à l'avenir. Beaucoup de choses très intéressantes se passent.

De toute évidence, nous avons une sérieuse innovation dans l'espace de base de données. C'était un peu calme pendant un moment; si vous parlez à certains des analystes du secteur, je dirais probablement à partir de l'année comme 2005 à 2009 ou 2010, il ne semblait pas qu'il y avait trop de choses en termes d'innovation. Et tout d'un coup, ça a juste éclaté, comme un jailbreak ou quelque chose, et maintenant il se passe toutes sortes de choses intéressantes. Cela est dû en grande partie à l'échelle du Web et à toutes les propriétés intéressantes du Web qui font différentes choses intéressantes. C'est de là que vient le concept NoSQL. Et cela signifie deux choses différentes: cela signifie pas de SQL, car il ne prend pas en charge SQL, cela signifie également non seulement SQL. Il y a un terme «NewSQL» que certaines personnes ont utilisé. Mais évidemment, SQL - le Structured Query Language - est vraiment la base, c'est la base de l'interrogation.

Et c'est intéressant que tous ces moteurs NoSQL, que s'est-il passé? Eh bien, ils sont sortis, il y avait beaucoup d'excitation à ce sujet, et puis quelques années plus tard, qu'est-ce que nous avons tous commencé à entendre? Oh, SQL sur Hadoop. Eh bien, toutes ces sociétés ont commencé à gifler les interfaces SQL sur leurs outils NoSQL, et tous ceux qui sont dans le monde de la programmation savent que cela entraînera des défis et des difficultés, ainsi que des fils croisés, etc. Nous allons donc découvrir beaucoup de choses aujourd'hui.

Il y a nos trois présentateurs: nous avons Dez Blanchfield qui appelle de Sydney, notre propre Robin Bloor qui est au Texas, et Bert Scalzo aussi, il est aussi au Texas. Donc, tout d'abord, nous allons entendre Dez Blanchfield. Mes amis, nous allons tweeter sur le hashtag de #HotTech, alors n'hésitez pas à envoyer vos commentaires, ou envoyez vos questions via le composant Q&A de la console de webdiffusion, ou même via la fenêtre de discussion. Et avec ça, Dez Blanchfield, emportez-le.

Dez Blanchfield: Merci, Eric. Salut à tous. Je vais donc essayer de définir la scène à un point de vue de 30 000 pieds de ce qui s'est passé au cours de la dernière décennie, et les changements importants que nous avons vus - ou au moins une décennie et demie de toute façon - du systèmes de gestion de bases de données, et certains des impacts d'un point de vue commercial ou technique, et certaines des tendances que nous avons endurées récemment, et nous mènent dans la conversation que nous sommes sur le point d'avoir aujourd'hui sur le sujet.

Mon image de couverture ici est une dune de sable, et il y a du vent qui souffle de minuscules petits morceaux de sable au-dessus d'elle. Et à la suite de cela, ce qui se passe, c'est que les dunes de sable marchent lentement d'un espace à l'autre. Et c'est un phénomène étonnant, où ces massives montagnes de sable hautes de 40 et 50 pieds, effectivement, se déplacent. Et ils se déplacent très lentement, mais ils se déplacent sûrement, et en se déplaçant, ils changent le paysage. Et c'est quelque chose à regarder si vous passez du temps dans une zone où les dunes de sable sont une chose naturelle. Parce que vous pouvez regarder par la fenêtre un jour et vous rendre compte que cette énorme montagne de sable, de petits grains minuscules se sont déplacés tout seuls, en effet, et que le vent la déplace lentement d'un endroit à un autre.

Et je pense qu'à bien des égards, c'est le monde des systèmes de bases de données depuis un certain temps. Jusqu'à très, très récemment, ce très petit changement sous la forme de grains de sable déplaçant une montagne géante de sable sous la forme d'une dune de sable. Peu de changements sont intervenus dans les plates-formes de bases de données au fil des ans, et ce fut un environnement assez stable et solide autour des systèmes et des plates-formes de bases de données, à travers le mainframe de l'ère de milieu de gamme. Mais dernièrement, nous avons eu des problèmes assez importants concernant nos besoins commerciaux et nos moteurs techniques. Je vais nous les expliquer.

Je suis d'avis que le concept de base d'une base de données, tel que nous le connaissions depuis de très nombreuses années, et comme vous l'avez peut-être entendu dans les plaisanteries d'avant-spectacle, nos deux experts qui sont avec moi aujourd'hui ont eu une vie entière cet espace et ils ont tout à fait raison de partager les droits de se vanter d'être là quand tout a commencé au début des années 80. Mais nous avons vu ce changement massif au cours de la dernière décennie et un peu, et je vais nous expliquer rapidement avant de le remettre au Dr Robin Bloor.

Nous avons vécu cette expérience que j'appelle «plus grande, meilleure, plus rapide et moins chère». Comme je l'ai dit, la définition d'une base de données a changé. Le paysage dans lequel les plates-formes de bases de données ont dû faire face aux performances et aux exigences techniques et commerciales a également changé. Nous avons vu cette augmentation de la demande de solutions pour faire face à des exigences commerciales plus complexes ou techniques plus complexes. Et donc un coup d'œil très rapide sur ce que cela signifie en fait, dans mon esprit, c'est que nous sommes arrivés à une sorte des années 90, et nous avons vu la technologie des bases de données affectée par l'introduction d'Internet, et le genre de ce que nous appelions à l'époque Internet échelle. Nous ne parlions pas seulement de personnes assises devant des terminaux, à l'origine des terminaux de téléscripteur avec des imprimantes physiques intégrées et 132 colonnes de texte sortant sur papier. Puis les premiers terminaux à écran vert, frappant avec des claviers.

Mais vous savez, notre monde était celui des terminaux et des câbles série ou des câbles réseau qui parlaient aux ordinateurs depuis longtemps. Puis est venu Internet, et cette croissance explosive de la connectivité, que vous n'aviez plus besoin d'être branché sur l'ordinateur. Pour accéder à un système de base de données, vous aviez juste besoin d'un navigateur Web. La technologie des bases de données a donc dû changer radicalement, pour gérer l'échelle de tout, des technologies de base des moteurs de recherche utilisées pour indexer le monde, et stocker un index d'informations, dans l'exemple de l'échelle du format de base de données. Et des gens comme Google et d'autres ont fourni une plate-forme pour le faire. Et tous les nouveaux types de stockage de base de données et d'interrogation et d'indexation ont été produits. Et puis nous avons eu des sites de musique et des sites de cinéma.

Et puis, dans les années 2000, nous avons vu le boom du dot-com, et cela a produit une explosion encore plus dramatique du nombre de personnes utilisant des systèmes qui étaient invariablement alimentés par une base de données sous une forme ou une autre. À ce stade, les bases de données relationnelles ont toujours supporté la majeure partie de la charge, nous les avons simplement mises sur une boîte plus grande, et nous sommes en quelque sorte allés vers les très, très, très gros systèmes de milieu de gamme exécutant des plates-formes Unix de personnes comme IBM et Sun, etc. . Le boom du dot-com a simplement rendu les choses plus grandes et plus rapides d'un point de vue matériel et de performances, et il y a eu des changements importants dans les moteurs de base de données, mais pour la meilleure partie, c'était toujours la même chose que nous avions en quelque sorte vue pour un Longtemps.

Et puis nous avons eu cette ère du web 2.0, comme nous nous y référons. Et ce fut un changement monstrueux, car tout à coup, nous avions besoin de plateformes de base de données beaucoup plus simples, et il devait y avoir une échelle à une forme horizontale. Et c'était un changement si important dans la façon dont nous avons abordé l'idée de ce qu'est une base de données. À mon avis, nous rattrapons vraiment notre retard. Et maintenant, nous avons affaire à tout ce bourbier, et je dis qu'avec un spin positif, pas une connotation négative, ce bourbier de ce que nous appelons les mégadonnées, et une énorme explosion, et je veux dire une explosion. Ce décalage scandaleux verticalement sur le graphique du nombre d'options que nous avons lorsque nous parlons d'une base de données et d'une certaine forme de capacité d'interrogation relationnelle.

Et chose intéressante, je suis personnellement d'avis que je pense que les mégadonnées ne sont vraiment que la pointe de l'iceberg. Nous avons tendance à être un peu enthousiasmés par l'impact des mégadonnées et les types de choix dont nous disposons actuellement. Nous avons tout des moteurs NoSQL, nous avons des moteurs graphiques, nous avons tous ces différents types de plates-formes sur lesquelles nous pouvons lancer des données et faire des choses avec. Même au point où en fait, l'une des toutes premières conversations que j'ai eues avec Eric Kavanagh, qui est ici avec nous aujourd'hui, portait sur une conversation concernant une chose appelée Apache Drill, qui est un projet open source qui vous permet d'interroger les données à l'intérieur du modèle différents types de données: tout, des fichiers CSE bruts sur un disque dur aux systèmes de fichiers HDFS à l'échelle du pétaoctet. Et vous savez, cela vous permet de faire ces requêtes de style SQL de données structurées et non structurées de toutes sortes de plantes passionnantes.

Nous sommes sur le point de voir le «bâtiment intelligent» devenir une chose, et nous aimerions penser que nous avons des bâtiments intelligents de sécurité et de gestion de la chaleur, mais je parle de bâtiments intelligents qui en savent beaucoup plus sur qui vous êtes et où vous êtes lorsque vous entrez et faites toutes sortes de choses intéressantes à ce niveau, jusqu'à des villes intelligentes - des écosystèmes entiers au niveau de la ville - qui savent faire les choses intelligemment. Et au-delà de cela, nous avons cette chose incroyable que je ne pense pas que quiconque dans le monde ait pleinement compris, et c'est la forme de l'Internet des objets. Il y a eu tous ces différents changements au cours de la dernière décennie et un peu, peut-être deux décennies environ, si nous arrondissons, qui ont en quelque sorte eu un impact sur le monde de ce que nous considérons comme des bases de données, à mon avis.

Il y a eu deux ou trois choses importantes qui ont rendu cela possible. Le coût des disques durs a considérablement baissé, et à bien des égards, c'est ce qui a permis de piloter certaines des architectures de référence telles que le modèle Hadoop, en ce sens que nous prenons beaucoup de données et les répartissons sur beaucoup de disques durs, et faire des choses intelligentes avec elle. Et en fait, ce qui est devenu, à mon avis, un partage de la base de données relationnelle ou du modèle d'unité de base de données traditionnel. Et la RAM est devenue très, très bon marché, et cela nous a donné une toute nouvelle opportunité de jouer avec différentes architectures de référence telles que la mémoire, et de faire des choses comme le partitionnement de très, très gros blocs de données.

Et donc cela nous a donné cette petite image que nous regardons maintenant, qui est un diagramme qui montre les types de plates-formes disponibles si vous êtes dans le paysage du Big Data. Et c'est très, très difficile à lire, et la raison en est qu'il y a tout simplement trop d'informations là-dessus. Il existe de nombreuses options de création, de modélisation et de fabrication de façons de placer des données dans des systèmes de base de données de n'importe quelle forme, de les interroger et d'effectuer les lectures / écritures traditionnelles. Et ils ne sont pas tous conformes, en fait très peu d'entre eux sont même conformes à une norme de style de base, mais ils se considèrent toujours comme une base de données. Et je vais vous montrer quelques écrans dans une seconde pour vous donner un peu de contexte sur ce que je veux dire par le passage des années 90 et de l'échelle Internet au Web 2.0, puis à toute la croissance grâce au Big Data. Si nous pensons que ce graphique de paysage de la technologie des mégadonnées est passionnant parce qu'il y a beaucoup d'options dessus, jetons un coup d'œil à une verticale clé.

Regardons la technologie marketing. Voici les options pour les systèmes de gestion de base de données, ou la gestion des données à l'intérieur de l'espace mar-tech, donc la technologie liée au marketing. C'était en 2011, donc il y a quelques années; il y a cinq ans, voici à quoi ressemblait le paysage. Si je reviens brièvement sur une diapositive, voici à quoi ressemble le paysage des données d'aujourd'hui dans les différentes marques et offres que nous avons dans les technologies de base de données. Voilà à quoi ressemblait une verticale il y a cinq ans, juste dans la technologie marketing.

Maintenant, si je vais à la vue d'aujourd'hui, voici à quoi cela ressemble, et c'est complètement impénétrable. C'est juste ce mur de marques et d'options, et ce sont des milliers et des milliers de combinaisons de logiciels qui se considèrent comme appartenant à la classe des bases de données, qu'ils peuvent capturer, créer ou stocker et récupérer des données sous diverses formes. Et je pense que nous entrons dans une période très, très intéressante et courageuse maintenant, où il était une fois que vous pouviez connaître les grandes marques, vous pouviez connaître les cinq ou six plates-formes différentes d'Oracle et Informix, DB2 et ainsi de suite, et être presque un expert sur toutes les marques qui étaient disponibles il y a une vingtaine d'années. Il y a dix ans, cela est devenu un peu plus facile parce que certaines marques se sont effondrées, et toutes les marques ne pouvaient pas faire face à l'ampleur du boom du dot-com, et certaines entreprises ont simplement fait faillite.

Aujourd'hui, il est absolument impossible d'être un expert de toutes les technologies de bases de données existantes, qu'il s'agisse de bases de données relationnelles ou de plateformes de gestion de bases de données standard que nous avons connues au cours des deux dernières décennies. Ou probablement le cas, les moteurs les plus modernes comme Neo4j et ces types. Et donc je pense que nous entrons dans un monde très courageux où beaucoup d'options sont disponibles, et nous avons des plates-formes à l'échelle horizontale, en mémoire ou sur disque maintenant. Mais je pense que c'est une période difficile pour les décideurs technologiques et commerciaux, car ils doivent prendre de très grandes décisions sur les piles technologiques, qui dans certains cas n'existent que depuis des mois. Âgé de dix-huit mois, ce n'est pas un chiffre effrayant pour certaines des plates-formes de base de données open source les plus excitantes et nouvelles. Et ils commencent à fusionner les plateformes et deviennent encore plus récents et plus excitants.

Je pense que nous allons avoir une grande conversation aujourd'hui sur la façon dont tout cela a eu un impact sur les plates-formes de bases de données traditionnelles et comment ils y répondent, et les types de technologies qui sont lancées à cet égard. Et dans cet esprit, je vais maintenant passer au Dr Robin Bloor, et obtenir ses idées. Robin, à vous.

Robin Bloor: D'accord, merci pour cela. Oui, c'est un sujet beaucoup trop vaste. Je veux dire, si vous venez de prendre un morceau d'une des illustrations que Dez vient de vous montrer, vous pourriez avoir une longue conversation sur l'un des morceaux. Mais vous savez, vous pouvez consulter une base de données - je regarde les bases de données, je ne sais pas, depuis les années 80, et vous pouvez regarder la base de données de différentes manières. Et l'une des choses que je pensais que je ferais, jetterais juste dans la conversation aujourd'hui, était de parler de la raison pour laquelle des choses perturbatrices se sont produites au niveau du matériel. Et vous devez garder à l'esprit que beaucoup de choses perturbatrices se sont également produites au niveau du logiciel, donc ce n'est pas l'image complète de quoi que ce soit, c'est juste une chose matérielle.

Je n'allais pas parler trop longtemps non plus, je voulais juste vous donner l'image matérielle. Une base de données était des capacités de récupération de données couvrant le processeur, la mémoire et le disque, et cela change radicalement. Et la raison pour laquelle je dis cela, c'est que j'ai appris à comprendre la base de données du point de vue de ce que vous avez réellement fait. Vous savez, il y a une différence de latence entre les données réellement sur le CPU et les données extraites dans le CPU de la mémoire et les données extraites du disque dans la mémoire et via le CPU. Et les anciennes architectures de bases de données essayaient juste d'équilibrer cela. Vous savez, ils disaient simplement: «Eh bien, cela va très lentement, nous allons mettre en cache les données sur le disque afin qu'elles soient en mémoire. Nous allons essayer de le faire de manière très précise afin qu'une très bonne proportion des données que nous demandons soit déjà en mémoire. Et nous déplacerons les données sur le CPU aussi vite que possible. »

Et les bases de données ont été écrites dans le passé, les machines sont écrites pour de petits clusters. Et maintenant, pour les ignorants du parallélisme. Parce que si vous voulez obtenir des performances d'un cluster, vous devrez faire diverses choses en parallèle. Le parallélisme fait partie du jeu, rien de tel que maintenant. Je vais juste passer en revue ce qui s'est passé.

Tout d'abord, le disque. Le disque est fini, vraiment. C'est à peu près fini en ce qui concerne les bases de données. Je pense qu'il existe un certain nombre de contextes pour l'archivage des données, et même de très grands lacs de données fonctionnant sur Hadoop, le pire disque en rotation est probablement viable de nos jours. Vraiment, le problème avec le disque en rotation était que les vitesses de lecture ne s'amélioraient pas particulièrement. Et lorsque le CPU augmentait les vitesses de la loi de Moore, un genre d'ordre de grandeur, plus rapide tous les six ans. Et la mémoire suivait en quelque sorte dans son sillage, puis ces deux-là suivaient raisonnablement le rythme l'un de l'autre, ce n'était pas entièrement lisse, mais ils l'ont fait.

Mais la lecture aléatoire sur un disque où la tête vole autour du disque, je veux dire, en dehors de toute autre chose, c'est un mouvement physique. Et si vous effectuez des lectures aléatoires sur un disque, c'est incroyablement lent par rapport à la lecture à partir de la mémoire, c'est 100 000 fois plus lent. Et assez récemment, la plupart des architectures de bases de données que j'ai examinées en profondeur viennent en fait de lire en série à partir de disques. Vous voulez vraiment, d'une manière ou d'une autre, simplement mettre en cache autant que possible du disque, et le retirer de ce périphérique lent et le placer sur un périphérique rapide. Et il y a beaucoup de choses intelligentes que vous pouvez faire avec ça, mais c'est un peu fini.

Et les disques SSD, ou lecteurs flash, sont vraiment ce qu'ils sont, remplacent très rapidement les disques en rotation. Et cela change à nouveau complètement, parce que la façon dont les données sont organisées sur un disque, est-elle organisée en fonction de la façon dont le disque fonctionne. Il s'agit en fait d'une tête se déplaçant sur une surface en rotation, en fait de plusieurs têtes se déplaçant sur plusieurs surfaces en rotation et de la collecte des données au fur et à mesure. Un disque SSD n'est qu'un bloc de choses que vous pouvez lire. Je veux dire, la première chose est que toutes les bases de données traditionnelles ont été conçues pour faire tourner le disque, et elles sont maintenant en train d'être repensées pour le SSD. De nouvelles bases de données peuvent probablement - quiconque écrit une nouvelle base de données en ce moment peut probablement ignorer la rotation du disque, ne pas y penser du tout. Mais Samsung, le principal fabricant de SSD, nous dit que les SSD sont en fait sur la courbe de la loi de Moore.

Ils étaient déjà, je pense, environ trois ou quatre fois plus rapides que le disque en rotation, mais ils vont maintenant devenir beaucoup plus rapides tous les 18 mois, en gros. Double vitesse et 10 fois jusqu'à environ six ans. Si c'était juste cela, cependant, ce n'est pas ça, comme je vous le dirai dans un instant. Le disque en rotation devient bien sûr un support d'archivage.

À propos de la mémoire. Tout d'abord, la RAM. Le ratio CPU entre RAM par CPU augmente tout le temps. Et cela, bien sûr, en quelque sorte, offre une vitesse beaucoup plus grande, car les hectares de mémoire que vous pouvez avoir maintenant peuvent stocker beaucoup plus. En fait, cela réduit en quelque sorte la pression sur les applications de type MLTP ou les applications de lecture aléatoire, car il est plus facile de les gérer, car vous avez maintenant beaucoup de mémoire et de cette façon, vous pouvez mettre en cache tout ce qui est susceptibles d'être lues en mémoire. Mais vous rencontrez des problèmes avec un plus grand tas de données, donc les données volumineuses ne sont pas vraiment aussi simples que cela.

Et puis nous avons Intel avec 3D Xpoint, et IBM avec ce qu'ils appellent PCM, qui est une mémoire à changement de phase, fournissent quelque chose qu'ils croient être - eh bien, c'est au moins 10 fois plus rapide que les SSD actuels, et ils croient qu'il obtiendra très proche d'être la même vitesse que la RAM. Et bien sûr, c'est moins cher. Donc, auparavant, vous aviez cette structure de base de données de CPU, de mémoire et de disque, et maintenant nous nous dirigeons vers une structure à quatre couches. Il a du CPU, de la mémoire ou de la RAM, puis ce type de mémoire plus rapide que le SSD, qui est en fait non volatile, puis le SSD. Et ces nouvelles technologies sont non volatiles.

Et il y a le memristor de HP, qui n'est pas encore, vous savez, parce qu'il a été annoncé il y a environ sept ans, mais il n'est pas encore apparu. Mais la rumeur que j'entends est que HP va également changer un peu le jeu avec un memristor, donc vous avez juste une nouvelle situation de mémoire. Ce n'est pas comme si nous avions des trucs plus rapides, c'est comme si nous avions une toute nouvelle couche. Et puis nous avons le fait que l'accès SSD, vous pouvez le lire en parallèle. Vous ne pouvez pas lire le disque en rotation en parallèle, sauf en ayant beaucoup de disques en rotation différents. Mais un bloc de SSD, vous pouvez réellement lire en parallèle. Et parce que vous pouvez lire cela en parallèle, cela va beaucoup plus vite que ses vitesses de lecture simples, si vous configurez réellement plusieurs processus à travers les différents processus sur un seul CPU, et que vous avez juste avec le SSD.

On estime que vous pouvez presque atteindre la vitesse de la RAM en faisant cela. Et tout ce que cela veut dire, c'est que l'avenir de l'architecture de la mémoire n'est pas clair. Je veux dire, la réalité est que les différents fournisseurs dominants, quels qu'ils soient, détermineront probablement la direction du matériel. Mais personne ne sait où cela va pour le moment. J'ai parlé à des ingénieurs de bases de données qui disent: «Je n'ai pas peur de ce qui se passe», mais ils ne savent pas comment l'optimiser dès le départ. Et vous l'avez toujours fait, donc c'est intéressant.

Et puis il y a le CPU. Eh bien, les processeurs multicœurs n'étaient pas seulement des processeurs multicœurs. Nous avons également des volumes importants de cache L1, L2 et L3, en particulier L3, qui peut atteindre, je ne sais pas, des dizaines de mégaoctets. Vous pouvez en mettre beaucoup, vous savez. Et par conséquent, vous pouvez réellement utiliser la puce comme support de mise en cache. Cela a donc changé la donne. Et certainement, le traitement vectoriel et la compression de données, un certain nombre de fournisseurs l'ont fait, ont fait glisser ces éléments sur le processeur pour que tout se passe beaucoup plus rapidement sur le processeur. Ensuite, vous obtenez le fait que, bien, les processeurs avec GPU sont vraiment bons pour accélérer l'analyse. Et ils sont vraiment très bons pour certains types de requêtes, cela dépend simplement de ce qu'est votre requête.

Vous pouvez soit créer des cartes avec des processeurs et des GPU, soit comme AMD le font actuellement, vous produisez quelque chose appelé APU, qui est une sorte de mariage d'un processeur et d'un GPU; il a les deux types de capacités. C'est donc un autre type de processeur. Et puis la récente annonce d'Intel selon laquelle ils vont mettre un FPGA sur la puce, c'est ce que j'ai fait. J'ai pensé: "Comment ça va se passer?" Parce que si vous avez le possibilité de CPU, GPU, et vous avez la possibilité de CPU, FPGA - et au fait, si vous voulez vraiment, sur la même carte, vous pouvez mettre un CPU, un GPU et un FPGA. Je n'ai aucune idée de la façon dont vous exécuteriez quoi que ce soit de cette façon, mais je connais des entreprises qui font des choses comme ça, et elles obtiennent des réponses aux requêtes très, très rapides. Ce n'est pas quelque chose qui va être ignoré, c'est quelque chose qui va être utilisé par les fournisseurs établis, et par de nouveaux fournisseurs qui arriveront, peut-être. Les SGBD ont toujours été parallèles, mais maintenant les possibilités parallèles viennent d'exploser, car cela vous permet de paralléliser ceci avec cela, avec cela, avec cela de diverses manières.

Enfin, pour évoluer ou évoluer? La mise à l'échelle est vraiment la meilleure solution, mais pour une chose. Vous obtenez de bien meilleures performances de nœud si vous pouvez tout simplement optimiser absolument les performances du processeur et de la mémoire sur le disque sur un nœud. Et vous utiliserez moins de nœuds, donc ça va être moins cher, non? Et ce sera plus facile à gérer. Malheureusement, c'est une conception dépendante du matériel, et à mesure que le matériel change, il devient de moins en moins possible de le faire, à moins que vos ingénieurs ne soient en mesure de fonctionner aussi rapidement que le matériel change. Et vous rencontrez des problèmes de charge de travail, car lorsque vous augmentez l'échelle, vous faites diverses hypothèses sur ce que la charge de travail va faire.

Si vous augmentez l'échelle, c'est-à-dire si votre architecture met l'accent sur l'échelle avant de passer à l'échelle - en fait, vous devez les faire tous les deux, c'est juste que vous en accentuez une. Ensuite, vous obtiendrez de meilleures performances réseau, car l'architecture s'en occupera. Il sera plus coûteux en termes de matériel car il y aura plus de nœuds, mais il y aura moins de problèmes de charge de travail et la conception sera plus flexible.

Et je pensais juste que j'allais y mettre ça, parce que si vous pensez à tous les changements matériels, je viens de pointer du doigt, et ensuite vous avez réfléchi, comment allez-vous évoluer et évoluer sur ce genre de choses? Ensuite, vous vous rendez compte que les ingénieurs de bases de données sont, à mon avis du moins, bien sous-payés. Donc, si vous contemplez simplement la couche matérielle, les défis de la base de données sont clairs. Maintenant, je transmets ceci à Bert, qui va nous faire sentir éduqués.

Eric Kavanagh: C'est ça! Bert?

Bert Scalzo: Merci beaucoup. Permettez-moi de passer directement à ces diapositives. J'ai beaucoup de diapositives à parcourir, donc sur bon nombre d'entre elles, je vais peut-être aller assez vite. Nous allons parler de ce «Forward Momentum: Moving Relational Beyond Traditional». Ce n'est plus la base de données de votre père. Les choses ont changé et, comme l'a dit un intervenant précédent, au cours des six à sept dernières années, le paysage a radicalement changé.

Moi-même, je fais des bases de données depuis le milieu des années 80. J'ai écrit des livres sur Oracle, SQL Server, l'analyse comparative et pas mal d'autres choses. «Le monde change très vite. Gros ne battra plus petit. Ce sera le rapide qui battra le lent. »J'ai ajouté le« s'adapter ». C'était de Rupert Murdoch. Je crois vraiment que cela va être vrai. Vous ne pourrez pas faire des trucs de base de données comme vous l'avez fait il y a 10, 15 ou 20 ans. Vous allez devoir le faire comme l'entreprise le souhaite maintenant.

Je vais essayer de rester un peu générique dans ce que je présente, mais la plupart des fonctionnalités dont je parle se trouvent dans Oracle, vous trouverez dans SQL Server, MySQL, MariaDB et quelques autres gros joueurs. La révolution de la base de données relationnelle, je suis encore une fois d'accord avec les précédents intervenants. Si vous regardez bien vers 2010, nous sommes passés de la voiture de course rouge à la voiture de course jaune. Il y a eu un changement important, et en 2020, je pense que vous allez voir un autre changement radical. Nous sommes dans une période très intéressante.

Maintenant, cette diapositive est la clé, c'est pourquoi j'ai mis une clé là-haut. Il y a tout ce changement en cours, et du côté gauche, j'ai la technologie, et du côté droit, j'ai des affaires. Et la question est, laquelle cause quoi, et laquelle soutient qui? Nous avons tous ces changements matériels: les disques qui descendent, la taille des disques qui augmentent, de nouveaux types de disques, ce qui était couvert par les haut-parleurs précédents. Le prix de la perte de mémoire, toutes ces nouvelles versions de bases de données. Mais du côté droit, nous avons la protection et la conformité des données, l'entreposage de données, l'intelligence d'affaires, l'analyse, la conservation obligatoire des données. Les deux côtés de l'équation conduisent, et les deux côtés de l'équation vont utiliser toutes ces nouvelles fonctionnalités.

Tout d'abord, nous avons notre disque de rotation SAS typique, ils ont maintenant jusqu'à 10 téraoctets. Si vous ne l'avez pas vu, Western Digital, HGST a ce qu'ils appellent leur lecteur d'hélium, qui va jusqu'à environ 10 téraoctets en ce moment. Les coûts du disque en rotation deviennent assez bas. Comme mentionné précédemment, vous pouvez obtenir des disques SSD jusqu'à environ deux téraoctets, mais Samsung a bientôt une unité de 20 téraoctets. Les coûts deviennent raisonnables. Une chose que je vais parler des autres n'a pas été, le concept de disques flash. PCIe, c'est-à-dire PCI Express, par rapport à NVMe, vous avez peut-être ou non entendu parler de cette mémoire express non volatile. Fondamentalement, NVMe va remplacer SAS et SATA, et c'est vraiment plus un protocole de communication qu'autre chose. Mais ces disques pèsent maintenant environ trois téraoctets.

Vous avez peut-être également vu que certains disques SAS sont désormais livrés avec des connecteurs U.2, qui sont en quelque sorte un connecteur différent d'un SAS ou SATA, qui prend en charge NVMe avec un disque standard - le disque doit également le prendre en charge, bien sûr. Et puis SATA avec connecteurs M.2, et ceux-ci commencent à obtenir NVMe. En fait, il y a des vendeurs d'ordinateurs portables qui vendent maintenant des ordinateurs portables qui ont un disque flash NVMe, et ces choses vont crier par rapport à la technologie que vous avez utilisée auparavant.

Beaucoup de gens ne savent pas ce que sont ces différents flashs. Si vous regardez dans le coin inférieur droit, c'est un exemple de M.2. Vous pouvez dire: «Eh bien, ça ressemble beaucoup au lecteur mSATA à sa gauche.» Mais comme vous pouvez le voir, il y a deux trous dans les broches par opposition à un, et il est un peu plus grand. Et aussi, le M.2 peut être disponible en trois tailles différentes.

Et puis le flash PCI Express et le flash NVMe. Maintenant, le flash NVMe est également PCI Express, mais le PCI Express est généralement toujours un algorithme de contrôleur de type SAS ou SATA qui a été écrit pour la rotation du disque, et NVMe est les algorithmes ou techniques qui ont été écrits spécifiquement pour le flash. Et encore une fois, vous allez voir tout cela.

NVMe offre pas mal de choses. Je pense que les deux plus grandes améliorations sont, dans le coin supérieur droit, la latence est réduite de 70%. J'ai même vu encore plus que ça. De plus, si vous regardez dans le coin inférieur droit, lorsque votre système d'exploitation communique avec le disque NVMe, il passe par beaucoup moins de niveaux de logiciels. Fondamentalement, vous passez par le pilote NVMe qui est maintenant inclus avec le système d'exploitation, et il parle directement aux médias. Il y a beaucoup de raisons pour lesquelles cette technologie va changer radicalement le monde des bases de données.

Et bien des fois, les gens diront: «Eh bien, à quelle vitesse est NVMe?» Vous savez, le bon vieux temps, en 2004 et avant, nous étions excités si nous avions Ultra-320 SCSI, 300 mégaoctets par seconde. Les vitesses d'aujourd'hui, beaucoup d'entre vous sont probablement sur fibre ou InfiniBand, et ce genre de top out. NVMe là-bas à droite, commence là où s'arrêtent les technologies actuelles. Ce que je veux dire, c'est que PCI Express 3.0 avec une liaison à huit voies commence à près de 8000, et il augmentera à mesure que nous aurons de nouvelles versions de PCI Express, les versions quatre et ainsi de suite. NVMe n'a nulle part où aller, sauf en haut.

Maintenant, quelles sont les choses qui changent dans la base de données? Maintenant, dans le coin supérieur droit de mes diapositives, je mets les raisons commerciales, je pense que la technologie est apparue. Dans ce cas, en raison de l'entreposage de données et pour des raisons réglementaires de conservation obligatoire des données, les bases de données commencent à y proposer une compression. Maintenant, certaines bases de données offrent une compression en tant que module complémentaire, certaines l'offrent comme intégrée à la norme, disons l'édition d'entreprise de leur base de données, et pourtant certaines bases de données, comme dans Oracle, pourraient même avoir une version encore meilleure de la compression qui est dans, disons, leur plate-forme Exadata, donc ils ont en fait construit du matériel qui peut prendre en charge une compression très spécialisée et celui d'Exadata, par exemple, obtient un taux de compression 40x, et c'est donc très important. Et je pense que c'est la conservation obligatoire des données, les gens veulent juste des données plus longtemps. Les entreprises, pour faire des analyses et des BI, ont besoin des 5, 10, 15 dernières années de données.

Maintenant, une autre fonctionnalité qui a commencé à apparaître juste au cours de cette période de 2008 et 2009 était le partitionnement. Encore une fois, vous le trouverez dans des bases de données comme Oracle, SQL Server et dans les deux, vous devez payer pour cela. Dans Oracle, vous devez acheter l'option de partitionnement et dans SQL Server, vous devez être sur l'édition du centre de données. C'est votre technique traditionnelle de division et de conquête et ce que vous faites, c'est que vous avez le concept d'une grande table logique en haut et lorsqu'elle est placée sur le disque, elle est en fait divisée en seaux. Et vous pouvez voir que ces compartiments sont organisés selon certains critères de séparation, généralement référencés ou appelés votre fonction de partitionnement, et de même, vous pouvez également sous-partitionner dans certaines plates-formes de base de données et vous pouvez aller encore plus loin.

Encore une fois, je pense que l'entreposage de données et la conservation obligatoire des données ont poussé cela, et dans certaines de ces bases de données, vous pouvez avoir jusqu'à 64 000 partitions, et je crois que sur certaines autres bases de données, même jusqu'à 64 000 sous-partitions. Cela vous permet de diviser vos données en morceaux gérables. Vous allez également partitionner les index; c'est une option, vous n'êtes pas obligé, mais vous pouvez également partitionner vos index. Une des raisons pour cela pourrait être que vous disposez d'une fenêtre de données coulissante. Vous souhaitez conserver 10 années de données, mais pour supprimer les index pour exécuter le chargement par lots de ce soir, vous ne voulez pas avoir à supprimer les index sur chaque ligne, uniquement sur les lignes qui se trouvent dans le compartiment actuel. Le partitionnement est en fait un très bon outil d'administration même si la plupart des gens pensent que son grand avantage est de supprimer l'élimination de la partition dans vos plans et donc d'accélérer vos requêtes. C'est vraiment une sorte de cerise sur le gâteau.

Maintenant, vous avez probablement entendu parler de partitionnement et vous vous demandez probablement: «Eh bien, pourquoi avez-vous mis cette diapositive ici?» C'est l'un de ces NoSQL - c'est l'un de ces environnements de type Hadoop. Oracle 12c en a sorti deux, ce qui n'est pas encore le G8, mais qui est affiché ou prévisualisé contient en fait une partition. Vous allez avoir un système de base de données traditionnel comme Oracle et vous allez pouvoir scinder comme vous le faites dans le modèle Hadoop, et donc vous allez avoir une autre technique de division et de conquête qui va diviser votre table par ligne en groupes par nœud et cela va être - tout comme ce que vous voyez dans certaines de vos bases de données NoSQL. Et en fait MySQL, vous pouvez réellement accomplir cela à peu près en utilisant l'une de leurs techniques de clustering, mais cela arrive dans une base de données traditionnelle et je suppose que Microsoft ne voudra pas être laissé pour compte. Ces deux jouent à la grenouille bondissante tout le temps, donc je m'attendrais à voir une partition dans peut-être la prochaine version de SQL Server.

La gestion du cycle de vie des données, encore une fois la conservation obligatoire des données, mais aussi pour la business intelligence et l'analyse. Vraiment, c'est une technique de division et de conquête, et généralement les DBA le font manuellement, c'est-à-dire: «Je vais garder les données de cette année sur des disques rapides, les données de l'année dernière sur des disques légèrement plus lents, peut-être que je vais pour conserver les deux dernières années avant cela sur des disques encore plus lents, puis j'aurai une méthode d'archivage. »En règle générale, il n'est plus enregistré, c'est généralement - vous avez une sorte de stockage connecté au réseau ou un appareil qui en a beaucoup de stockage et est, vous le savez, rentable, mais il tourne toujours le disque.

Et maintenant, vous pouvez réellement - à la fois sur Oracle et sur SQL Server - vous pouvez acheter une option où vous définissez les règles et cela se produit simplement de manière automatique en arrière-plan. Vous n'avez plus besoin d'écrire de scripts, vous n'avez rien à faire. Et si vous avez vu SQL Server 2016, qui vient de sortir le 1er juin, il y a une nouvelle fonctionnalité appelée "Stretch Databases" qui vous permet essentiellement - dans le coin inférieur droit - de passer de plusieurs couches directement dans le cloud et encore une fois, c'est une fonctionnalité qui est intégrée dans la base de données, vous dites simplement quelque chose comme: "Si les données datent de plus de 365 jours, veuillez les déplacer dans le cloud et, vous savez, faites-les automatiquement pour moi."

Cela va être une fonctionnalité vraiment cool, en fait, je pense que ce sera peut-être ce que nous verrons à l'avenir, c'est-à-dire que vous allez avoir des bases de données hybrides où vous allez garder des informations locales et certains dans le cloud. Avant cela, les gens pensaient: «Oh, je vais soit faire sur place ou je vais le faire sur le cloud.» Maintenant, nous voyons le mariage des deux technologies de cette manière hybride. Je pense que ce sera assez gros et Microsoft est arrivé en premier.

Rédaction, cela est dû à la protection et à la conformité des données. Maintenant, au bon vieux temps, nous aurions pu dire: «Hé, développeur d'applications, lorsque vous affichez cela dans le rapport, lorsque vous affichez cela à l'écran, voici quelques éléments de sécurité que vous devez vérifier et s'il vous plaît, vous savez, n'afficher que les données ils sont censés voir ou masquer ou caviarder les données qu'ils ne sont pas censés voir. »Eh bien, comme d'habitude, lorsque vous les envoyez à l'application, cela ne se fait pas à un seul endroit, donc cela se fait différemment ou cela ne se fait pas pas fait dans certains endroits. Et maintenant, vous avez réellement cette capacité dans vos systèmes de base de données.

Maintenant, dans SQL Server 2016, cette fonctionnalité est intégrée, ce n'est donc pas encore un élément de coût optionnel à ajouter au centre de données; et dans Oracle 12, vous devez acheter leur module complémentaire de gestion du cycle de vie, mais c'est quelque chose de nouveau et, encore une fois, il est piloté par l'entreprise. Et surtout parce que vous conservez tellement de données maintenant, et que vous faites de l'exploration de données, donc la BI et l'analyse, vous devez savoir qui accède à quelles données et en vous assurant qu'ils ne sont autorisés qu'à voir quoi ils ont le droit de voir.

De même, regardez à nouveau cela, la protection des données et la conformité. Vous constaterez que de nombreux systèmes de base de données sont en train de créer une compression, ou je suis désolé, le chiffrement directement dans la base de données et ce qui est important à propos de ce chiffrement, si vous regardez la flèche vers le bas et la flèche vers le haut sur le diagramme qu'il écrit vers le bas sur le disque crypté, puis il le lit dans la mémoire et le déchiffre. C'est en fait un modèle, il y a un autre modèle qui, vous le savez, ne le ferait que lorsqu'il communique ces données sur le réseau à l'application cliente réelle.

Dans ce cas, il serait même toujours sur le serveur de base de données en mémoire, il pourrait être crypté et décrypté uniquement lorsqu'il est envoyé à l'application cliente. Il y a deux modèles différents ici et vous les trouverez dans les bases de données, et en fait l'une des bases de données qui vient de l'ajouter récemment était MariaDB dans leur version 10.X; Je pense qu'ils sont sur 10.1 ou 10.2 maintenant. Et j'ai en fait fait une analyse comparative de ce cryptage, et pour obtenir ce cryptage, je n'ai connu qu'une diminution de 8% du débit ou de la vitesse. Dans un test d'analyse comparative, le cryptage n'a pas causé beaucoup de choses et c'est donc une fonctionnalité très utile.

Maintenant, nous avons mentionné plus tôt la mémoire flash et les SSD et des choses comme ça. L'une des fonctionnalités que vous avez dans Oracle et SQL Server que beaucoup de gens ne réalisent pas est que vous pouvez prendre un flash ou un SSD qui est sur votre serveur de base de données et vous pouvez dire à la base de données: «Utilisez-le comme s'il s'agissait de mémoire. Traitez la RAM comme préférentielle, mais faites comme si la mémoire était lente et utilisez-la comme cache étendu. »Maintenant, dans SQL Server 2014, cela est sorti et s'appelait« Buffer Pool Extension », c'est gratuit. Dans Oracle, il est sorti en 11g R2 et s'appelait "Database Flash Cache" et il était également gratuit là-bas.

Mon conseil, cependant, est de tester soigneusement cette fonctionnalité. Chaque fois que vous agrandissez le cache lorsque vous effectuez une recherche, cela prend plus de temps. Si vous mettez une carte flash de trois téraoctets et dites à la base de données, "Ajoutez cela à votre mémoire", vous pourriez réellement trouver que quelque chose a ralenti à cause du temps pour regarder et voir est-ce en flash, est-ce un sale ou nettoyer? Il y a un point de rendement décroissant. Mon conseil est encore une fois de tester ceci, voyez ce qui fonctionne pour vous, mais encore une fois, c'est dans votre base de données et dans le cas d'Oracle, à la fois dans SQL Server et Oracle, il est là depuis quelques années maintenant.

Et puis cela nous amène au grand-père qui était les bases de données en mémoire et c'est parce que les prix des bases de données ont baissé. L'autre raison pour laquelle vous pensez probablement que cela s'est produit est qu'une grande partie de l'analyse nécessite que les données soient accessibles très rapidement, et qu'elles doivent donc être en mémoire. Notez que les algorithmes que les bases de données utilisent pour accéder à ces données, pour les compresser, les crypter, les stocker, vous savez dans certains cas, certaines bases de données peuvent continuer à stocker en mémoire sous forme de ligne.

Dans certains cas, certaines bases de données peuvent diviser cela en une colonne orientée et la raison pour laquelle ils le font est qu'ils obtiennent un niveau de compression beaucoup plus élevé, quelque part autour du 11 à 12X en le stockant dans l'ordre des colonnes par rapport à l'ordre des lignes. Cette première apparition dans SQL Server 2014, elle s'appelait «Hekaton». Elle a été radicalement augmentée dans SQL Server 2016, ils la verront référencée par des noms différents et elle est sortie dans Oracle 12c; Je dis la deuxième version ici, pas R2. Il y avait deux versions différentes d'Oracle 12c, la 12.1.0.1 et la 12.1.0.2. Il s'agit de la deuxième version de la version R1 de la base de données.

Et la façon dont vous le définissez, l'objet en mémoire est similaire dans les deux bases de données. Ici, vous pouvez voir dans le coin supérieur droit, je crée un serveur SQL et vous pouvez le voir, avec une mémoire optimisée et la durabilité étant un schéma uniquement. Je ne vais pas passer en revue toutes ces significations de syntaxe, et dans Oracle, c'est encore plus simple, vous modifiez simplement une table et dites en mémoire ou non et vous pouvez changer cela. Je peux dire aujourd'hui que c'est en mémoire et demain ce n'est pas le cas et c'est donc très flexible.

J'ai fait des tests sur Oracle avec des tables en mémoire, j'ai eu des tests qui ont pris près de 40 minutes à exécuter, là-haut sur la rangée du haut. Maintenant, ce qui est important, c'est qu'au moment où je suis arrivé aux deux dernières lignes, j'avais augmenté le temps d'exécution ou diminué, je devrais dire, à cinq minutes environ, et quand j'ai regardé le facteur de compression, les données en mémoire étaient en fait de 3, 6 à 4, 6 fois plus petit. C'est important parce que dans ce cas, j'utilisais un format orienté colonne et c'est la compression. Et alors devinez quoi? En fait, je stockais près de quatre à cinq fois plus de données dans ma mémoire. Non seulement j'obtenais l'avantage de la mémoire, l'avantage de la colonne, mais aussi l'avantage de beaucoup plus de données - jusqu'à cinq fois plus de données dans le cache de la mémoire, c'est donc une technique assez puissante. Encore une fois Oracle et SQL Server, vous voulez les regarder, ce sont des fonctionnalités vraiment cool. Et avec cela, je pense que je vais l'ouvrir aux questions.

Eric Kavanagh: Eh bien Bert, tout d'abord, vous avez été très altruiste dans toute cette merveilleuse éducation. Pourriez-vous parler un instant de ce que vous faites? Parce que vous avez une technologie habilitante qui peut faciliter ce dont vous avez parlé. Parlez juste pendant une minute de ce que vous faites, puis mettons Dez et Robin dans l'équation ici.

Bert Scalzo: Oui, je travaille pour une société appelée IDERA. Nous sommes au Texas, nous avons notre siège social à Houston, et je suis actuellement assis à Austin, mais je suis basé à Dallas. Nous fabriquons des outils de base de données et nous créons des outils de base de données pour vous aider à résoudre les problèmes. Ce problème pourrait être quelque chose d'aussi simple que la productivité, auquel cas nous avons un outil appelé DBArtisan qui vous permet d'effectuer vos tâches administratives de base de données et c'est un outil pour vous permettre de gérer 12 plates-formes de base de données différentes. Je peux gérer SQL Server, je peux gérer Oracle, je peux gérer MySQL, DB2, Postgres et j'utilise un outil, un exécutable, une conception graphique et un ensemble cohérent de flux de travail. Nous fabriquons également des outils pour faire la conformité, nous avons un outil appelé SQL Compliance Manager pour vous aider à répondre à vos besoins de conformité. Un autre outil appelé SQL Security, nous essayons donc de rendre les outils qui vous aideront à être efficaces et efficients, et ce qui est vraiment bien si vous visitez notre site Web, nous avons tout un tas de logiciels gratuits, donc si rien d'autre, allez télécharger - Je pense que nous avons environ 20 ou 25 freewares. Il existe de très bons logiciels gratuits, comme un serveur SQL et une vérification de l'aide de Windows qui vont simplement examiner ce que vous avez et vous dire si vous avez des problèmes ou des choses et c'est totalement gratuit.

Eric Kavanagh: Et vous avez vraiment une sorte de …

Bert Scalzo: Certainement la première chose …

Eric Kavanagh: Vous parlez de l'hétérogénéité du marché aujourd'hui, il y avait autrefois une sorte d'équation universelle qui, en fait, je me souviens avoir interviewé le Dr Michael Stonebraker en 2005, alors qu'il continuait un grand coup de pouce pour parler du verdict sur le mouvement de la base de données orientée colonne et il parlait de la façon dont le modèle relationnel à taille unique a dominé pendant de nombreuses années, et il prédisait que tout changerait, et garçon avait-il raison cette. Maintenant, nous avons cet environnement vraiment diversifié et intéressant avec beaucoup d'options et d'opportunités différentes, mais vous avez besoin de quelqu'un pour gérer tout cela et il me semble que votre entreprise se concentre assez intensément sur la résolution de problèmes mathématiques, étant ainsi un facilitateur de la en-tête d'hétérogénéité, non?

Bert Scalzo: Absolument. Je veux dire qu'il y aura toujours des administrateurs de base de données qui diront: «Je ne veux pas utiliser un outil graphique, je fais tout avec des scripts», vous savez? Ils pensent qu'ils sont le type de DBA superman et c'est bien, mais pour la plupart d'entre nous, nous voulons simplement faire le travail et - vous savez, j'utilise Microsoft Word pour écrire mes documents. J'utilise Microsoft Outlook pour faire mon courrier électronique. Je veux dire, j'ai des outils pour faire des tâches. Nous construisons le même type de concept, nous créons des outils pour les administrateurs de bases de données et les développeurs pour les aider à se concentrer sur ce qu'ils veulent faire et non sur la façon dont ils doivent le faire.

Eric Kavanagh: Cela a du sens, mais permettez-moi de vous confier à nos experts, et les gens se sentent libres de plonger. Nous avons quelques commentaires venant du public. Peut-être, Dez, quelques questions et Robin quelques questions?

Dez Blanchfield: Bien sûr. L'une des premières questions que je veux vous poser, étant donné l'énorme expérience que vous avez acquise, voyez-vous bientôt un moment où tout cela va ralentir? Ou pensez-vous que nous sommes vraiment juste au point d'entrée de cette ligne de croissance continue de changement? Je pense que l'un des plus grands problèmes auxquels les entreprises sont confrontées, puis invariablement les personnes qui essaient de soutenir la technologie fournie à ces entreprises pour gérer leurs entreprises, est que le taux de changement est si spectaculaire qu'elles ne peuvent tout simplement pas suivre tout le monde. les différentes fonctionnalités, logiciels, systèmes, frameworks et architectures, et le nouveau code à venir, puis le matériel en dessous, voyez-vous le rythme actuel de changement ralentir immédiatement? Je veux dire, vous traitez avec un si large éventail de plates-formes avec toute la suite IDERA, allons-nous ralentir bientôt ou sommes-nous en quelque sorte sur ce train de fret emballant fou pendant longtemps encore?

Bert Scalzo: Je pense que nous sommes aux premiers 20% de cette courbe de croissance et nous avons un long chemin à parcourir et il y a deux choses qui poussent. La technologie continue d'évoluer. Vous avez mentionné certains des nouveaux types de mémoire qui vont sortir, ce sera fantastique. Samsung va bientôt avoir un lecteur flash de 20 téraoctets. Ça va changer les choses. Nous avons toutes ces bases de données NoSQL et cloud, cela va continuer. La seule chose qui est assez drôle, cependant, c'est que lorsque je regarde des bases de données comme Oracle et SQL Server et certaines autres, ce ne sont vraiment plus des bases de données relationnelles. Je peux mettre des données non structurées dans Oracle tout en conservant la conformité ACID. Si vous m'aviez dit qu'il y a 20 ans, je venais de dire que vous preniez de la drogue.

Dez Blanchfield: Oui, oui, ils sont cool. Eh bien, même maintenant, ces moteurs qui ont des créneaux verticaux assez intéressants comme le SIG, juste mieux que la capacité native maintenant. Vous avez fait d'excellents commentaires sur les défis auxquels les administrateurs de base de données sont confrontés et les différentes périodes des administrateurs de base de données que nous espérons voir dans le monde, mais à quoi ressemble le monde avec le type de cette couche de l'entreprise que vous traitez? Je veux dire, ce sont les gens qui utilisent les différentes plates-formes depuis votre gestionnaire de diagnostic, jusqu'aux outils d'inventaire, et jusqu'à la défragmentation, comment les administrateurs de bases de données font-ils face à ce changement et comment font-ils en quelque sorte - vous savez, que font-ils avec vos outils pour faire face à ce changement important dans leur paysage?

Bert Scalzo: Eh bien, je vais remonter il y a près de 20 ans, puis je vais dire que les administrateurs de bases de données résolvent un rôle très spécifique dans une organisation. Ils fonctionnent généralement avec une plate-forme de base de données, peut-être deux, et ils gèrent un nombre relativement faible de bases de données. Maintenant, avancez rapidement jusqu'à aujourd'hui et l'administrateur de la base de données, il va en fait connaître 10 plateformes de base de données. Il gère, et ce n'est pas une blague, dans certains cas, des milliers de bases de données; c'est plus sur le monde SQL Server ou le monde MySQL. Mais toujours dans le monde Oracle, ils pourraient gérer des centaines de bases de données. Et donc ils ont toutes ces nouvelles fonctionnalités qui sortent, ils ont toutes ces nouvelles plateformes, et ils ont toutes ces bases de données dont ils sont responsables. Ils recherchent des outils pour améliorer leur productivité et aussi pour les aider à apprendre certaines choses.

Et je vais vous donner un exemple - si je veux partitionner une table, c'est une syntaxe assez obscure, et si je veux la sous-partitionner, la syntaxe devient encore plus difficile. Je sais ce que je veux faire, je veux créer des seaux. Si j'ai un outil comme DBArtisan qui dit: «Hé, voici un bel écran qui vous permet de vous concentrer sur ce que vous essayez de faire plutôt que sur la façon dont vous essayez de le faire, et oh au fait, appuyez sur la touche Afficher le bouton SQL lorsque vous avez terminé et nous vous montrerons ce qu'était le SQL afin que vous puissiez commencer à vraiment apprendre et maîtriser cela. »

Les administrateurs de bases de données découvrent que des outils qui les aident à faire le travail, mais aussi à leur enseigner toutes ces nouvelles choses qu'ils utilisent et la même chose serait vraie - disons que je suis un gars Oracle et je passe à MySQL et dis, «D'accord, créez une base de données, DBArtisan. Maintenant, montrez-moi le SQL parce que je me demande ce que c'est que de créer une base de données sur MySQL et je viens d'apprendre la syntaxe. »Et donc nous ne les aidons pas seulement à travailler à travers la base de données, nous les éduquons également à travers la base de données.

Dez Blanchfield: Cela devient encore plus intéressant lorsque vous sortez de certains des plus modernes - ou pas plus modernes, ce n'est pas une chose juste à dire - mais il était une fois une base de données est une base de données. Ces jours-ci, je vois tout ce dont vous parlez avec le défi supplémentaire que la technologie empile traditionnellement chez les fournisseurs et que vous sorte d'open source et également qu'ils sont bons. Non seulement traiter les moteurs de base de données et les langages de requête, mais ils traitent également les types de données, structurés et non structurés, vous savez, le défi d'avoir à tout faire à l'extrémité du spectre d'un HDFS multi-pétaoctets environnement à de petits conteneurs minuscules, et des fichiers de paquets et divers formats de fichiers journaux.

Et je pense que c'est quelque chose que nous voyons maintenant où aucun être humain, peu importe à quel point un surhomme, une super-femme, quoi qu'ils pensent, physiquement, ils ne peuvent tout simplement pas gérer mentalement ce taux de changement et l'ampleur des variations. Je pense que la suite d'outils que vous proposez maintenant va arriver à un point où ils seront presque sur un ensemble par défaut de bien des façons afin que nous ne puissions pas exécuter les environnements de base de données que nous avons sans eux parce que nous avons juste physiquement ne peut pas leur jeter autant de corps. J'ai vraiment apprécié votre présentation. Je vais passer au Dr Robin Bloor, je suis sûr qu'il a aussi beaucoup de questions à vous poser.

Robin Bloor: D'accord. Eh bien, j'ai certainement des questions. Bert, je ne sais pas où tu vas - j'ai eu une conversation très intéressante il y a quelques jours où quelqu'un a commencé à me parler de la dernière protection des données DU, et il me semblait d'après ce qu'ils disaient que c'était incroyablement draconien en termes de choses sur lesquelles ils ont insisté. Je me demandais si vous aviez réellement regardé cela; est-ce quelque chose que vous connaissez?

Bert Scalzo: Absolument. Ouais.

Robin Bloor: 2016, d'accord, parlez-nous-en.

Bert Scalzo: Et j'ai en fait …

Robin Bloor: Profondément intéressant.

Bert Scalzo: J'ai en fait travaillé pendant un certain temps pour un vendeur de flash, dans leur domaine de base de données, les aidant à créer des produits flash pour les bases de données, et je peux vous dire que le draconien va jusqu'au bout. Ce que je veux dire, c'est que si vous vous souvenez de ma seule diapositive, j'ai dit dans certaines bases de données qu'il ferait le chiffrement mais qu'il le mettrait dans la mémoire du serveur et dans certaines bases de données le chiffrement - il est toujours chiffré dans la mémoire du serveur, il n'est déchiffré que lorsque il est envoyé au client. Eh bien, vous trouverez également certaines de ces normes gouvernementales, en particulier le ministère de la Défense ou militaire ici aux États-Unis, elles vont également jusqu'au niveau du flash et elles veulent savoir non seulement que vous supportez le cryptage et le décryptage dans votre matériel, mais que si quelqu'un a volé les puces qui - vous savez, les ont retirées de la chose, de votre serveur, que ce qu'il y a est crypté et donc même si elles ont le stockage, cela ne peut pas être et elles le feraient tout le long de la réalité - pas à la partie flash elle-même mais aux puces individuelles. Ils voulaient savoir que puce par puce, tout était crypté.

Robin Bloor: Wow. Je veux dire qu'il y a beaucoup de choses qui - vous savez, je pense que ce n'est qu'une ou deux diapositives que vous avez évoquées à ce sujet, mais c'était quelque chose, un scénario qui je pense est vraiment intéressant. La suppression d'informations par exemple, doit être un peu plus intelligente que de masquer divers domaines, car avec l'apprentissage automatique de nos jours, vous pouvez faire des choses déductives qui vous permettent de faire apparaître des informations que vous ne pouviez pas faire surface auparavant.

Si vous essayez de protéger, disons les informations sur la santé, alors ce sont des règles très draconiennes aux États-Unis en ce qui concerne les informations sur la santé, mais vous pouvez en fait, en utilisant diverses techniques d'apprentissage automatique, vous pouvez souvent déterminer qui est l'information médicale de quelqu'un. est en fait. Je me demandais simplement si vous aviez quelque chose à dire à ce sujet, car ils pensent tous que c'est un domaine intéressant.

Bert Scalzo: Oui, absolument, et j'utilise juste cela comme exemple, je n'essaie pas de dire qu'une base de données est meilleure qu'une autre, mais c'est un très bon exemple pour ce que vous venez de demander. Dans Oracle, si je ne suis pas autorisé à voir une ligne de données par exemple, comme je n'ai pas le droit de voir le dossier médical de John Smith. Dans Oracle, si je dis «Sélectionnez cet enregistrement», je serai bloqué ou je serai autorisé à voir ce que je suis autorisé à voir et il sera expurgé. Et si je dis: «Sélectionnez l'étoile du compte dans le tableau où est égal à John Smith», j'obtiendrai zéro.

Dans SQL Server, il peut faire la rédaction mais il a quelques trous. Si je dis: «Sélectionnez l'étoile du compte dans le tableau où il est égal à John Smith», je vais en récupérer un, donc je sais qu'il y a un John Smith. L'un est plus sûr que l'autre. Maintenant, je m'attends à ce qu'ils corrigent cela, ils jouent toujours avec des sauts de grenouille. Et encore une fois, je n'essaie pas de faire la différence entre les bases de données autrement que pour montrer un exemple de - regardez ce dont nous parlons maintenant, quelque chose d'aussi simple que le compte sélectionné doit également être coupé par la rédaction, même si, techniquement, parlant, il n'y a rien qui soit expurgé autre que l'existence de la rangée.

Robin Bloor: Oui, c'est ça. C'est assez intéressant. Je veux dire, une autre question générale parce que je n'ai pas beaucoup de temps, concerne vraiment les améliorations. Je veux dire que vous avez été dans un domaine où je sais que vous nous avez montré des exemples de différents résultats de test que vous avez exécutés - pensez-vous que les bases de données traditionnelles, appelons-les les bases de données dominantes, SQL Server et Oracle, pensez-vous pensez-vous qu'ils vont rester en avance sur l'achèvement? Ou pensez-vous qu'ils vont en fait se faire prendre par l'un ou l'autre des divers types de perturbations du marché qui leur sont vraiment favorables? Qu'en penses-tu?

Bert Scalzo: J'ai une opinion et c'est - vous savez, encore une fois, je vais dire que c'est mon opinion - Microsoft par exemple, dans l'ère post-Ballmer impressionne juste l'enfer vivant hors de moi. Je veux dire cette base de données extensible obtenant SQL Server sur Linux, obtenant .NET sur Linux, obtenant PowerShell sur Linux; Je ne pense pas que les fournisseurs de bases de données traditionnels vont se laisser distancer. Je pense qu'ils ont décidé: «Hé, laissez les nouveaux gars, les startups définir quelque chose. Laissez-les découvrir ce qu'est le sharding et comment il devrait être perfectionné, et une fois qu'ils auront fait toutes les recherches et le développement, nous savons exactement ce que les utilisateurs veulent, ajoutons maintenant le sharding à Oracle. »Je pense qu'ils deviennent simplement intelligents et en disant: "Hé, être deuxième ou troisième n'est pas mauvais quand vous êtes le joueur dominant car alors les gens ne migreront pas hors de vous."

Robin Bloor: Oui, je veux dire que c'est une stratégie qui a été utilisée. Je veux dire qu'IBM avait l'habitude de faire cela et l'ensemble de la - pour l'ensemble de leurs gammes de produits et cela se passe assez bien jusqu'à ce que quelqu'un trouve quelque chose qui est complètement hors du mur auquel personne n'a jamais pensé, mais vous ne pouvez pas planifier contre cela de toute façon.

Des questions du public, Eric?

Eric Kavanagh: Oui, mais vous avez du temps, je pense juste pour un peut-être et je sais que Bert doit courir. Il y avait quelque chose ici - d'accord, l'architecture de partitionnement sur Oracle 12c est une indication de - ou qu'est-ce qu'une indication de, à votre avis, que pensez-vous qu'il se passe là-bas?

Bert Scalzo: Eh bien, Oracle absorbe ou / et offre tout ce que tous les autres fournisseurs de bases de données sont. Par exemple, je peux mettre des données non structurées dans Oracle. Je ne sais pas comment vous pouvez mettre des données non structurées, puis l'appeler une base de données relationnelle, donc cela n'a aucun sens, mais vous pouvez. Et maintenant, Oracle ajoute un partitionnement, alors Oracle dit: «Vous savez quoi? Quoi que le marché veuille, nous ferons notre offre de base de données parce que le marché veut ce que le marché veut et nous voulons fournir la solution, nous voulons qu'ils restent avec nous. »

Je pense que vous allez voir des éléments supplémentaires. Je ne serais pas surpris de voir un clustering de type Hadoop de nœuds de base de données non pas dans un rack Oracle ou un cluster d'applications réelles, mais essentiellement dans un clustering de type Hadoop traditionnel faisant ce partage. Et donc je pense que vous pourrez déployer une base de données comme Oracle comme vous le feriez pour un Hadoop, et ce genre de tendances va continuer. Ces grands fournisseurs de bases de données, ils gagnent des milliards de dollars et ils ne veulent pas perdre leur marché, ils sont donc prêts à s'adapter à tout ou à adopter quoi que ce soit.

Eric Kavanagh: Eh bien, vous savez, c'est drôle parce que j'ai suivi les fournisseurs open source pendant un certain temps et je me suis demandé tout cela alors que l'ampleur de l'impact que cela aura sur la technologie traditionnelle des portes fermées, et pendant un certain temps j'avais l'impression que les fournisseurs open-source faisaient de sérieux progrès, et maintenant que je regarde le marché, je vois un peu ce que vous dites, que les gros gars ont fait leur calcul, ont aiguisé leurs crayons et ils ont compris comment ils peuvent tisser beaucoup de ce genre de choses dans leurs architectures. Qu'il s'agisse d'IBM, d'Oracle ou de SAP - j'étais juste à la conférence SapphireNow le mois dernier et Steve Lucas, qui dirige la moitié de cette entreprise, s'est vanté que SAP incorpore maintenant dans sa plate-forme cloud HANA, plus de composants open-source que n'importe lequel de leurs concurrents. Si vous faites le calcul à ce sujet, c'est une déclaration assez impressionnante et cela me dit que les gros gars ne vont nulle part de sitôt.

Bert Scalzo: Non, je parierais mon argent sur les deux. Je veux dire, si vous regardez, le stock de Microsoft était récemment à environ 50 $ et, vous savez, il y a quelques années seulement, il était à 25. Vous ne doublez pas votre cours de bourse en peu de temps à moins que vous ne fassiez de bonnes choses et, vous sachez, que tout soit gratuit depuis Windows 10 pendant la première année ou toutes les autres choses intelligentes qu'ils font, cette fonctionnalité de base de données étendue est, je pense, tout simplement phénoménale. Je pense que ce qui va se passer, c'est que beaucoup de gens vont se retrouver dans Azure, pas directement, pas comme ils l'ont dit: «Migrons ma base de données vers Azure». Cela va migrer là-bas comme par magie parce que ça va être archivé là-bas en utilisant cette nouvelle fonctionnalité de base de données extensible et donc l'adoption d'Azure va monter en flèche.

Eric Kavanagh: Eh bien, c'est l'une des tendances du marché que même moi, je peux voir, même sur votre Mac. Lorsque vous allez dans votre Mac pour enregistrer certains documents, ils le font maintenant - et les nouveaux Mac suivent simplement le cloud, non? Je veux dire, il y a beaucoup de sens dans cette stratégie et je la regarde aussi et je dis: «D'accord les gars, vous essayez de m'attirer morceau par morceau dans votre environnement cloud, puis un jour quand je veux regarder un film si ma carte de crédit est expirée, je vais avoir des ennuis. "

Bert Scalzo: Oui, mais vous le faites sur Facebook.

Eric Kavanagh: Ouais. C'est vrai.

Bert Scalzo: Vous mettez tout sur Facebook.

Eric Kavanagh: Eh bien, pas tout à fait.

Bert Scalzo: Non, je veux dire …

Eric Kavanagh: Oui, allez-y.

Bert Scalzo: Ces tendances sociales atteignent les entreprises. Maintenant, les entreprises ont encore beaucoup d'autres choses à faire, mais elles voient ces tendances et font le même genre de choses. Je ne vois ni Oracle ni Microsoft s'en aller. En fait, je vais acheter des actions sur les deux à chaque fois qu'il y a une baisse.

Eric Kavanagh: Oui, en effet. Eh bien, allez sur idera.com, IDERA dot com. Comme Bert l'a dit, ils ont tout un tas de trucs gratuits là-haut et c'est l'une des nouvelles tendances du marché - vous donner des trucs gratuits avec lesquels jouer, vous accrocher, puis vous allez acheter les vrais trucs.

Les gens, cela a été une autre technologie chaude. Merci pour votre temps aujourd'hui, Bert, Dez bien sûr, et Robin également. Nous vous parlerons la semaine prochaine, les amis, beaucoup de choses se passent. Si vous avez des idées, n'hésitez pas à nous envoyer un courriel, . Nous vous parlerons la prochaine fois, faites attention. Bye Bye.

L'élan en avant: aller au-delà du traditionnel