Table des matières:
La génomique clinique est un sujet fascinant, où les gens travaillent sur des technologies de pointe pour traiter des résultats rapides et précis. Il existe de nombreux séquenceurs de génomes disponibles sur le marché, et ils produisent des pétaoctets de données de séquence, et la croissance du séquençage va produire des exaoctets de données dans un avenir proche. Ici, Hadoop est la plate-forme idéale pour traiter un flux de travail génomique complexe. Hadoop peut stocker et trier des quantités massives d'informations et peut également rendre une analyse significative. (Pour avoir une idée de la quantité de données que cela implique réellement, lisez Comprendre les bits, les octets et leurs multiples.)
Le présent et l'avenir de la génomique
Aujourd'hui, la cartographie du génome a atteint son apogée de développement. De nombreuses personnes associées à l'industrie de la génomique regorgent de curiosité et, à mesure que de nouvelles opportunités se présentent, une meilleure technologie est le besoin de l'heure. Le séquençage du génome est une tâche très répétitive et gourmande en ressources. Rien qu'en 2013, environ 15 pétaoctets de données ont été produits, et seulement par 2 000 séquenceurs. Cette quantité époustouflante comprenait 300 Ko de données génomiques humaines séquencées. À ce rythme de production de données, on peut estimer qu'en 2018, environ un exaoctet de données sera produit. Cela sera dû à la croissance des séquenceurs, qui produiront de plus en plus de données par cycle. Une autre raison est l'avènement de machines de séquençage du génome extrêmement puissantes et peu coûteuses. Depuis 2008, le prix de ces machines diminue régulièrement. Cela est dû aux puissantes machines de nouvelle génération qui ont fait leur entrée sur le marché.
Les besoins de l'industrie de la cartographie du génome
Des algorithmes complexes sont utilisés pour traiter les données collectées à partir du génome humain. Ensuite, ces informations doivent être stockées. Il pourra être revu à l'avenir pour comparaison avec les données d'origine. La tâche de traitement et de stockage de 100 Go de données n'est pas trop difficile, surtout lorsque vous le faites avec les machines puissantes utilisées dans les centres de séquençage. Des études montrent que cette quantité de données peut être traitée en seulement environ 1 000 heures de processeur, c'est donc très facile. À ce rythme de progrès technique, il est évident que l'industrie du génome va bientôt traiter des milliers de gigaoctets en quelques secondes.
![Pourquoi Hadoop est un match parfait pour le séquençage du génome Pourquoi Hadoop est un match parfait pour le séquençage du génome](https://img.theastrologypage.com/img/it-healthcare/350/why-hadoop-is-perfect-match.jpg)