Vidéo: Apache Drill Introduction 2025
Apache Drill est un projet candidat dans l'incubateur Apache. Apache Drill n'est pas spécialement maladif, cependant. Les technologies candidates d'Apache Software Foundation (ASF) commencent toutes en tant que projets d'incubation avant de devenir des technologies ASF officielles. Vous pouvez lire sur l'Incubateur Apache. Vous pouvez lire à propos de Drill.
Inspiré de la technologie Dremel de Google, l'objectif de performance déclaré de Drill est d'activer les requêtes SQL contre un ou plusieurs pétaoctets de données répartis sur 10 000 serveurs et plus. La figure illustre l'architecture d'Apache Drill.
Vous pouvez voir que les clés de l'architecture Drill sont les serveurs DrillBit déployés sur chaque noeud de données. Notez que chaque serveur inclut un analyseur de requêtes, un compilateur, un optimiseur et un runtime, mais qu'un serveur maître DrillBit est nommé par les serveurs Zookeeper, qui supervise l'exécution des requêtes et s'occupe de regrouper les jeux de résultats intermédiaires en un seul ensemble de sortie.
Comme Dremel, Drill peut coexister avec MapReduce et le compléter, mais MapReduce n'est pas utilisé pour répondre aux requêtes, comme avec Apache Hive. À la place, des moteurs d'exécution appelés Drillbits ont été développés par des membres de la communauté Drill.
Cette communauté vise à fournir des requêtes à faible latence pour des applications telles que les tableaux de bord d'analyse décisionnelle en temps réel, la détection des fraudes et d'autres cas d'utilisation sensibles au facteur temps. Drill prend en charge les types de données imbriqués tels que Avro, JSON et les tampons de protocole Google. Ces types de données imbriqués permettent de très grandes tables dénormalisées.
L'équipe de développement Drill travaille également à fournir un support SQL complet en ciblant la conformité SQL2003. Enfin, notez que l'équipe Drill fournit le support HBase pour que les utilisateurs puissent interroger les tables HBase avec SQL.