GitLab version 13.5, quoi de neuf ?
La collaboration entre les utilisateurs est l’une des valeurs fondamentales de GitLab, et l’un des éléments clé du DevOps. Ce mois-ci, GitLab propose pas moins de 60 améliorations, dont plusieurs...
View ArticleLa Cloudera Data Platform va plaire, mais à quel prix ?
Cloudera a depuis quelques mois sorti sa nouvelle plateforme Cloud native : Cloudera Data Platform. Elle se décline en plusieurs parties : de la gouvernance via SDX, une partie Cloud, piloté par...
View ArticleSurdimensionnement de l’infrastructure : un facteur contre-productif en Big...
Dans le Big Data, la tendance dans les entreprises est de se concentrer sur les aspects d’analyse de la donnée, sans beaucoup se préoccuper du « moteur ». Pourtant, l’infrastructure est un élément tout...
View ArticleArchitecture Druid
Apache Druid est une base de données analytique axé temps réel offrant la possibilité de persister des quantités de données immenses et d’en extraire de l’information à une vitesse hallucinante, le...
View ArticleMonitoring Nifi via streaming de bulletin dans Hive 3
Contexte Dans le cadre du suivi de production et le monitoring Nifi, je vais vous présenter un moyen que nous utilisons pour sauvegarder l’ensemble des évènements « bulletin » au sein d’un cluster...
View ArticleGouvernance des données : CDP et Ranger, le Data Masking simplement
Introduction Que vos bases de données contiennent des données sensibles liées au bancaire, à la santé, aux données personnelles d’utilisateurs ou que vous ayez simplement à cœur de mettre en place une...
View ArticleCas d’usage Nifi : pagination REST, Jolt et monitoring
Contexte Chez Cyrès, nous gérons la saisie des temps via un outil pratique et puissant : Toggl. Dans le cadre de l’amélioration du reporting, m’est venu l’idée d’intégrer les rapports CSV de cet outil,...
View ArticleSpark 3 : Adaptive Query Execution, explication et optimisation
Article mis à jour le 20 juin 2023. J’ai assisté à un webinar Cloudera sur le tuning des performances d’applications Spark proposé par François Reynald, un des Senior Technical Instructor de Cloudera....
View ArticleCDP 7.1.7 : des fonctionnalités très attendues !
Sortie le 10 Aout dernier, la nouvelle version de CDP 7.1.7 du Cloudera Runtime se targue – comme ses prédécesseuses – d’une liste de nouvelles fonctionnalités et d’améliorations concernant la...
View ArticleQu’est-ce que la plateforme Cloudera ? : une synthèse pour vous aider à y...
Cloudera est une société Américaine qui fournit des outils et une solution complète autour du Big Data, du traitement et de l'analyse de la donnée... L’article Qu’est-ce que la plateforme Cloudera ? :...
View Article