Web App Shiny pour afficher des données Databricks

Dans un article précédent (lien) nous avons vu comment créer une image contenant le driver ODBC de Databricks.Dans cet article, nous utiliserons ce que nous avons fait pour déployer une application Shiny qui affiche un dashboard avec des données issues de Databricks. Récupérer un token Azure AD Comme nous avons …

Créer une image Docker pour une connexion ODBC à Databricks

Si vous voulez créer des dashboards en dehors d’un Notebook, dans une Web Application par exemple, vous devrez d’abord permettre la connexion à Databricks en utilisant le driver fournit par l’éditeur. Dans cet article nous allons voir comment créer une image contenant tout ce qu’il faut pour permettre une connexion …

Préparation de données pour un projet Data science

La préparation des données est l’une des phases les plus importantes dans le cycle de vie d’un projet data science. Les recherches qui se focalisent sur ce domaine nous proposent une panoplie de solutions que nous allons voir à travers cet article. Introduction : Techniques de préparation des données. Pour la …

De la Business Intelligence et de l’Agilité

Les projets Business Intelligence sont traditionnellement très cadrés. Un besoin exprimé par des utilisateurs (issus du métier), des règles métiers, rapports, dashboards et KPI qui viennent généralement eux aussi des utilisateurs finaux. La DSI est consultée parce qu’elle sait d’où proviennent les données et qu’elle sera sollicitée pour le développement …

HdInsight : lancer des requêtes hive avec .Net Core

Nous avons vu dans un précédent article comment exécuter des requêtes Hive avec python. Nous allons maintenant voir comment faire de même en .Net Core, ce qui permettra d’exécuter une application .Net sur le cluster qui est sous linux.Pour cela, on va s’appuyer sur un package NuGet que j’ai développé …

HdInsight : lancer des requêtes hive en python

Nous allons voir dans cet article comment lancer des requêtes Hive en python à l’aide de PyHive.Le langage Hive permet d’effectuer des requêtes sur les données mais n’est pas dynamique. Impossible d’utiliser des variables ou de faire des boucles par exemples. C’est pourquoi, il peut être intéressant d’utiliser un langage …

REX : Requêtes interactives avec Azure SQL Data Warehouse Gen 1

Azure SQL Data Warehouse est un moteur MPP (Massive Parallel Processing) en PaaS disponible sur sur Azure. C’est la version PaaS de l’édition appliance APS (anciennement PDW). Comme tout moteur MPP (Tera Data, Presto, Impala, …), l’objectif est de pouvoir exécuter des requêtes SQL de type Data Warehousing sur de …