BigData

HadoopOnAzure, démo des TechDays 2012

Fév 22, 2012

Emmanuel Piteau

Retour

A l »occasion des TechDays 2012, nous avons eu le plaisir d »animer aux côtés de Laurent MARZOUK de Microsoft, une session dédiée à la problématique BigData, et particulièrement à l »intégration de HadoopOnAzure. Cette démo mettait en avant un cas d »usage tiré d »un scénario réèl :

Des clients s »abonnent à un service qui leur permet de diffuser des contenus publicitaires dans leurs lieux de vente sur des écrans de télévision
Ils uploadent leurs contenus vers une plateforme centralisée
Les sites de diffusion téléchargent les contenus en local
Un système de schedule permet aux clients de créer des listes de diffusion, autorisant ainsi la lecture des médias en pilotant unitairement chacun des écrans des lieux de vente
A chaque fois qu’2014-02-20 17:02:41’un film est joué sur un écran, un log de diffusion est remonté vers la plateforme centrale et stocké en BDD
Des outils de reporting sont mis en place pour permettre à différents intervenants d »avoir une vue sur l »activité du système :
- Rapports système pour les administrateurs de la plateforme
- Rapports d »usage en vue de la facturation client
- Rapports destinés au service commercial des client pour éventuelle re-facturation
- Outils d »analyse croisée pour chaque client

L »ensemble des diffusions sur chaque écrans génère une volumétrie considérable qu »il est couteux de stocker dans une BDD relationnelle à des fins d »analyse (3 Go de données / jour).

Nous avons donc démontré l »usage de HadoopOnAzure pour réaliser le stockage et l »analyse de ces données.

HaddopOnAzure est actuellement disponible en CTP sur invitation (ici). La version actuelle permet de créer un cluster temporaire qui peut contenir jusqu »à 32 noeuds et 16 TB de disques.

Lors de la création du cluster un nom DNS est choisi afin de pouvoir adresser la machine depuis l »extérieur du cluster, ou de s »y connecter en RDP.

Le cluster ainsi créé est adressable :

Depuis une console Hive inclue dans le portail HadoopOnAzure
Depuis une console Javascript inclue dans le portail HadoopOnAzure
Depuis l »extérieur du cluster grâce à un driver ODBC Hive QL (en ouvrant le port dédié)
En upload en FTPS (en ouvrant le port dédié)
En RDP

Le système permet, entre-autres d »exécuter des jobs de Map/Reduce écrits en .Net (C#, F#).

Le matériel de cette démo :

Les slides de la démo : HadoopOnAzure TechDays 2012.rar (1,56 mb)
La vidéo de la démo (nous avons eu la chance d »être webcasté, notre session commence à 4h30) : TechDays TV
Le VHD qui contient la CTP 3 de Denali que nous avons utilisé pour la démo : VHD Denali

Vos retours sont les bienvenus.

Enjoy 🙂

0 commentaires

Soumettre un commentaire Annuler la réponse

Découvrez nos autres articles

Migrer vos Azure Functions .NET 6 vers .NET 8 sur le modèle isolated-worker

par Romain LAPREE-KAMINSKI | 12 Avr 2024 | .Net Core, Azure, Dev

Les Azure Functions sont des services serverless proposés par Azure qui permettent d'exécuter du code en réponse à des événements déclenchés par requêtes HTTP, des minuteries ou d'autres ressources Azure (CosmosDB, Service Bus...). Ces fonctions ont l'avantage de...

lire plus

git et la face cachée du Rebase

par Jonathan EVAIN | 22 Déc 2023 | Agilité, commit, Dev, Git

"Faire une rebase ? *sight* heu... ok..." Jean-Michel Fullstack - Développeur fébrile Jean-Michel est inquiet. En effet, lorsque nous collaborons à plusieurs sur un projet, quelque soit les technologies utilisées, il est important de garder à l'esprit que notre...

lire plus

Déploiement automatisé d’un projet dbt

par Nicolas Bailly | 23 Mai 2023 | Azure, BigData, Data, DevOps

Nous retrouvons de plus en plus d'architecture Data contenant du dbt. Pour rappel dbt est un outil de transformation de données à utiliser à la sauce ELT et disponible via une offre SaaS (dont les éléments de tarification sont disponibles ici) ou bien en version...

lire plus

« Entrées précédentes