BigData

HadoopOnAzure, démo des TechDays 2012

Fév 22, 2012

Emmanuel Piteau

Retour

A l »occasion des TechDays 2012, nous avons eu le plaisir d »animer aux côtés de Laurent MARZOUK de Microsoft, une session dédiée à la problématique BigData, et particulièrement à l »intégration de HadoopOnAzure. Cette démo mettait en avant un cas d »usage tiré d »un scénario réèl :

Des clients s »abonnent à un service qui leur permet de diffuser des contenus publicitaires dans leurs lieux de vente sur des écrans de télévision
Ils uploadent leurs contenus vers une plateforme centralisée
Les sites de diffusion téléchargent les contenus en local
Un système de schedule permet aux clients de créer des listes de diffusion, autorisant ainsi la lecture des médias en pilotant unitairement chacun des écrans des lieux de vente
A chaque fois qu’2014-02-20 17:02:41’un film est joué sur un écran, un log de diffusion est remonté vers la plateforme centrale et stocké en BDD
Des outils de reporting sont mis en place pour permettre à différents intervenants d »avoir une vue sur l »activité du système :
- Rapports système pour les administrateurs de la plateforme
- Rapports d »usage en vue de la facturation client
- Rapports destinés au service commercial des client pour éventuelle re-facturation
- Outils d »analyse croisée pour chaque client

L »ensemble des diffusions sur chaque écrans génère une volumétrie considérable qu »il est couteux de stocker dans une BDD relationnelle à des fins d »analyse (3 Go de données / jour).

Nous avons donc démontré l »usage de HadoopOnAzure pour réaliser le stockage et l »analyse de ces données.

HaddopOnAzure est actuellement disponible en CTP sur invitation (ici). La version actuelle permet de créer un cluster temporaire qui peut contenir jusqu »à 32 noeuds et 16 TB de disques.

Lors de la création du cluster un nom DNS est choisi afin de pouvoir adresser la machine depuis l »extérieur du cluster, ou de s »y connecter en RDP.

Le cluster ainsi créé est adressable :

Depuis une console Hive inclue dans le portail HadoopOnAzure
Depuis une console Javascript inclue dans le portail HadoopOnAzure
Depuis l »extérieur du cluster grâce à un driver ODBC Hive QL (en ouvrant le port dédié)
En upload en FTPS (en ouvrant le port dédié)
En RDP

Le système permet, entre-autres d »exécuter des jobs de Map/Reduce écrits en .Net (C#, F#).

Le matériel de cette démo :

Les slides de la démo : HadoopOnAzure TechDays 2012.rar (1,56 mb)
La vidéo de la démo (nous avons eu la chance d »être webcasté, notre session commence à 4h30) : TechDays TV
Le VHD qui contient la CTP 3 de Denali que nous avons utilisé pour la démo : VHD Denali

Vos retours sont les bienvenus.

Enjoy 🙂

0 commentaires

Soumettre un commentaire Annuler la réponse

Découvrez nos autres articles

Databricks AI Summit 2025

par Ahmed Hamid | 23 Juin 2025 | Data, Intelligence Artificielle

Après le Snowflake Summit, Databricks a pris le relais au Data + AI Summit 2025 avec une évolution notable. La plateforme ne se limite plus à l’ingénierie ou à la science des données : elle se positionne désormais comme un système d’activation intelligent, où modèles,...

lire plus

Vous connaissiez Snowflake… mais avez-vous vu les nouveautés annoncées lors du Summit 2025 ?

par Ahmed Hamid | 13 Juin 2025 | Data, Intelligence Artificielle, Uncategorized

On le savait : Snowflake, ce n’est pas juste un entrepôt de données cloud. Mais au Summit 2025, on a assisté à une transformation : la plateforme devient un véritable système intelligent de données. IA générative intégrée, ingestion temps réel simplifiée, compute...

lire plus

Le Clusif obtient le statut d’établissement d’utilité publique

par Fabien Tanquerel | 16 Déc 2024 | Infra-Sécurité

Le décret du journal officiel du 26 novembre 2024 reconnait le Clusif comme établissement d’utilité publique. Cette association regroupe des RSSI d’entreprises ou organisations françaises depuis 30 ans. Ces acteurs de la Cybersécurité publient, animent des...

lire plus

« Entrées précédentes