Identifiant :Mot de passe :
Actualités

Défi EGC 2018 - Un défi sous le soleil de l’Île de La Réunion!

Pour cette troisième édition du défi (2018), le Laboratoire d’Énergétique, d’Électronique et Procédés (LE2P) et le Laboratoire d’Informatique et de Mathématiques (LIM) de l’Université de La Réunion vous proposent d’analyser des données de flux/rayonnements solaires à l’Île de La Réunion. Ce projet s’inscrit dans le cadre de la politique de développement vers l’autonomie énergétique à l’Île de La Réunion. Un historique de données de capteurs multi-sources sur plusieurs années est mis à votre disposition sous forme de séries temporelles multivariées. Nous suggérons deux défis indépendants basés sur ces données de flux solaires :

  1. un défi d’analyse exploratoire ouvert 
  2. un défi de prédiction de flux solaire.

Données

Pour mesurer le rayonnement solaire, quinze stations équipées de capteurs SPN1 (Sunshine Pyranometer) sont réparties sur l’Île de La Réunion. Le rayonnement solaire peut être décomposé en trois flux :

  • le flux global FGlobal
  • le flux diffus (ou réfléchi) FDiffus
  • le flux direct FDirect :
    FDirect = FGlobalFDiffus

Dans le domaine de la recherche sur l’énergie solaire, nous nous intéressons aussi à l’indice de fraction directe kb, défini comme le rapport du flux direct et du flux global, afin de représenter le rayonnement solaire journalier. Intuitivement, lorsque cet indice est proche de 1, le flux direct est proche du flux global et on est en présence d’une journée ensoleillée ; inversement, lorsque l’indice est proche de 0, la journée est nuageuse.

Les capteurs permettent d’obtenir les composantes diffuses et globales du flux solaire toutes les minutes. Ces capteurs sont associés à des capteurs météorologiques qui permettent d’obtenir – au pas de la minute aussi – la température, la pression atmosphérique, le taux d’humidité dans l’air ainsi que la force et la direction du vent.

Ainsi, vous disposerez d’environ cinq ans (2012-2016) d’historique de données de flux solaire et de données météorologiques (locales aux capteurs de flux solaire) sous forme de séries temporelles numériques au pas de la minute et par station.

Plus précisément, chaque station SPN1 fournit les sept mesures suivantes :

  • FG_avg (en W=m2) : le flux global
  • FD_avg (en W=m2) : le flux diffus
  • Patm_avg (en hPa) : la pression atmosphérique
  • RH_avg (en %) : le taux d’humidité dans l’air
  • Text_avg (en °C) : la température extérieure
  • WD_MeanUnitVector (en degré) : la direction du vent
  • WS_avg (en m/s) : la vitesse du vent

Ci-dessous un exemple de table de données des sept mesures pour une station SPN1 :

Les données peuvent être téléchargées à partir du lien suivant : http://test.egc.asso.fr/files/defi2018/RUN_solar_data_EGC_OpenChallenge.zip


Objectifs et tâches du défi

Les défis proposés s’adressent à la communauté de fouille de données et plus précisément aux passionnés de l’analyse de séries temporelles.

Le défi ouvert : analyse exploratoire

Pour le défi ouvert, 2 ans d’historique de données sont mis à disposition de la communauté sous la forme de cinq fichiers disponibles dans un fichier compressé au format ZIP. Chaque fichier contient les données collectées par un des capteurs pendant deux ans.

Bien que ce défi soit ouvert, nous suggérons quelques pistes de travail (non-exhaustives et donc non-restrictives) :

  • clustering de séries temporelles journalières (par exemple, la classification de journée type en fonction des données de flux solaires et/ou météorologiques
  • analyse des corrélations entre données de flux solaires et données météorologiques ;
  • analyses liées à la détection d’anomalies, d’évènements extrêmes, de gestion/complétion de valeurs manquantes ;
  • nouvelles visualisations de masses de données de séries temporelles ;
  • prédiction du flux global FGlobal ou de l’indice kb de fraction directe à l’horizon H+1, H+2, ..., J+1 (à noter qu’un challenge prédictif est dédié à une tâche de prédiction de flux solaire, voir ci-dessous)
  • ...

Pour ce défi ouvert, l’utilisation de données externes (open data) est autorisée tant qu’elles sont publiquement disponibles.

Le défi prédiction

Un défi dédié à la prédiction de flux solaire sera mis en place courant avril 2017 sur la plateforme datascience.net. Plus d’informations seront alors disponibles sur cette page ainsi que sur le site datascience.net.

Les participants peuvent traiter au choix l’une des deux tâches ou les deux.

Soumission

Pour répondre au défi ouvert, vous devez rassembler vos résultats sur ces données dans un article long soumis à la conférence ’2018 avec la mention "Défi EGC 2018" dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip. Les modalités de soumission et d’acceptation sont les mêmes que pour les autres articles , notamment l’anonymat des soumissions.

Pour répondre au défi prédiction, vous devez déposer sur le site datascience.net un fichier de résultats contenant les prédictions pour un jeu d’évaluation qui sera fourni ultérieurement. Les participants à ce défi sont également encouragés à rassembler leurs résultats sur ces données dans un article long soumis à la conférence ’2018 avec la mention "Défi EGC 2018" dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip. Ils participeront ainsi de fait au défi ouvert.

Présentation

Les papiers acceptés seront présentés lors de la conférence en janvier 2018, très certainement dans une session spéciale « Défi EGC ».

Attribution du prix du défi EGC 2018

Le « défi ouvert » est doté d’un prix de 1500 euros délivré par l’association .

Le « défi prédiction » est doté d’un voyage sous le soleil de la Réunion délivré par l’Université de la Réunion (voyage aller/retour à l’Île de la Réunion au départ de Paris).

Pour le défi ouvert, un jury se réunira pour attribuer les prix du défi 2018, dans le même esprit que pour les autres prix.

Les critères d’attribution seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.

Restriction de participation

Les membres de l’Université de La Réunion ainsi que les acteurs dans le domaine de la production d’énergie solaire de l’Île de La Réunion ne sont pas autorisés à participer au défi.

Calendrier

Les dates de soumission et de notification seront les mêmes que pour la conférence 2018

Contact

Vous retrouverez tous les éléments du Défi-EGC sur la page dédiée du site de l’association EGC.

Si vous avez d’autres questions, merci de contacter Arnaud MARTIN en indiquant clairement « Défi EGC 2018 » dans le sujet de votre mail.


Règlement officiel

Le règlement officiel du Défi-EGC sera mis très rapidement en ligne.

Agenda
Avril 2017
L
M
M
J
V
S
D
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Pour cette troisième édition du défi (2018), le Laboratoire d’Énergétique, d’Électronique et Procédés (LE2P) et le Laboratoire d’Informatique et de Mathématiques (LIM) de l’Université de La Réunion vous proposent d’analyser des données de flux/rayonnements solaires à l’Île de La Réunion.
Le prix est doté de 1500 euros et d'un voyage sous le soleil de la Réunion !
La 16ème conférence internationale sur l'extraction et la gestion des connaissances (EGC 2016), se tiendra à Reims (France) du 18 au 22 janvier 2016.
Le site consacré à cet événement vient désormais d'ouvrir à l'adresse suivante : http://egc2016.univ-reims.fr/
La 15ème conférence internationale sur l'extraction et la gestion des connaissances (EGC 2015), se tiendra au Luxembourg du 28 au 30 janvier 2015.
Le site consacré à cet événement vient désormais d'ouvrir à l'adresse suivante : http://egc2015.lippmann.lu
Les éditions Springer, qui publient les post-actes internationaux EGC, ont fait part du succès rencontré par la publication du titre Advances in Knowledge Discovery and Management regroupant une sélection des meilleurs articles présentés lors des dernières éditions des conférences EGC.
À l'initiative du ministère de l'Enseignement supérieur et de la Recherche, l'Agence Nationale de la Recherche met en place un espace dédié aux rencontres entre les besoins des entreprises en matière de recherche & développement et l'offre de compétences des laboratoires publics.
Osmar Zaiane, de l'Université d'Alberta (Canada), propose une classification internationale régulièrement mise à jour des conférences en fouille de données sur son site.
©2017 EGC