Défi EGC 2024 – Analyse des données Bitcoin

L’objectif du défi est de faire de l’extraction de connaissance autour de données Bitcoin. Deux jeux de données portant sur l’activité de la blockchain durant 2 ans et demi sont fournis :

  • Des séries temporelles, décrivant l’activité générale de la Blockchain, ainsi que l’activité de 100 acteurs majeurs
  • Des réseaux de transactions (1 par jour) décrivant les échanges entre un sous-ensemble d’acteurs majeurs

Il n’y a pas d’objectif unique sur lequel les équipes seront comparées : c’est la qualité de la contribution et son originalité qui permettront de choisir la contribution gagnante du défi. Des exemples détaillés de contributions possibles sont fournis après la description des données.

Plus d’informations sur le site du défi 2024

Le prix est doté de 1500€

Défi EGC 2022 : prévoir l’évolution du niveau de nos nappes phréatiques

Le Bureau de Recherches Géologiques et Minières (BRGM) propose un nouveau défi EGC pour la 22ème édition d’EGC qui aura lieu en janvier 2022.

Présentation

Le BRGM propose de s’intéresser à la modélisation des niveaux des nappes phréatiques (autrement appelés « niveaux piézométriques » ou « niveau d’eau », ou simplement « niveau »), suivis sous la forme de séries temporelles (aussi nommées « chroniques » dans la suite de ce document) à travers deux défis distincts (il est possible de s’intéresser à l’un, à l’autre, ou aux deux):

    1. la prédiction de l’évolution du niveau piézométrique au cours du temps sur une période de trois mois;
    2. la recherche de motifs ou de séries temporelles représentatives par le biais de méthodes de partitionnement ou de recherche de motifs.

Pour chacune de ces deux tâches, des informations externes pourront être utilisées pour contextualiser, enrichir et améliorer les résultats et l’interaction d’un expert avec les données.

Description du défi et données

La description du défi ainsi que les données sont disponibles ci dessous :

Calendrier

Les défis sont à soumettre avant le 15 octobre 2021 sur le site Easychair du défi 2022 accessible à l’adresse suivante : https://easychair.org/conferences/?conf=egc2022

Contact

Surprenez nous !

Défi EGC 2020: 20 ans d’histoire pour quel avenir ?

L’association EGC propose un nouveau défi EGC pour la 20ème édition d’EGC qui aura lieu en janvier 2020.

Données

Nous mettons à disposition les données concernent :

export_articles_EGC_2004_2018

Objectif

L’objectif de ce défi historique est de faire le bilan de l’évolution de la communauté EGC ces 20 dernières années et tenter d’en prédire l’avenir.
Le principe est d’appliquer des techniques d’extraction et de gestion de connaissances afin d’expliquer la structure et l’évolution de l’ensemble des données au fil des années.
Tous les éléments du Défi-EGC sont disponibles sur la page dédiée du site de l’association EGC.

Soumission

Pour répondre au défi, vous devez rassembler vos résultats sur ces données dans un article soumis à la conférence EGC’2020 à l’automne 2019. Les instructions de soumission seront fournies ultérieurement.

Présentation

Les papiers acceptés seront présentés lors de la conférence en janvier 2020.

Evaluation de vos résultats

Après acceptation de l’article à la conférence, une évaluation par un jury d’attribution du prix aura lieu, dans le même esprit que les autres prix EGC. Les critères d’évaluation seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus. Le prix sera d’un montant de 1500 euros

Calendrier

Les dates de soumission et de notification sont les mêmes que pour la conférence EGC 2020

Contact

Si vous avez d’autres questions, merci de contacter Arnaud Martin (Arnaud.Martin@univ-rennes1.fr) en indiquant clairement « Défi EGC 2020» dans le sujet de votre mail.

Surprenez nous !

Défi EGC 2018 : Un défi sous le soleil de l’Île de La Réunion

Pour cette troisième édition du défi EGC (2018), le Laboratoire d’Énergétique, d’Électronique et Procédés (LE2P) et le Laboratoire d’Informatique et de Mathématiques (LIM) de l’Université de La Réunion vous proposent d’analyser des données de flux/rayonnements solaires à l’Île de La Réunion. Ce projet s’inscrit dans le cadre de la politique de développement vers l’autonomie énergétique à l’Île de La Réunion. Un historique de données de capteurs multi-sources sur plusieurs années est mis à votre disposition sous forme de séries temporelles multivariées. Nous suggérons un défi d’analyse exploratoire ouvert sur ces données.

Données

Pour mesurer le rayonnement solaire, quinze stations équipées de capteurs SPN1 (Sunshine Pyranometer) sont réparties sur l’Île de La Réunion. Le rayonnement solaire peut être décomposé en trois flux :

  • le flux global FGlobal
  • le flux diffus (ou réfléchi) FDiffus
  • le flux direct FDirect :
    FDirect = FGlobalFDiffus

Dans le domaine de la recherche sur l’énergie solaire, nous nous intéressons aussi à l’indice de fraction directe kb, défini comme le rapport du flux direct et du flux global, afin de représenter le rayonnement solaire journalier. Intuitivement, lorsque cet indice est proche de 1, le flux direct est proche du flux global et on est en présence d’une journée ensoleillée ; inversement, lorsque l’indice est proche de 0, la journée est nuageuse.

Les capteurs permettent d’obtenir les composantes diffuses et globales du flux solaire toutes les minutes. Ces capteurs sont associés à des capteurs météorologiques qui permettent d’obtenir – au pas de la minute aussi – la température, la pression atmosphérique, le taux d’humidité dans l’air ainsi que la force et la direction du vent.

Ainsi, vous disposerez d’environ cinq ans (2012-2016) d’historique de données de flux solaire et de données météorologiques (locales aux capteurs de flux solaire) sous forme de séries temporelles numériques au pas de la minute et par station.

Plus précisément, chaque station SPN1 fournit les sept mesures suivantes :

  • FG_avg (en W=m2) : le flux global
  • FD_avg (en W=m2) : le flux diffus
  • Patm_avg (en hPa) : la pression atmosphérique
  • RH_avg (en %) : le taux d’humidité dans l’air
  • Text_avg (en °C) : la température extérieure
  • WD_MeanUnitVector (en degré) : la direction du vent
  • WS_avg (en m/s) : la vitesse du vent

Ci-dessous un exemple de table de données des sept mesures pour une station SPN1 :

Les données peuvent être téléchargées à partir du lien suivant : https://www.egc.asso.fr/files/defi2018/RUN_solar_data_EGC_OpenChallenge.zip

Objectifs et tâches du défi

Les défis proposés s’adressent à la communauté de fouille de données et plus précisément aux passionnés de l’analyse de séries temporelles.

Pour le défi ouvert, 2 ans d’historique de données sont mis à disposition de la communauté sous la forme de cinq fichiers disponibles dans un fichier compressé au format ZIP. Chaque fichier contient les données collectées par un des capteurs pendant deux ans.

Bien que ce défi soit ouvert, nous suggérons quelques pistes de travail (non-exhaustives et donc non-restrictives) :

  • clustering de séries temporelles journalières (par exemple, la classification de journée type en fonction des données de flux solaires et/ou météorologiques
  • analyse des corrélations entre données de flux solaires et données météorologiques ;
  • analyses liées à la détection d’anomalies, d’évènements extrêmes, de gestion/complétion de valeurs manquantes ;
  • nouvelles visualisations de masses de données de séries temporelles ;
  • prédiction du flux global FGlobal ou de l’indice kb de fraction directe à l’horizon H+1, H+2, …, J+1 (à noter qu’un challenge prédictif est dédié à une tâche de prédiction de flux solaire, voir ci-dessous)

Pour ce défi ouvert, l’utilisation de données externes (open data) est autorisée tant qu’elles sont publiquement disponibles.

Soumission

Pour répondre au défi ouvert, vous devez rassembler vos résultats sur ces données dans un article long soumis à la conférence EGC 2018 avec la mention « Défi EGC 2018 » dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip. Les modalités de soumission et d’acceptation sont les mêmes que pour les autres articles, notamment l’anonymat des soumissions.

Présentation

Les papiers acceptés seront présentés lors de la conférence EGC en janvier 2018, très certainement dans une session spéciale « Défi EGC ».

Attribution du prix du défi EGC 2018

Le « défi ouvert » est doté d’un prix de 1500 euros délivré par l’association EGC.

Pour ce défi, un jury se réunira pour attribuer les prix du défi 2018, dans le même esprit que pour les autres prix.

Les critères d’attribution seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.

Restriction de participation

Les membres de l’Université de La Réunion ainsi que les acteurs dans le domaine de la production d’énergie solaire de l’Île de La Réunion ne sont pas autorisés à participer au défi.

Calendrier

Les dates de soumission et de notification seront les mêmes que pour la conférence EGC 2018.

Contact

Vous retrouverez tous les éléments du Défi-EGC sur la page dédiée du site de l’association EGC.

Si vous avez d’autres questions, merci de contacter Arnaud MARTIN en indiquant clairement « Défi EGC 2018 » dans le sujet de votre mail.

 

Défi EGC 2017 : Un défi vert pour Grenoble

Pour cette seconde édition du défi EGC, Big Datext, entreprise Grenobloise spécialisée dans l’analyse prédictive, et la mairie de Grenoble se sont toutes deux impliquées dans la mise en place et la diffusion de la base de données du challenge. En phase avec la politique Open Data de la Ville, visant à diffuser les données publiques de la métropole, Big Datext et les services de la Ville ont souhaité axer le défi sur les données relatives aux espaces verts.

Données

Les données concernent des arbres situés dans la ville de Grenoble et entretenus par les services municipaux. Chaque enregistrement concerne un arbre et comporte des variables décrivant son type, son stade de développement, sa localisation et son environnement, son état et les traitements préconisés.

Objectifs

Le but de ce défi est double.

  • La première tâche consiste à déterminer, à partir des données disponibles, si l’arbre a un défaut et dans l’affirmative lequel.
  • La seconde tâche, plus ouverte, vise à appliquer des techniques d’extraction et de gestion de connaissances afin de mieux connaître l’état du « parc végétal » de Grenoble, de mieux comprendre son évolution et de fournir des préconisations pour faciliter son entretien. Pour cette seconde tâche, les participants peuvent, s’ils le souhaitent, avoir recours à des données externes.

Les participants peuvent traiter au choix l’une des deux tâches ou les deux et, un retour sur la qualité des données (complétude, redondance, etc.) dans un contexte open data sera apprécié.

Soumission

Pour répondre au défi, vous devez rassembler vos résultats sur ces données dans un article long soumis à la conférence EGC’2017 avec la mention « Défi EGC 2017 » dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

Les modalités de soumission et d’acceptation sont les mêmes que pour les autres articles EGC, notamment l’anonymat des soumissions.

De plus les participants au premier défi devront renvoyer un fichier de résultats contenant leur prédiction pour un jeu d’évaluation qui sera fourni ultérieurement.

Les fichiers des données au format CSV ainsi que le descriptif des variables (EGC_description_variables_14042016.xls, classeurs EGC et Prédiction) et les consignes pour la tâche de prédiction sont disponibles sur le site : https://egc2017.imag.fr/defi

Présentation

Les papiers acceptés seront présentés lors de la conférence à Grenoble en janvier 2017, très certainement dans une session spéciale « Défi EGC ».

Prix

Attribution du prix du défi EGC 2017 : 1500 euros

Un jury se réunira pour attribuer le prix du défi EGC 2017, dans le même esprit que pour les autres prix EGC. Les critères d’attribution seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.

Calendrier

Les dates de soumission et de notification seront les mêmes que pour la conférence EGC 2017.

Contact

Vous retrouverez tous les éléments du Défi-EGC sur la page dédiée du site de l’association EGC (https://www.egc.asso.fr/).

Si vous avez d’autres questions, merci de contacter Christine Largeron en indiquant clairement « Défi EGC 2017 » dans le sujet de votre mail.

Défi EGC 2016 : Communauté EGC quelle histoire et quel avenir

 Contexte

L’association EGC lance le premier défi EGC avec comme principe de valoriser votre équipe et vos approches de fouille de données sur des cas concrets. Pour cette première année, les données vont concerner les publications EGC et les objectifs du défi seront ouverts. Nous vous donnons dans cette première annonce les éléments principaux du Défi EGC qui vous permettront de commencer le travail au plus tôt. Des précisions pourront être apportées en cours de route et en fonction de vos interrogations.

Données

Les données concernent les articles publiés à la conférence EGC depuis 2004. Elles sont accessibles à l’adresse suivante :

http://editions-rnti.fr/?m=articles_export (fichier RNTI_articles_export.txt.zip)

Dans ce fichier, il suffit de sélectionner la valeur EGC dans la colonne « booktitle ».

Chaque enregistrement est décrit par 8 champs :

  • series,
  • booktitle,
  • year,
  • title,
  • abstract,
  • author,
  • pdf1page,
  • pdfarticle.

Seuls sont concernés tous les articles ayant EGC comme booktitle. Parmi eux, certains ont seulement le titre et le résumé documentés.

Objectif

Les objectifs de ce premier défi sont volontairement ouverts : surprenez-nous ! Le principe est d’appliquer des techniques d’extraction et de gestion de connaissances afin d’expliquer la structure et l’évolution de l’ensemble des données au fil des éditions (thématiques, communautés, atypiques, …).

Soumission

Pour répondre au défi, vous devez rassembler vos résultats sur ces données dans un article soumis à la conférence EGC’2016, de préférence au format long et avec la mention « Défi EGC 2016 » dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI :

http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

Présentation

Les papiers acceptés seront présentés lors de la conférence à Reims en janvier 2016, très certainement dans une session spéciale « Défi EGC ».

Evaluation de vos résultats

Après acceptation de l’article à la conférence, une évaluation par un jury d’attribution du prix aura lieu, dans le même esprit que les autres prix EGC. Les critères d’évaluation seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.

Prix

Le prix du Défi EGC est doté d’un montant de 1500 euros.

Calendrier

Les dates de soumission et de notification seront les mêmes que pour la conférence EGC 2016.

Inscriptions

L’inscription est gratuite et sans engagement mais nécessaire pour des raisons logistiques. Nous vous remercions d’avance de bien vouloir notamment indiquer l’adresse mail valide à laquelle nous pourrons vous faire suivre les informations utiles concernant le défi dans le formulaire accessible à l’adresse suivante :
https://docs.google.com/forms/d/113aijiUy9Yw5zBsVqBeacs28EW0Si5kMQsitFFNTMsw/viewform?usp=send_form

Contact

Si vous avez d’autres questions, merci de contacter Christine Largeron (largeron@univ-st-etienne.fr) en indiquant clairement « Défi EGC 2016 » dans le sujet de votre mail.