Christine Largeron, Hanane Azzag, Mustapha Lebbah: 18ème Journées Francophones Extraction et Gestion des Connaissances, EGC 2018, 22-26 Janvier 2018, Paris, France. RNTI E-34, Éditions RNTI 2018.
Actes Ateliers EGC 2018
Organisateurs : Camille Kurtz, Nicolas Loménie
Site de la conférence EGC 2018
- Pascal Cuxac, Vincent Lemaire
Fouille de Textes (TextMine)
Site de l’atelier TextMine - Nicolas Turenne
Sciences des Données et Humanités Numériques
Site de l’atelier sdhn - Cécile Favre, Pascale Kuntz
Penser la Recherche en Informatique comme pouvant être Située, Multidisciplinaire Et Genrée (PRISME-G)
Site de l’atelier PRISME-G - Cédric Wemmert, Germain Forestier, Camille Kurtz, Jonathan Weber
Fouille de Données Complexes (FDC)
Site de l’atelier FDC - Cyril De Runz, Thomas Guyet, Eric Kergosien, Christian Sallaberry
Gestion et Analyse de données Spatio-Temporelles (GAST)
Site de l’atelier GAST - Fabien Picarougne, Pierrick Bruneau
Visualisation d’informations, Interaction, et Fouille de données (VIF)
Site de l’atelier VIF - Jérôme Azé, Thierry Charnois
Données personnelles, vie privée et éthique
Site de la journée EGC et IA
Conférences Invitées EGC 2018
- Antoine Cornuéjols
Qu’est-ce qu’un bon système d’apprentissage ? La réponse a évolué avec le temps. Et demain ? - Ernesto Estrada
Long-range influences in (social) networks - Santo Fortunato
Community structure in complex networks - Fosca Giannotti
Big Data for understanding human dynamics: the power of networks - Christopher Kermorvant
Reconnaissance et indexation automatique des registres de la chancellerie française (1300-1483)
EGC 2018 (Paris, France)
- Président d’honneur : Santo Fortunato, Center for Complex Networks and Systems Research (CNetS) School of Informatics and Computing Indiana University
- Présidente du comité de programme : Christine Largeron, Université Jean Monnet (UJM)
- Co-Présidents du comité d’organisation : Hanane Azzag (LIPN, Univ. Paris 13, Sorbonne Paris Cité), Mustapha Lebbah (LIPN, Univ. Paris 13, Sorbonne Paris Cité)
Sixièmes post-actes
Fabrice Guillet, Bruno Pinaud, Gilles Venturini and Djamel Abdelkader Zighed (eds),
« Advances In Knowledge Discovery and Management, Volume 6 »,
Series: Studies in Computational Intelligence,
Vol. 665, 2017, Springer.
ISBN: 978-3-319-45762-8, DOI: 10.1007/978-3-319-45763-5.

About this book
This book presents a collection of representative and novel work in the field of data mining, knowledge discovery, clustering and classification, based on expanded and reworked versions of a selection of the best papers originally presented in French at the EGC 2014 and EGC 2015 conferences held in Rennes (France) in January 2014 and Luxembourg in January 2015. The book is in three parts: The first four chapters discuss optimization considerations in data mining. The second part explores specific quality measures, dissimilarities and ultrametrics. The final chapters focus on semantics, ontologies and social networks.
Written for PhD and MSc students, as well as researchers working in the field, it addresses both theoretical and practical aspects of knowledge discovery and management.
Table des matières
Part I – Mining Data with Optimization
- Carine Hue, Marc Boullé, Vincent Lemaire:
Online Learning of a Weighted Selective Naive Bayes Classifier with Non-convex Optimization. 3-17 - Hélène Jaudoin, Pierre Nerzic, Olivier Pivert, Daniel Rocacher:
On Making Skyline Queries Resistant to Outliers. 19-38 - Pierre-Francois Marteau, Sylvie Gibet, Clément Reverdy:
Adaptive Down-Sampling and Dimension Reduction in Time Elastic Kernel Machines for Efficient Recognition of Isolated Gestures. 39-59 - Arnaud Soulet, François Rioult:
Exact and Approximate Minimal Pattern Mining. 61-81
Part II — Quality Measures, Dissimilarities and Ultrametrics
- Rafik Abdesselam, Fatima-Zahra Aazi:
Comparison of Proximity Measures for a Topological Discrimination. 85-99 - Patricia Conde-Céspedes, Jean-François Marcotorchino, Emmanuel Viennet:
Comparison of Linear Modularization Criteria Using the Relational Formalism, an Approach to Easily Identify Resolution Limit. 101-120 - Jean-Charles Lamirel, Pascal Cuxac, Kafil Hajlaoui:
A Novel Approach to Feature Selection Based on Quality Estimation Metrics. 121-140 - Dan A. Simovici, Rosanne Vetro, Kaixun Hua:
Ultrametricity of Dissimilarity Spaces and Its Significance for Data Mining. 141-155
Part III — Semantics, Ontologies, and Social Networks
- Bissan Audeh, Philippe Beaune, Michel Beigbeder:
SMERA: Semantic Mixed Approach for Web Query Expansion and Reformulation. 159-180 - Thomas Dietenbeck, Fakhri Torkhani, Ahlem Othmani, Marco Attene, Jean-Marie Favreau:
Multi-layer Ontologies for Integrated 3D Shape Segmentation and Annotation. 181-206 - Thomas Hecht, Patrice Buche, Juliette Dibie, Liliana Ibanescu, Cassia Trojahn dos Santos:
Ontology Alignment Using Web Linked Ontologies as Background Knowledge. 207-227 - Gianluca Quercini, Nacéra Bennacer, Mohammad Ghufran, Coriane Nana Jipmo:
LIAISON: reconciLIAtion of Individuals Profiles Across SOcial Networks. 229-253 - Erick Stattner, Martine Collard:
Clustering of Links and Clustering of Nodes: Fusion of Knowledge in Social Networks. 255-276
EGC 2017 (Grenoble)
En 2017, cinq prix ont été décernés :
-
- le prix de thèse de l’association EGC est attribué à Luis Galárraga pour sa thèse « Rule Mining in Knowledge Bases »
Ce prix est doté d’un montant de 500 euros offert par l’association EGC - prix EGC-académique :
Françoise Fessant, Tarek Benkhelif, Fabrice Clérot.
Anonymiser des données multidimensionnelles à l’aide du coclustering
Revue des Nouvelles Technologies de l’Information, vol. RNTI-E-33, pp.153-164, 2017.
Ce prix est doté d’un montant de 1500 euros offert par l’association EGC - prix EGC-application :
Harold Vilmart, Jean-Claude Léon, Federico Ulliana.
Extraction et Inférence de Connaissances à partir d’Assemblages Mécaniques Définis par une Représentation CAO 3D
Revue des Nouvelles Technologies de l’Information, vol. RNTI-E-33, pp.21-32, 2017.
Ce prix est doté d’un montant de 1500 euros offert par l’association EGC - prix du défi EGC :
- prix de la meilleure démonstration :
Frank Meyer, Sylvie Tricot, Pascale Kuntz, Wissam Siblini
VIPE : un outil interactif de classification multilabel de messages courts.
Ce prix est doté d’un montant de 500 euros offert par l’association EGC
Yelen Per, Kevin Dalleau, Malika Smail-Tabbone
Prédiction de défaut dans les arbres du parc végétal Grenoblois et préconisations pour les futures plantations
Ce prix est doté d’un montant de 1500 euros offert par l’association EGC - le prix de thèse de l’association EGC est attribué à Luis Galárraga pour sa thèse « Rule Mining in Knowledge Bases »
Défi EGC 2018 : Un défi sous le soleil de l’Île de La Réunion
Pour cette troisième édition du défi EGC (2018), le Laboratoire d’Énergétique, d’Électronique et Procédés (LE2P) et le Laboratoire d’Informatique et de Mathématiques (LIM) de l’Université de La Réunion vous proposent d’analyser des données de flux/rayonnements solaires à l’Île de La Réunion. Ce projet s’inscrit dans le cadre de la politique de développement vers l’autonomie énergétique à l’Île de La Réunion. Un historique de données de capteurs multi-sources sur plusieurs années est mis à votre disposition sous forme de séries temporelles multivariées. Nous suggérons un défi d’analyse exploratoire ouvert sur ces données.
Données
Pour mesurer le rayonnement solaire, quinze stations équipées de capteurs SPN1 (Sunshine Pyranometer) sont réparties sur l’Île de La Réunion. Le rayonnement solaire peut être décomposé en trois flux :
- le flux global FGlobal
- le flux diffus (ou réfléchi) FDiffus
- le flux direct FDirect :
FDirect = FGlobal – FDiffus
Dans le domaine de la recherche sur l’énergie solaire, nous nous intéressons aussi à l’indice de fraction directe kb, défini comme le rapport du flux direct et du flux global, afin de représenter le rayonnement solaire journalier. Intuitivement, lorsque cet indice est proche de 1, le flux direct est proche du flux global et on est en présence d’une journée ensoleillée ; inversement, lorsque l’indice est proche de 0, la journée est nuageuse.

Ainsi, vous disposerez d’environ cinq ans (2012-2016) d’historique de données de flux solaire et de données météorologiques (locales aux capteurs de flux solaire) sous forme de séries temporelles numériques au pas de la minute et par station.
Plus précisément, chaque station SPN1 fournit les sept mesures suivantes :
- FG_avg (en W=m2) : le flux global
- FD_avg (en W=m2) : le flux diffus
- Patm_avg (en hPa) : la pression atmosphérique
- RH_avg (en %) : le taux d’humidité dans l’air
- Text_avg (en °C) : la température extérieure
- WD_MeanUnitVector (en degré) : la direction du vent
- WS_avg (en m/s) : la vitesse du vent
Ci-dessous un exemple de table de données des sept mesures pour une station SPN1 :

Objectifs et tâches du défi
Les défis proposés s’adressent à la communauté de fouille de données et plus précisément aux passionnés de l’analyse de séries temporelles.
Pour le défi ouvert, 2 ans d’historique de données sont mis à disposition de la communauté sous la forme de cinq fichiers disponibles dans un fichier compressé au format ZIP. Chaque fichier contient les données collectées par un des capteurs pendant deux ans.
Bien que ce défi soit ouvert, nous suggérons quelques pistes de travail (non-exhaustives et donc non-restrictives) :
- clustering de séries temporelles journalières (par exemple, la classification de journée type en fonction des données de flux solaires et/ou météorologiques
- analyse des corrélations entre données de flux solaires et données météorologiques ;
- analyses liées à la détection d’anomalies, d’évènements extrêmes, de gestion/complétion de valeurs manquantes ;
- nouvelles visualisations de masses de données de séries temporelles ;
- prédiction du flux global FGlobal ou de l’indice kb de fraction directe à l’horizon H+1, H+2, …, J+1 (à noter qu’un challenge prédictif est dédié à une tâche de prédiction de flux solaire, voir ci-dessous)
- …
Pour ce défi ouvert, l’utilisation de données externes (open data) est autorisée tant qu’elles sont publiquement disponibles.
Soumission
Pour répondre au défi ouvert, vous devez rassembler vos résultats sur ces données dans un article long soumis à la conférence EGC 2018 avec la mention « Défi EGC 2018 » dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip. Les modalités de soumission et d’acceptation sont les mêmes que pour les autres articles, notamment l’anonymat des soumissions.
Présentation
Les papiers acceptés seront présentés lors de la conférence EGC en janvier 2018, très certainement dans une session spéciale « Défi EGC ».
Attribution du prix du défi EGC 2018
Le « défi ouvert » est doté d’un prix de 1500 euros délivré par l’association EGC.
Pour ce défi, un jury se réunira pour attribuer les prix du défi 2018, dans le même esprit que pour les autres prix.
Les critères d’attribution seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.
Restriction de participation
Les membres de l’Université de La Réunion ainsi que les acteurs dans le domaine de la production d’énergie solaire de l’Île de La Réunion ne sont pas autorisés à participer au défi.
Calendrier
Les dates de soumission et de notification seront les mêmes que pour la conférence EGC 2018.
Contact
Vous retrouverez tous les éléments du Défi-EGC sur la page dédiée du site de l’association EGC.
Si vous avez d’autres questions, merci de contacter Arnaud MARTIN en indiquant clairement « Défi EGC 2018 » dans le sujet de votre mail.
EGC 2017 (Grenoble, France)
- Président d’honneur EGC 2017 : Mounia Lalmas – Yahoo Labs London
- Président du comité de programme : Fabien Gandon, Inria
- Président du comité d’organisation : Gilles Bisson, CNRS, Laboratoire LIG, Université Grenoble Alpes (UGA)
Actes Ateliers EGC 2017
Fabien L. Gandon, Gilles Bisson
Site de la conférence EGC 2017
- Pascal Cuxac, Vincent Lemaire, Jean-Charles Lamirel
Fouille de Textes (TextMine)
Site de l’atelier TextMine - Cyril De Runz, Eric Kergosien, Thomas Guyet, Christian Sallaberry
Gestion et Analyse des données Spatiales et Temporelles (GAST)
Site de l’atelier GAST - Cécile Favre, Germain Forestier et Camille Kurtz
Fouille de Données Complexes
site de l’atelier FDC 2017 - Fabien Picarougne, Pierrick Bruneau, Hanane Azzag et David Bihanic
Visualisation d’informations, Interaction, et Fouille de données
Site de l’atelier VIF 2017 - Samira Si-Said Cherfi, Fayçal Hamdi et Virginie Thion
Qualité des Données du Web
Site de l’atelier QLOD 2017 - Daniela Grigori et Zoubida Kedad
Agrégation Contextuelle d’Information
Site de l’atelier CAIR - Vincent Claveau, Xavier Tannier et Laurent Amsaleg
Journalisme Computationnel
Site de l’atelier Journalisme Computationnel - Mohamed Cherif Rahal, Guillaume Bresson et Sébastien Glaser
Analyse et fouille de données pour le véhicule autonome
Site de l’atelier AFDAV
Conférences Invitées EGC 2017
- Mounia Lalmas
“Engage moi” : From retrieval effectiveness, user satisfaction to user engagement - Claudia d’Amato
Machine Learning for the Semantic Web: filling the gaps in Ontology Mining - Freddy Lecue
Deep Dive on Smart Cities by Scaling Reasoning and Interpreting the Semantics of IoT - Dominique Cardon
Une approche sociologique de la place des calculs dans les mondes numériques

