Cinquièmes post-actes

Fabrice Guillet, Bruno Pinaud, Gilles Venturini and Djamel Abdelkader Zighed (eds),
« Advances In Knowledge Discovery and Management, Volume 5 »,
Series: Studies in Computational Intelligence,
Vol. 615, 2016, Springer.
ISBN: 978-3-319-23751-0, DOI: 10.1007/978-3-319-23751-0.

About this book

This book is a collection of representative and novel works done in Data Mining, Knowledge Discovery, Clustering and Classification that were originally presented in French at the EGC’2013 (Toulouse, France, January 2013) and EGC’2014 Conferences (Rennes, France, January 2014). These conferences were respectively the 13th and 14th editions of this event, which takes place each year and which is now successful and well-known in the French-speaking community. This community was structured in 2003 by the foundation of the French-speaking EGC society (EGC in French stands for « Extraction et Gestion des Connaissances » and means « Knowledge Discovery and Management », or KDM).

This book is aiming at all researchers interested in these fields, including PhD or MSc students, and researchers from public or private laboratories. It concerns both theoretical and practical aspects of KDM. The book is structured in two parts called « Applications of KDM to real datasets » and « Foundations of KDM ».

Keywords:

Knowledge Discovery, Knowledge Management, Data Mining, Knowledge Engineering, Applications

Table des matières

Part I – Applications of KDM to Real Datasets

  • Romain Guigourès, Marc Boullé and Fabrice Rossi:
    A Study of the Spatio-Temporal Correlations in Mobile Calls Networks. 3-18
  • Mohamed K. El Mahrsi, Romain Guigourès, Fabrice Rossi
    and Marc Boullé:
    Co-Clustering Network-Constrained Trajectory Data. 19-32
  • Natalia Grabar, Pierre Chauveau-Thoumelin and Loïc Dumonet:
    Medical Discourse and Subjectivity. 33-54

Part II — Foundations of KDM

  • Xavier Dolques, Florence Le Ber, Marianne Huchard
    and Clémentine Nebut:
    Relational Concept Analysis for Relational Data Exploration. 57-78
  • Modou Gueye, Talel Abdessalem and Hubert Naacke:
    Dynamic Recommender System: Using Cluster-Based Biases to Improve the Accuracy of the Predictions. 79-104
  • Willy Ugarte, Patrice Boizumault, Samir Loudni, Bruno Crémilleux
    and Alban Lepailleur:
    Mining (Soft-) Skypatterns Using Constraint Programming. 105-136

Défi EGC 2017 : Un défi vert pour Grenoble

Pour cette seconde édition du défi EGC, Big Datext, entreprise Grenobloise spécialisée dans l’analyse prédictive, et la mairie de Grenoble se sont toutes deux impliquées dans la mise en place et la diffusion de la base de données du challenge. En phase avec la politique Open Data de la Ville, visant à diffuser les données publiques de la métropole, Big Datext et les services de la Ville ont souhaité axer le défi sur les données relatives aux espaces verts.

Données

Les données concernent des arbres situés dans la ville de Grenoble et entretenus par les services municipaux. Chaque enregistrement concerne un arbre et comporte des variables décrivant son type, son stade de développement, sa localisation et son environnement, son état et les traitements préconisés.

Objectifs

Le but de ce défi est double.

  • La première tâche consiste à déterminer, à partir des données disponibles, si l’arbre a un défaut et dans l’affirmative lequel.
  • La seconde tâche, plus ouverte, vise à appliquer des techniques d’extraction et de gestion de connaissances afin de mieux connaître l’état du « parc végétal » de Grenoble, de mieux comprendre son évolution et de fournir des préconisations pour faciliter son entretien. Pour cette seconde tâche, les participants peuvent, s’ils le souhaitent, avoir recours à des données externes.

Les participants peuvent traiter au choix l’une des deux tâches ou les deux et, un retour sur la qualité des données (complétude, redondance, etc.) dans un contexte open data sera apprécié.

Soumission

Pour répondre au défi, vous devez rassembler vos résultats sur ces données dans un article long soumis à la conférence EGC’2017 avec la mention « Défi EGC 2017 » dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

Les modalités de soumission et d’acceptation sont les mêmes que pour les autres articles EGC, notamment l’anonymat des soumissions.

De plus les participants au premier défi devront renvoyer un fichier de résultats contenant leur prédiction pour un jeu d’évaluation qui sera fourni ultérieurement.

Les fichiers des données au format CSV ainsi que le descriptif des variables (EGC_description_variables_14042016.xls, classeurs EGC et Prédiction) et les consignes pour la tâche de prédiction sont disponibles sur le site : https://egc2017.imag.fr/defi

Présentation

Les papiers acceptés seront présentés lors de la conférence à Grenoble en janvier 2017, très certainement dans une session spéciale « Défi EGC ».

Prix

Attribution du prix du défi EGC 2017 : 1500 euros

Un jury se réunira pour attribuer le prix du défi EGC 2017, dans le même esprit que pour les autres prix EGC. Les critères d’attribution seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.

Calendrier

Les dates de soumission et de notification seront les mêmes que pour la conférence EGC 2017.

Contact

Vous retrouverez tous les éléments du Défi-EGC sur la page dédiée du site de l’association EGC (http://www.egc.asso.fr/).

Si vous avez d’autres questions, merci de contacter Christine Largeron en indiquant clairement « Défi EGC 2017 » dans le sujet de votre mail.

EGC 2016 (Reims)

En 2016, cinq prix ont été décernés :

  • le prix de thèse de l’association EGC est attribué à Julio Cesar Dos Reis pour sa thèse « Adaptation des Mappings entre Systèmes d’Organisation de la Connaissance du domaine Biomédical  ».
    Ce prix est doté d’un montant de 500 euros offert par l’association EGC
  • prix EGC-académique :
    Arnaud Giacometti et Arnaud Soulet
    Détection de données aberrantes à partir de motifs fréquents sans énumération exhaustive
    Revue des Nouvelles Technologies de l’Information, RNTI E-30, Hermann-Éditions, pages 51-62, 2016.
    Ce prix est doté d’un montant de 1500 euros offert par l’association EGC
  • prix EGC-application :
    Rabah Mazouzi, Rabih Taleb, Lynda Seddiki, Cyril de Runz, Kevin Guelton et Herman Akdag
    Une approche basée sur des données mixtes – mesures et estimations – pour la détection de défaillances d’un système robotisé
    Revue des Nouvelles Technologies de l’Information, RNTI E-30, Hermann-Éditions, pages 183-194, 2016.
    Ce prix est doté d’un montant de 1500 euros offert par l’association EGC
  • prix du défi EGC :
    Adrien Guille, Edmundo-Pavel Soriano-Morales et Ciprian-Octavian Truica
    Topic modeling and hypergraph mining to analyze the EGC conference history
    Revue des Nouvelles Technologies de l’Information, RNTI E-30, Hermann-Éditions, pages 383-394, 2016.
    Ce prix est doté d’un montant de 1500 euros offert par l’association EGC
  • prix de la meilleure démonstration :
    Nicolas Lachiche et Alain Shakour
    Nouveaux algorithmes de fouilles de données relationnelles de clowdflows
    Revue des Nouvelles Technologies de l’Information, RNTI E-30, Hermann-Éditions, pages 499-504, 2016.
    Ce prix est doté d’un montant de 500 euros offert par l’association EGC

Site EGC 2016

Actes Ateliers EGC 2016

Bruno Crémilleux, Cyril de Runz

Site de la conférence EGC 2016

2ème École é-EGC d’hiver sur le thème Pattern Mining

La deuxième Ecole d’Hiver é-EGC, sur le thème « Pattern Mining », est un évènement organisé par l’Association Extraction et Gestion de Connaissances (EGC, http://www.egc.asso.fr/).

Cet évènement s’organise autour de deux principales activités : le 18 et 19 Janvier 2016 de la formation et du 20 janvier au 22 Janvier 2016 la participation à la conférence EGC2016.

Les deux jours de formation ont pour but principal d’offrir aux participants des tutoriaux d’initiation dans ce domaine de recherche, mais également des tutoriaux plus spécifiques présentant les récentes avancées proposant des méthodes et des techniques nouvelles pour la fouille de motifs. Les exposés, de 2h ou 3h, couvriront une large gamme de type de données à fouiller (bases de données classiques, temporelles, séquentielles, flux de données, graphes, etc.), et ils s’intéresseront à traiter le processus de fouille de motifs dans des conditions plus spécifiques : sous contraintes, dans des environnements parallèles, ou en présences de connaissances expert apportées sous forme d’ontologies. De plus, l’Ecole permettra aux participants de découvrir des méthodes de fouille visuelle/visualisation analytique de données.

Défi EGC 2016 : Communauté EGC quelle histoire et quel avenir

 Contexte

L’association EGC lance le premier défi EGC avec comme principe de valoriser votre équipe et vos approches de fouille de données sur des cas concrets. Pour cette première année, les données vont concerner les publications EGC et les objectifs du défi seront ouverts. Nous vous donnons dans cette première annonce les éléments principaux du Défi EGC qui vous permettront de commencer le travail au plus tôt. Des précisions pourront être apportées en cours de route et en fonction de vos interrogations.

Données

Les données concernent les articles publiés à la conférence EGC depuis 2004. Elles sont accessibles à l’adresse suivante :

http://editions-rnti.fr/?m=articles_export (fichier RNTI_articles_export.txt.zip)

Dans ce fichier, il suffit de sélectionner la valeur EGC dans la colonne « booktitle ».

Chaque enregistrement est décrit par 8 champs :

  • series,
  • booktitle,
  • year,
  • title,
  • abstract,
  • author,
  • pdf1page,
  • pdfarticle.

Seuls sont concernés tous les articles ayant EGC comme booktitle. Parmi eux, certains ont seulement le titre et le résumé documentés.

Objectif

Les objectifs de ce premier défi sont volontairement ouverts : surprenez-nous ! Le principe est d’appliquer des techniques d’extraction et de gestion de connaissances afin d’expliquer la structure et l’évolution de l’ensemble des données au fil des éditions (thématiques, communautés, atypiques, …).

Soumission

Pour répondre au défi, vous devez rassembler vos résultats sur ces données dans un article soumis à la conférence EGC’2016, de préférence au format long et avec la mention « Défi EGC 2016 » dans le titre. Le format à utiliser est la dernière version du style LaTeX RNTI :

http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

Présentation

Les papiers acceptés seront présentés lors de la conférence à Reims en janvier 2016, très certainement dans une session spéciale « Défi EGC ».

Evaluation de vos résultats

Après acceptation de l’article à la conférence, une évaluation par un jury d’attribution du prix aura lieu, dans le même esprit que les autres prix EGC. Les critères d’évaluation seront en particulier la pertinence et la qualité de l’approche méthodologique ainsi que l’originalité et l’intérêt des résultats obtenus.

Prix

Le prix du Défi EGC est doté d’un montant de 1500 euros.

Calendrier

Les dates de soumission et de notification seront les mêmes que pour la conférence EGC 2016.

Inscriptions

L’inscription est gratuite et sans engagement mais nécessaire pour des raisons logistiques. Nous vous remercions d’avance de bien vouloir notamment indiquer l’adresse mail valide à laquelle nous pourrons vous faire suivre les informations utiles concernant le défi dans le formulaire accessible à l’adresse suivante :
https://docs.google.com/forms/d/113aijiUy9Yw5zBsVqBeacs28EW0Si5kMQsitFFNTMsw/viewform?usp=send_form

Contact

Si vous avez d’autres questions, merci de contacter Christine Largeron (largeron@univ-st-etienne.fr) en indiquant clairement « Défi EGC 2016 » dans le sujet de votre mail.