Identifiant :Mot de passe :
Outils

Cette page recense différents outils et logiciels relatifs à l'extraction et la gestion des connaissances.

3D4J : librairie de visualisation des objets dans un espace 3D (M. Exbrayat, L. Martin)

3D4J est une librairie Java permettant de visualiser des objets dans un espace 3D.
Il suffit de fournir un tableau contenant les coordonnées 3D d'une liste d'objets pour voir ceux-ci s'afficher dans une fenêtre graphique, sous la forme de sphères placées aux coordonnées fournies.
Entre autres applications, 3D4J peut être utilisé dans un processus d'apprentissage automatique ou d'aide à la décision afin, par exemple, de visualiser les résultats d'une réduction de dimension, d'une classification supervisée ou non.
Cliquez ici pour accéder au site officiel »

Arval : Association Rule VALidation (L. Jaffrelot, J.G. Limbourg, F. Trouvé, E. Popovici, F. Guillet)

Arval est atelier logiciel spécialisé dans le traitement des règles d'association extraites dans des BDD volumineuses. C'est un outil pour valider les règles. Il réalise l'import/export des jeux de données multi-format contenant des règles d'association obtenues par un algorithme de fouille de données, et calcule des indices de qualité objectifs sur ces règles d'association.
Cliquez ici pour accéder au site officiel »

SODAS

Il s'agit d'un logiciel prototype public (accessible à www.cisia.com) apte a analyser des données symboliques. Il est issu du projet de EUROSTAT appelé SODAS comme le logiciel qui en est issu pour fournir un cadre aux différentes avancées récentes et futures du domaine. Son idée générale est la suivante : à partir d'une base de données, construire un tableau de données symboliques, parfois muni de règles et de taxonomies, dans le but de décrire des concepts résumant un vaste ensemble de données, analyser ensuite ce tableau pour en extraire des connaissances par des méthodes d'analyse de données symboliques.
Cliquez ici pour accéder au site officiel »

TANAGRA : un logiciel gratuit pour l'enseignement et la recherche (Ricco Rakotomalala)

TANAGRA est un logiciel gratuit « open source » à destination de l'enseignement et de la recherche. Il respecte les standards d'interface visuelle des logiciels commerciaux. Son architecture ouverte permet aux chercheurs d'introduire facilement des variantes voire d'ajouter de nouvelles méthodes d'exploration des données.
Cliquez ici pour accéder au site officiel »

TraMineR : librairie d’analyse de séquences (Alexis Gabadinho et al.)

TraMineR est une librairie R pour la fouille, la description et la visualisation de séquences d’états ou d’événements, et plus généralement de données séquentielles discrètes. Il a été conçu pour l’analyse de données biographiques longitudinales en sciences sociales, telles que les données décrivant des carrières professionnelles ou des trajectoires de vie familiales. Les fonctions et graphiques offerts s’appliquent cependant à toutes sortes de séquences chronologiques ou non, comme des textes ou des séquences ADN.

  • Gestion de données longitudinales et conversion entre différents formats de séquences ;
  • Représentations graphiques de séquences (distributions transversales des états, fréquences des séquences, index plot, etc.) ;
  • Centro-type and mesure de dispersion d’un ensemble de séquences ;
  • Caractéristiques longitudinales individuelles de séquences (longueur, temps dans chaque état, entropie longitudinale, turbulence, et autres mesures de complexité de séquence) ;
  • Séquence des caractéristiques transversales par position (distribution transversale des états, entropies transversales, état modal par position) ;
  • Autres caractéristiques agrégées (taux de transition, durée moyenne par état, fréquence des séquences) ;
  • Dissimilarités entre paires de séquences (Optimal matching, plus longue sous-séquence commune, Hamming, Dynamic Hamming, multicanal, etc.) ;
  • Analyse de type ANOVA de séquences et ANOVA arborescente à partir de dissimilarités ;
  • Extraction de sous-séquences fréquentes d’événements ;
  • Identification des sous-séquences d’événements les plus discriminantes ;
  • Règles d’association entre sous-séquences.

Cliquez ici pour accéder au site officiel »

EXIT (Thomas Heitz, Mathieu Roche, Yves Kodratoff)

EXIT est capable d'aider un expert à extraire des termes qu'il trouve pertinents dans des textes de spécialité. Pour cela, différentes mesures statistiques et de nombreuses options d'extraction sont disponibles.
Pour plus de renseignements sur le logiciel EXIT :

SAS Enterprise Miner

Pour le Data Mining, SAS® Enterprise Miner traite notamment :

    Les techniques descriptives : Segmentation (« clustering »), Recherche d'associations (séquences), Algorithmes génétiques (SAS/OR®), Etc.
  • Les techniques prédictives : Régressions, Arbres de décision, Réseaux neuronaux, SVM, Raisonnement à base de cas, Etc.

SAS, c'est aussi :

  • Le Text Mining : SAS® Text Miner,
  • La recherche opérationnelle : SAS/OR®,
  • Le stockage de grosses volumétries (SPDE - SPDS),
  • Les cubes multidimensionnels, Etc.

Contact : Département Académique de SAS, en charge des Etablissements d'Enseignement Supérieur : Grégoire de Lassence
Ingénieur Consultant Académique
Domaine de Grégy - BP5 - 77166 Grégy sur Yerres
Tél : +33 1 60 62 12 19
www.sas.com/france/academic
SAS... The Power to Know
Documentation technique en ligne »
Cliquez ici pour accéder au site officiel »

Autres logiciels (en attendant des informations complémentaires de la part des auteurs)...

  • ETIQ : Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité (Ahmed Amrani, Jérome Azé, Yves Kodratoff)
  • CHIC : traitement de données avec l'analyse implicative (Raphaël Couturier, Régis Gras)
  • SEQTREE : un outil de fouille de données séquentielles par visualisation (Christine Largeron)
  • ADS : Arbre de Décision Spatial (Nadjim Chelghoum, Karine Zeitouni)
  • HERBS (Benoit Vaillant)
Agenda
Septembre 2010
L
M
M
J
V
S
D
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
25
26
27
28
29
30
1
2
3
Les ateliers constituent des groupes de travail et de réflexion autour d'une thématique bien délimitée et complémentaire de la conférence. Des thèmes cibles ou des approches pluridisciplinaires en synergie avec l'extraction de connaissances et la gestion de connaissances sont souhaités. Ils pourront durer la journée complète ou seulement une demi-journée. (Date limite de soumission des ateliers : le 15 octobre 2010.)
La 11ème conférence francophone sur l'Extraction et la Gestion des Connaissances (EGC 2011) se déroulera du 25 au 28 janvier 2011 à Brest (France).
Le compte rendu de la conférence EGC 2010 va paraître dans la prochaine édition de la revue ACM SIGKDD Explorations, volume 12.
L'association EGC vient d'accorder son parrainage scientifique à l'atelier Workshop on the Theory of Belief Functions qui se déroulera du 1er au 2 avril à Brest (France). L'associatoon EGC prendra en charge des inscriptions à cet atelier pour des doctorants (hors laboratoire organisateur), à hauteur de 500 euro cumulés.
À l'initiative du ministère de l'Enseignement supérieur et de la Recherche, l'Agence Nationale de la Recherche met en place un espace dédié aux rencontres entre les besoins des entreprises en matière de recherche & développement et l'offre de compétences des laboratoires publics.
Osmar Zaiane, de l'Université d'Alberta (Canada), propose une classification internationale régulièrement mise à jour des conférences en fouille de données sur son site.
Lancement du programme blanc et du programme jeunes chercheuses et jeunes chercheurs de l'ANR . Date limite de proposition fixée au 12 janvier 2010 pour ces deux programmes.
The next Compstat meeting will take place in Paris, august 22- august 27, in the premises of Conservatoire National des Arts et Métiers (CNAM), located in the heart of Paris.
Signature d'un accord de coopération entre la SFDS et EGC en date du 16 avril 2009.
é-EGC : Ecole d'hiver sur le thème « Apprentissage Statistique et Data Mining »
du 1 au 5 Février 2010 - Hammamet, Tunisie
http://www-lipn.univ-paris13.fr/~bennani/e-egc/
©2010 EGC