Le blog de Sébastien Heymann
Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
Sébastien Heymann — sam, 01/09/2010 - 16:29

Le nouveau cours d'IC05, dispensé par Fabien Pfaënder dans l'école d'ingénieur UTC, s'est doté d'un nouveau site web. Vous y trouvez les cours en PPT sur l'analyse exploratoire de données (EDA), l'analyse du Web et la sémiologie graphique.
Lien : http://www.utc.fr/~wic05/
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
WebCSTI Rencontres OCIM 2009
Sébastien Heymann — lun, 11/30/2009 - 11:33
Nous étions vendredi dernier à Dijon lors des Rencontres organisées par le nouvel Observatoire de la culture scientifique et technique. Ces slides sont une introduction à l'exploration du Web et aux informations que l'on peut en tirer.
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
Sébastien Heymann — mar, 11/17/2009 - 13:57
Un site web dédié au format de fichier de graphe GEXF vient de voir le jour : http://gexf.net
Il centralise les spécifications, des exemples et un document primer/tutoriel, héberge le toolkit officiel libgexf, ainsi qu'un nouveau projet autour du format : gexf explorer, qui permet de visualiser les fichiers GEXF directement dans un navigateur. Les projets sont en open source (licence MIT), et les spécifications sont aisément extensibles à des besoins particuliers.
Livre blanc WebAtlas : Du Nuage aux Abymes
Sébastien Heymann — ven, 09/04/2009 - 14:43
La première partie du livre blanc de l'association WebAtlas, traitant des dimensions heuristiques et expérimentales ds modèles du Web, est sorti. Franck Ghitalla y interroge les enjeux de cette tâche herculéenne qu'est la production de nouveaux modèles intellectuels du Web intégrant aussi bien les structures et les contenus. Vous pouvez le consulter ci-dessous, ou bien télécharger le PDF.
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Communautés de logiciel libre : un écosystème des motivations
Sébastien Heymann — ven, 07/03/2009 - 10:17
Voici un rapport sur les recherches effectuées en cogntition sociale pour comprendre ce qui pousse des individus à contribuer à des projets de logiciel libre.
Résumé:
Le logiciel libre est un bien public volontairement produit par une communauté d’usagers autonomes. Comment
dès lors expliquer que des individus participent et parviennent à se coordonner sans l’usage d’incitations monétaires ?
Quelles leçons tirer pour une bonne gestion des motivations individuelles ? Par ailleurs, ces projets prennent progressivement
conscience de la nécessité de se construire une identité intégrée dans une stratégie marketing, afin de capter
de nouveaux contributeurs et usagers (ex http ://marketing.openoffice.org). Quels sont alors les risques d’altérer les
motivations des membres actuels ? Comment axer la communication des communautés afin de maximiser les contributions
?
Le web scientifique européen cartographié
Sébastien Heymann — jeu, 06/25/2009 - 11:29
Quels sont les sites internet qui parlent de science ? A quoi ressemble la toile scientifique ? Est-elle dense, éclatée, peuplée d'îlots perdus dans internet ? Quelles sont les interactions entre institutions, associations, médias ou blogs sur les questions de science ?
Le projet européen Eurosis a tenté d'y répondre en menant des études dans 12 pays*. Le résultat est un ensemble de points plus ou moins gros, reliés par des fils de plusieurs couleurs. Chacun de ces points est un acteur possédant un site internet (université, journal, musée...). Chaque fil indique que les pages web d'un nœud pointent vers le nœud voisin. Au centre sont représentés les nœuds majeurs recueillant beaucoup de liens. En périphérie se trouvent les sites internet isolés, peu cités et citant peu. Ces cartes ne mesurent donc pas la popularité ou l'activité d'un site mais les connections existantes ou non entre les différents acteurs des relations science et société. Elles sont une manière de visualiser le tissu, invisible jusqu'à présent, structurant ce domaine.
Il apparaît d’emblée que les pays sont peu liés entre eux, barrière de la langue oblige. Les frontières virtuelles reproduisent donc les frontières géographiques.
Quant aux toiles scientifiques nationales elles n'ont pas toutes la même allure. Le réseau italien est peu dense et très faiblement connecté. Les réseaux finlandais, belges ou français sont bien plus compacts avec bon nombre de nœuds vers lesquels beaucoup de sites pointent. En France, la Cité des Sciences, Agrobiosciences et le portail du ministère de la recherche (science.gouv.fr) font partie des acteurs majeurs selon les critères de cette méthode. Le réseau italien paraît fragile: la suppression de quelques nœuds isolerait d'autres sites les uns des autres. Le Portugal est également peu dense mais plus solide avec donc plus de nœuds jouant le rôle de carrefour vers les autres.
Pour obtenir ces cartes, des responsables ont dressé dans chaque pays la liste de sites estampillés "science et société". Puis des robots explorateurs du web sont partis à la découverte de nouveaux sites à partir de cette première liste, répertoriant les liens entre tous les nœuds. La nouvelle liste a ensuite été validée par les responsables nationaux. Au total 1750 sites ont été recensés dont 200 en France.
Ensuite, des algorithmes de visualisation ont positionné tous les nœuds afin de dresser une carte lisible. Les sites les moins liés aux autres se retrouvent en périphérie et les gros carrefours, souvent cités, au centre. Un code couleur différencie aussi l'origine des sites qui peuvent être des musées, des universités, des médias, des associations...
Les logiciels utilisés pour l'exploration et la visualisation ont été développés par l'association webatlas partenaire du projet, co-fondée par Franck Ghitalla, de l'Institut national de l'information scientifique et technique (Inist), et Mathieu Jacomy, ingénieur de Paris Tech Telecom. L'ensemble a enfin été aggloméré pour proposer une carte d'Europe comprenant ces douze pays. Tous ces résultats viennent d'être mis en ligne (voir le site d'Eurosis).
Cette cartographie révèle que le rôle des associations ou ONG n'est pas identique selon les pays. Absentes d'Italie ou du Portugal, elles sont très structurantes en France ou en Belgique. Autre enseignement, les colonnes vertébrales de ces réseaux sont essentiellement fournies par les universités, les centres de vulgarisation et les médias.
"Ces cartes ne fournissent pas de résultats fermes, résume Mathieu Jacomy. Elles permettent d'observer une situation, de découvrir des propriétés, de faire des hypothèses... Finalement elles posent plus de questions qu'elles n'apportent de réponses".
Parmi ces questions, on peut ainsi s'étonner, en France, de l'absence d'organismes de recherche comme le CEA ou l'Inserm. Ou bien de celle de Greenpeace alors que sur les mêmes terrains on trouve les Amis de la Terre ou France Nature Environnement. La forte présence sur la carte des musées et autres centres de vulgarisation scientifique soulève également des interrogations.
David Larousserie
Sciences-et-Avenir.com
25/06/09
Repris de l'article du NouvelObs
*Arménie, Belgique, Bulgarie, Estonie, Finlande, France, Hongrie, Italie, Montenegro, Pologne, Portugal, République Tchéque.
CPAN-Explorer : la cartographie de l'univers Perl
Sébastien Heymann — ven, 06/12/2009 - 14:30
CPAN-Explorer est un projet de visualisation et d'analyse des relations entre développeurs et entre packages du langage de programmation Perl, très utilisé en administration système et développement web. Porté par RTGI SAS et Julian Bilcke (Gephi), ceux-ci présent leurs travaux aujourd'hui au FPW'09 (slides).
![]()

Lien : http://cpan-explorer.org/
Nouvel article de méthodologie : Entités nommées
Sébastien Heymann — jeu, 06/04/2009 - 12:14
Notre second article de méthodologie concerne les entités nommées, qui traitent des noms d'individus et d'organisations, de lieux, d'expressions temporelles et numériques.
Appliquées à la veille technologique ou à la recherche d'informations en génétique, elles font depuis peu l'objet d'un intérêt particulier pour améliorer les moteurs de recherche en corpus ouvert (Web), devenir des systèmes robustes et performants pour traiter de grandes quantités de documents en flux continue, ou encore automatiser la génération de contenus pour les technologies liées au Web Sémantique.
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
RTGI / Linkfluence lance la Wikiopole
Sébastien Heymann — mer, 05/06/2009 - 13:59
RTGI met sa technologie de cartographie web au profit du Wikio Labs dirigé par Jean Véronis. La carte interactive librement accessible permet d'explorer les blogs du Top 1500 de Wikio.
Vous pouvez sélectionner les seules catégories qui vous intéressent et cliquer sur les points pour faire apparaître les noms des blogs et leur réseau de liens, et également rechercher par url un blog en particulier afin de voir son “réseau d’influence”. Plus un blog reçoit de liens, plus le point qui le représente est grand. (merci presse-citron pour le paragraphe)
Les explications en vidéo par Guilhem Fouetillou, directeur scientifique d'RTGI :
wikiopole par wikio & linkfluence from linkfluence on Vimeo.
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Gephi au Google Summer of Code 2009
Sébastien Heymann — lun, 03/23/2009 - 10:26
Gephi, le logiciel libre d'exploration et de manipulation de réseaux, fait parti des 150 projets choisis par Google pour être organisation mentor au Summer of Code 2009.
Le principe : des étudiants payés par Google travaillent sur un projet open source durant 3 mois sur un sujet défini en accord avec les mentors.
Gephi propose 3 sujets : http://gephi.org/google-summer-of-code-2009/
Si vous souhaitez participer, enregistrez-vous sur le site du GSoC puis suivez ces instructions !
- Vous devez vous identifier ou créer un compte pour écrire des commentaires




Flux général