• GEPHI
  • LINKFLUENCE
  • MAGELLAN
  • WEBATLAS

Web-mining.fr

  • forum
  • technologies
  • méthodes
  • liens
  • science
Web-mining.fr, le portail francophone en web mining et network science qui héberge vos projets.

Portail de recherche sur les nanotechnologies

Sébastien Heymann — sam, 01/17/2009 - 20:36

L'équipe Magellan a travaillé en collaboration avec WebAtlas sur le domaine des nanotechnologies pour proposer un portail du domaine, ouvert au public.

Il est volontairement simplifié en fonctionnalités, mais permet de donner un aperçu de l'efficacité d'un moteur de recherche à l'échelle d'une communauté.

Vous y trouverez donc un moteur de recherche au sein du corpus, un aggrégateur de flux des sites du corpus, et une cartographie réalisée par WebAtlas. Le crawl a été effectué avec focus, c'est à dire que seules ont été retenues les pages qui parlaient effectivement de nanotechnologies.

Il s'agit encore d'un prototype, qui peut accuser quelques faiblesses, et les retours utilisateurs sont donc bien évidemment bienvenus.

Image

Lien : http://nanotech.magellan-project.com

  • crawling
  • Magellan
  • nanotechnologie
  • search engine
  • Blog de Magellan
  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

WebAtlas.fr de retour

Sébastien Heymann — sam, 01/17/2009 - 20:29

Le site de l'association WebAtlas est de nouveau en ligne, et la refonte est superbe !

N'hésitez pas à parcourir leurs travaux, les notes d'informations ou encore leurs publications scientifiques.

Image

Lien : http://webatlas.fr

  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Les flux RSS du site

Sébastien Heymann — ven, 12/26/2008 - 02:45

Ancien abonné de web-mining.fr, nous flux RSS ont changé !

Vous pouvez supprimer les anciens et vous abonner aux nouveaux :

  • Flux général
  • Flux général des commentaires
  • Flux du Forum

Et vous pouvez désormais vous abonner à des flux spécialisés, comme celui du Support utilisateur du Navicrawler : cliquez sur l'icône de flux en bas à droite de la liste des sujets de discussion pour que votre navigateur web vous propose de l'utiliser ! Une icône devrait aussi être disponible dans la barre d'adresse (ex: Firefox).

Chaque projet technologique dispose, si son porteur le souhaite, d'un flux pour le support mais aussi d'un flux pour le blog du projet, comme celui du Navicrawler. Notez que les blogs ont 2 icônes pour indiquer que vous pouvez vous abonner aux billets mais aussi et seulement aux commentaires postés sur ce blog. Les porteurs de projet apprécieront d'être prévenus sans rien faire ;-)

Enfin les tags du site disposent eux aussi de flux RSS. Par exemple si vous souhaitez connaître les derniers articles, billets de blogs ou sujets de discussion parus dans la catégorie "graphe", il vous suffit d'aller sur la page de ce tag, et de cliquer sur l'icône du flux comme avec les flux des blogs ou des forums !

Si vous avez des questions n'hésitez surtout pas à les poser, nous sommes là pour vous aider.

  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Un portail communautaire

glebourg — jeu, 12/25/2008 - 03:24

Voilà donc quelques temps que nous travaillons sur notre crawler, que nous avons entamé des campagnes d'exploration du web, à la découverte des différents territoires qui le composent. Nous avons pu crawler des communautés, établir les relations qui existent en leur sein, et ces données ont alors pu être utilisées par des organisations comme WebAtlas pour établir des cartographies. Il nous semblait cependant dommage que ces données ne puissent pas permettre d'aller plus loin, et ne puissent pas servir de manière plus interactives aux utilisateurs.

Nous avons donc décidé de créer un prototype de portail communautaire, dont vous pourrez trouver la description ici.

(nd.Rédac : billet reposté depuis web-mining.fr v1)

  • communauté
  • Blog de Magellan
  • Le blog de glebourg
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Linkfluence : voir les dynamiques d'opinion (Orange & iPhone 3G+)

Sébastien Heymann — lun, 12/22/2008 - 02:50

J'étais passé à côté : Linkfluence (RTGI) a mis en ligne l'analyse du buzz autour de l'iPhone 3G+ bridé d'Orange.
Vous pouvez accéder à la carte interactive de suivi de la propagation virale de cette controverse à travers le réseau des sites francophones du high-tech. Appuyez sur lecture, faites des pauses, zoomez et découvrez par vous-même les dynamiques d'opinion au sein du web social !

Lien : carte interactive et timeline
Billet de blog Linkflence
Télécharger le livre blanc complet

  • Le blog de Sébastien Heymann
  • 1 commentaire

Google doit-il disparaître ?

Sébastien Heymann — lun, 12/22/2008 - 02:47

J'ai apprécié ce billet relayé sur l'excellent blog Affordance et je me permets donc de le traduire ici.

Why Google must die ?

Intéressant point de vue. . .

"Pourquoi Google doit mourir" (en anglais) par John Dvorak, PC Magazine (17 Nov)

J'en parle de puis des années. Trop de gens dans les bibliothèques disent qu'ils veulent que tous leurs catalogues accessibles en ligne au public, leurs systèmes de recherche professionnels, et les systèmes de recherche de leurs sites web, puissent être "comme Google". Bien sûr certains parmi les plus irresponsables implémentent effectivement les "yellow" ou "blue boxes" dans leurs institutions ou communautés ! (NdT : serveurs Google qu'on peut acheter pour mettre "chez soi") J'ai entendu dire qu'au moins quatre Etats américains on délégué à Google la gestion des serveurs de leur portail en ligne.

Dois-je abandonner, lever le drapeau blanc et me rendre à Google ? A ceci je réponds :

Entendu, alors qu'est-ce qu'il vaudrait mieux que j'implémente d'abord :

1. Est-ce que je dois manipuler les résultats des recherches des utilisateurs de la bibliothèque pour coller aux besoins des publicitaires qui payent pour se positionner ?

2. Ou est-ce que je dois pister et analyser les recherches des utilisateurs pour offrir différents résultats ou publicités à partir de leurs recherches privées ?

3. Ou encore, est-ce que je dois ouvrir le système d'accès public et en ligne à mon catalogue, ainsi que les données des recherches, à des "optimisations techniques" qui autorisent certains groupes d'intérêts spécifiques, tels que des intérêts commerciaux, politiques (comme nous l'avons vu cette année avec les recherches géolocalisées pendant les élections), et même des organisations racistes (comme dans l'exemple classique MLK), ou qui que ce soit d'autre, à modifier les résultats ?

4. Est-ce que je dois géolocaliser toutes les recherches, en utilisant Google Maps, qui proviennent des lycées, universités ou grandes écoles dans le but ultime de faire payer plus pour les clics qui viennent des plus jeunes chercheurs ? Dois-je construire des services comme Google Scholar pour attirer des jeunes consommateurs de publicité et encourager les bibliothécaires et le personnel éducatif à faire de même ?

5. Est-ce que je dois autoriser l'algorithme à court-circuiter les requêtes booléennes des utilisateurs finaux si ça va à l'encontre de l'intérêt d'un publicitaire ?

6. "Le Mal", selon le CEO de Google Eric Schmidt, "est ce que Sergey
désigne comme étant Le Mal" (NdT : Sergey Brin, fondateur de Google).(Wired). Est-ce là une personne à laquelle vous voulez confier des décisions qui portent sur vos valeurs personnelles et celles de vos institutions ?

Je reste abasourdi du nombre d'employés de bibliothèque qui sont inconscients ou qui préfèrent ignorer la façon précise dont Google génère des milliards de dollars de profits à lui tout seul chaque année. Il s'agit de se plier aux demandes de ses principaux clients, et les principaux clients de Google ne sont pas les gens qui profitent des bibliothèques (ni ceux qui font des recherche en général). Il s'agit de réaliser les objectifs des publicitaires et d'augmenter vos revenus pour rencontrer la demande de ce vortex qu'est le New York Stock Exchange.

Il est grand temps que les bibliothèques se demandent ce qui crée un bon résultat de recherche, c'est-à-dire un résultat qui rencontre les besoins des utilisateurs finaux. C'est un questionnement qui commence par "pourquoi" et "comment", et non par les simples "qui, quoi et où" de Google. Est-ce que ces résultats peuvent être aussi simples que Google ? Est-ce qu'ils doivent être aussi simples que Google ? Est-ce qu'on peut se dire que la compétence et la capacité d'apprendre doivent être opposées à la simplicité de transactions informationnelles ?

Les bibliothèques doivent se frayer une troisième voie - celle qui ne sert pas les intérêts des publicitaires, politiciens, groupes spéciaux d'intérêt etc. - celle qui accompagne les gens dans des environnements et des communautés où ils peuvent apprendre.

Et elles doivent encourager les utilisateurs à être conscients des algorithmes derrière Google et les autres moteurs de recherche.

Et elles doivent trouver une voix pour parler à leurs institutions de tutelle et à leur communauté de leur propre rôle.

Sinon...

Stephen

Traduit (à la louche) par Mathieu Jacomy

  • Google
  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Atelier "TIC-Migrations" - Comment interpréter les graphes

Sébastien Heymann — lun, 12/22/2008 - 02:33

L'atelier méthodologique annuel du programme TIC-Migrations (FMSH) sera cette année consacré à l’interprétation des graphes.

Les questionnements, interventions et débats pourront porter sur :

  • Quels sont les pièges d’un graphe ?
  • Quel est la fonction du graphe dans une enquête de terrain, comment confronter ses données ?
  • Comment lire une hiérarchie dans un graphe ?
  • Quels sont les limites du graphe ?
  • Comment choisir et paramétrer l’algorithme de spatialisation ?

Nous attendons vos suggestions sur ces questionnements ainsi que sur les interventions et intervenants.

Atelier prévu pour fin mars 2009
Programme « TIC-Migrations » (FMSH)

  • graphe
  • TIC-Migrations
  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Un nouveau départ pour web-mining.fr

Sébastien Heymann — jeu, 12/18/2008 - 16:55

Web-mining.fr est mort. Vive web-mining.fr v2 !

Notre serveur a décidé vendredi 12 de ne pas passer Noël, ce pourquoi le site n'était plus accessible depuis. Nous vous présentons toutes nos excuses pour le contretemps occasionné et à venir, car nous avons eu la joie de constater que nos backups étaient corrompus. La totale en période de fin de semestre d'étude...

Qu'à cela ne tienne, nous repartons d'un meilleur pied avec un serveur plus robuste, de meilleurs gardes-fous, et surtout nous en profitons pour refondre complètement la plateforme avec :

  • un espace projets pour héberger vos projets
  • une interface plus clair et plus aérée, en un mot : hype
  • des sections mieux séparées : technologies, méthodes, science, art, communauté et liens
  • des facilités de rédaction de pages pour les contributeurs du site (Drupal rocks !)
  • un forum mieux intégré
  • la soumission de vos articles dans le formulaire de contact
  • des cours en ligne en français et en anglais dans la section méthode
  • la tribune scientifique animée par l'équipe de chercheurs et d'ingénieurs de l'association WebAtlas
  • un rapprochement officiel avec le projet Gephi, particulièrement pour la production de cartographies des territoires numériques

Et quelques améliorations mineures :

  • l'export des pages en PDF et formatées pour l'imprimante
  • le partage des articles et billets de blog avec le widget AddThis.com

Nous manquons encore de contenu suite à la perte des données, cependant nous sommes confiant dans la capacité de l'équipe à trouver la motivation pour animer le forum et produire rapidement des articles de qualité !

  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires
  • « premier
  • ‹ précédent
  • 1
  • 2
  • 3

Syndiquer le contenu Syndiquer le contenu

Connexion utilisateur

  • Créer un nouveau compte
  • Demander un nouveau mot de passe

Tags

blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia
plus de tags

Recherche

Actu blog

  • Introduction de Gephi 0.7 en vidéo
  • Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
  • DevWeb, moteur de recherche spécialisé pour les développeurs
  • WebCSTI Rencontres OCIM 2009
  • gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
  • Konodeo - Les Maîtres de l'Arctique
  • Konodeo - Portail de démonstration Arctique
  • Livre blanc WebAtlas : Du Nuage aux Abymes
  • Communautés de logiciel libre : un écosystème des motivations
  • Le web scientifique européen cartographié
en savoir plus

Actu forum

  • jeu de données
  • compatibilité avec firefox > 3.5
  • Une autre base de données orientée graphe
  • Détection de communautés dans les réseaux sociaux
  • libellés
en savoir plus

Partenaires


WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web.


Linkfluence, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis.


Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.

Syndication

  • Flux général
  • Flux général des commentaires
  • Flux du Forum

Network Sciences, web mining, data mining, text mining, crawling, scrapping, graph viz, data viz, small worlds, clustering, social networks, social network analysis, link analysis, maps, cartographie, indexation, moteurs de recherche, Firefox, Web 2.0

Flux RSS

Syndiquer le contenu
sitemap
  • forum
  • technologies
  • méthodes
  • liens
  • science