• GEPHI
  • LINKFLUENCE
  • MAGELLAN
  • WEBATLAS

Web-mining.fr

  • forum
  • technologies
  • méthodes
  • liens
  • science
Accueil

Le blog de glebourg

DevWeb, moteur de recherche spécialisé pour les développeurs

glebourg — lun, 12/14/2009 - 10:35

Profitant de sa technologie de recherche verticale, Konodeo est très fière de mettre à la disposition des développeurs un portail en libre accès permettant à la fois de suivre l'actualité et d'effectuer des recherches dans le domaine du développement informatique.

Grâce à une catégorisation pointue des sites, les développeurs sont en mesure d'affiner leurs recherches à l'aide de filtres stratégiques :

  • langage de programmation
  • type de ressource (documentation, tutorial, site collaboratif)
  • langue (anglais, français)

La puissance de cette capacité d'affinage est alliée à un évitement des ambiguïtés : dans DevWeb, un programme n'a rien à voir avec la télévision, une bibliothèque est forcément de fonctions, et un moteur n'est pas de voiture : c'est là la grande force d'un moteur de recherche vertical, spécialisé dans un domaine, par rapport à un moteur de recherche généraliste.

En plus de ces caractéristiques, DevWeb propose de nombreuses fonctionnalités :

  • nuage de mots général de la requête permettant de l'affiner
  • vignette du site pour chaque résultat de recherche
  • nuage de mots pour chaque résultat de recherche
  • recherche dans l'actualité

DevWeb est par nature le compagnon parfait de tous les développeurs, qui leur permettra de chercher de l'information avec une précision nouvelle.

Rendez-vous sur DevWeb pour tester notre moteur !

Et plus d'information à propos de Konodeo sur le site de l'entreprise.

  • développeurs
  • Moteur de recherche
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Konodeo - Les Maîtres de l'Arctique

glebourg — lun, 10/26/2009 - 16:30

Bienvenue en Arctique

Nous vous proposions il y a quelques temps de vous rendre sur notre portail de démonstration, dédié à la thématique de l'Arctique. Si notre portail est un moyen efficace de visualiser une partie de nos données, la face cachée de l'iceberg reste à explorer...

... et nous avons entamé aujourd'hui cette exploration, en nous attachant à étudier les noms de personnes que notre crawler a détecté sur les pages du web Arctique. Dans cette première et courte analyse, vous apprendrez quels sont les maîtres de l'Arctique, dans le monde scientifique et la société civile.

Impatient de savoir qui est en mesure de rivaliser avec l'ours polaire ? Rendez-vous sur notre blog !

  • Arctique
  • Corpus
  • Personnalités
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Konodeo - Portail de démonstration Arctique

glebourg — mar, 10/06/2009 - 08:20

Toute l'équipe de Konodeo est aujourd'hui très fière de vous présenter son portail de démonstration de ses technologies sur la thématique de l'Arctique. En utilisant cette démo, vous serez à même de chercher de l'information dans notre moteur vertical, et de suivre l'actualité de l'Arctique grâce à l'agrégation de flux RSS et de comptes Twitter. Vous pourrez également contribuer depuis le tableau de bord, en ajoutant des ressources telles que des liens ou des documents.

Vous êtes pressés de tester ?

Rendez-vous sur la page dédiée à notre démo.

Un moteur de recherche vertical

Qu'est-ce qu'un moteur de recherche vertical ? Comparons le web à un univers, en constante expansion. Au sein de cette univers, on peut trouver diverses galaxies : celle des jeux vidéo, de la cuisine, ou de l'écologie par exemple. Un moteur de recherche classique fonctionne ambitieusement en cherchant ses informations sur toutes ces galaxies à la fois, nous privant ainsi de contexte. Chaque moteur Konodeo, à l'opposé, ne se consacre qu'à une galaxie, offrant un véritable contexte aux requêtes effectuées, et donc une meilleure finesse de résultats.

Prenons un exemple simple : glace. Sur Google, vous trouverez un florilège de résultats sur les crèmes glacées, les sorbets ou le Hockey sur glace.
Sur notre portail Arctique, vous trouverez des informations sur la glace en tant qu'eau solide, ou sur les carottes de glace.

Pas encore convaincu ? Notre moteur de recherche vous permet également de retrouver l'information dans les flux RSS, les tweets, et les ressources internes apportées par les utilisateurs du portail.

Une manière originale de présenter des résultats de recherche

En un coup d'oeil, vous avez un aperçu des thèmes liés à votre recherche grâce au nuage de mots dynamique. Les résultats de type page web, billet RSS ou personne vous permettent de visualiser un graphe de relations : quels sont les sites reliés à votre résultat, ou bien quelles sont les personnes co-citées avec celle que vous venez de trouver. En quelques clics, vous aurez une idée claire des autorités du domaine, et des relations entretenues avec d'autres entités.

Pour couronner le tout, vous pouvez affiner les résultats en choisissant des catégories ou des types de documents, et affiner votre recherche en utilisant le nuage de mots.

Flux d'information

À partir de flux RSS ou de comptes Twitter que les utilisateurs vont ajouter dans le module dédié, le robot agrégateur Konodeo indexe les billets toutes les heures pour donner un aperçu dynamique du corpus.
Le robot est également en mesure de détecter les entités nommées de type “personne”, et de les insérer dans l’index pour les rendre disponibles dans le module de recherche.
Les flux sont à la fois disponibles dans le moteur principal et dans un module à part.

Ressources internes

Des modules permettent aux utilisateurs du portail de partager des ressources telles que des liens ou des documents. Ces derniers sont alors rendus immédiatement disponibles dans moteur de recherche, et sont consultables depuis le tableau de bord par les autres utilisateurs.

Utilisation

Les technologies Konodeo, construites de façon modulaire, sont disponibles sous d'autres formes qu'un portail complet. Nous pouvons intégrer des modules dans des plate-formes existantes, ou simplement fournir un accès à nos services et nos données via une API Web. N'hésitez pas à vous rendre sur notre site, http://www.konodeo.fr pour plus d'information.

Logo Konodeo
  • 2 commentaires

Portail d'information sur Hadopi

glebourg — lun, 05/04/2009 - 14:33

Hadopithèque

Démarche

Alors que la contestation enfle en défaveur du projet de loi Hadopi, l'association Projet Magellan a pris l'initiative de profiter de son expertise du web pour proposer à ses concitoyens une véritable bibliothèque numérique autour de la polémique. Afin que les internautes puissent bénéficier d'une information riche et ciblée, un portail a été mis à leur disposition sur http://hadopi.magellan-project.com.

Territoire Numérique

Le web est un territoire, qu'il est difficile d'appréhender. Pour faciliter l'approche de l'internaute, le Projet Magellan a sélectionné un sous-espace du web correspondant aux sites parlant de la loi HADOPI, et les a indexés pour proposer au grand public un moteur de recherche thématisé. Les recherches effectuées le sont donc dans un contexte précis, augmentant considérablement la pertinence des résultats. La dynamicité de l'information est également prise en compte à travers l'aggrégation des flux d'informations des sites majeurs du domaine, permettant des recherches à la fois sur du fond et sur l'actualité.

Dimension collaborative

Partage

Le portail Hadopithèque met également l'accent sur la dimension collaborative, permettant aux internautes de partager leurs découvertes et leurs créations pour mieux appréhender le débat. Ils ont ainsi la possibilité de mettre en ligne des liens vers des articles dignes d'intérêt, des documents de tous types, et peuvent ajouter des fiches au sujet des personnalités gravitant autour de la polémique.

Responsabilité

Nous avons fait le choix d'offrir aux internautes un système totalement ouvert et auto-organisé, en tablant sur leur responsabilité et le respect qu'ils auront pour le portail mis à leur disposition. Tout visiteur est donc en capacité non seulement de s'informer, mais aussi de partager des bribes de savoir avec le reste de la communauté.

Un outil complet

En prenant en compte toutes les dimensions de l'information du web, que ce soit les articles de fonds, les pages d'actualités, ou les contributions des citoyens, le portail HADOPI de l'association Projet Magellan met à disposition du grand public un portail documentaire novateur et d'une pertinence inégalée.

  • communauté
  • Hadopi
  • Portail
  • Blog de Magellan
  • 1 commentaire

Un portail communautaire

glebourg — jeu, 12/25/2008 - 03:24

Voilà donc quelques temps que nous travaillons sur notre crawler, que nous avons entamé des campagnes d'exploration du web, à la découverte des différents territoires qui le composent. Nous avons pu crawler des communautés, établir les relations qui existent en leur sein, et ces données ont alors pu être utilisées par des organisations comme WebAtlas pour établir des cartographies. Il nous semblait cependant dommage que ces données ne puissent pas permettre d'aller plus loin, et ne puissent pas servir de manière plus interactives aux utilisateurs.

Nous avons donc décidé de créer un prototype de portail communautaire, dont vous pourrez trouver la description ici.

(nd.Rédac : billet reposté depuis web-mining.fr v1)

  • communauté
  • Blog de Magellan
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Syndiquer le contenu

Connexion utilisateur

  • Créer un nouveau compte
  • Demander un nouveau mot de passe

Tags

blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia
plus de tags

Recherche

Actu blog

  • Introduction de Gephi 0.7 en vidéo
  • Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
  • DevWeb, moteur de recherche spécialisé pour les développeurs
  • WebCSTI Rencontres OCIM 2009
  • gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
  • Konodeo - Les Maîtres de l'Arctique
  • Konodeo - Portail de démonstration Arctique
  • Livre blanc WebAtlas : Du Nuage aux Abymes
  • Communautés de logiciel libre : un écosystème des motivations
  • Le web scientifique européen cartographié
en savoir plus

Actu forum

  • jeu de données
  • compatibilité avec firefox > 3.5
  • Une autre base de données orientée graphe
  • Détection de communautés dans les réseaux sociaux
  • libellés
en savoir plus

Partenaires


WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web.


Linkfluence, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis.


Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.

Syndication

  • Flux général
  • Flux général des commentaires
  • Flux du Forum

Network Sciences, web mining, data mining, text mining, crawling, scrapping, graph viz, data viz, small worlds, clustering, social networks, social network analysis, link analysis, maps, cartographie, indexation, moteurs de recherche, Firefox, Web 2.0

Flux RSS

Syndiquer le contenu
sitemap
  • forum
  • technologies
  • méthodes
  • liens
  • science