Dbpedia, web structuré et web sémantique
Par Régis Gaidot le lundi, mai 7 2007, 02:48 - Programmation - Lien permanent
Dbpedia est un projet mené par des chercheurs de deux universités allemandes (Universität Leipzig et Freie Universität Berlin). Son but est d'extraire les informations présentes dans les "infobox" de Wikipedia et de les transformer dans un format structuré/normalisé (RDF) en suivant une ontologie établie pour chaque type d'objet. Les informations extraites sont ensuite stockées afin de pouvoir les interroger par la suite, via le langage de requêtes RDF : SPARQL. A partir de là imaginez les possibilités que ce dernier vous offre ! L'avantage est qu'il y a un grand potentiel pour ce type d'approche mélangeant le coté collaboratif et un traitement visant à récupérer les efforts des différents contributeurs. Dbpedia dispose actuellement d'un ensemble de données de 91 millions de RDF triple, qui ont été extraites à partir de plusieurs langues dont le français, l'anglais et l'allemand.
Pour plus d'informations, je vous invite à lire l'excellent billet de Michael K. Bergman, "Did You Blink? The Structured Web Just Arrived".