Actividad W123

Este es un ejercicio para introducirte en uno de los recursos mencionados en la lección previa. De forma muy, muy resumida, DBpedia es el resultado de extraer información de Wikipedia y estructurarla en forma de entidades, con sus propiedades, que se relacionan entre sí. La forma de detectar esas relacionas son los propios enlaces dentro de las páginas html. La forma de consultar esta base de datos es utilizar el lenguaje SPARQL.

Busca información en DBpedia (http://es.dbpedia.org/). Hay algunos ejemplos de uso de SPARQL para consultarla. Tendrás que estudiar varios de ellos hasta conseguir una expresión que funcione en Virtuoso (http://es.dbpedia.org/sparql). Concretamente queremos modificar la última de todas y preguntar ¿cuántos músicos cubanos de jazz latino hay?

Algunas pistas:

  • una de las propiedades de los músicos es "dbpedia-owl:hometown", ciudad o lugar de nacimiento
  • el resultado anterior tiene como propiedad "dbpedia-owl:country", el país al que pertenece ese lugar
  • "select *" muestra los valores de todas las variables de la consulta y "select count(*)" cuántos son los resultados mostrados, la cantidad de filas.

 

Comencemos por

PREFIX dcterms: <http://purl.org/dc/terms/>
select * where{
 ?musico dcterms:subject <http://es.dbpedia.org/resource/Categoría:Músicos_de_jazz_latino> .
}

 

Esos son todos los músicos categorizados como de jazz latino en la wikipedia en español. Si añadimos

 ?musico  dbpedia-owl:hometown  ?lugar .

 

conseguimos la información de su lugar de nacimiento.Date cuenta de que tenemos varias filas para cada artista, tantas como datos hay almacenados.

Algo de lo que te darás cuenta es de que Bebo Valdés ha desaparecido de la lista. Simplemente, no tiene asociada esa propiedad. Entre que las páginas de Wikipedia en uno y otro idioma no tienen la misma información necesariamente —Bebo en inglés y en inglés— el proceso de extracción detecta y rellena propiedades en función de lo que es capaz. Consulta la información de la que dispone DBpedia sobre Bebo y Chucho Valdés y comprueba que no tienen las mismas propiedades.

Ahora vamos a añadir el país que está relacionado con el lugar anterior

 ?lugar    dbpedia-owl:country  ?pais .

 

Por último, filtramos para encontrar 'Cuba' usando FILTER.

Ahora ya estás en condiciones de responder a nuestra pregunta.

De manera similar a como se ha explicado , ensambla una consulta completa y dinos ¿cuántos músicos cubanos de jazz latino hay? La consulta debe devolverte una cantidad numérica que será más o menos discutible según se interpreten los resultados. Recuerda, así mismo, que estos son los datos almacenados en DBpedia y difícilmente serán completos.