Archive

Archive for July, 2006

Slicing and dicing web data with Tabulator

July 26th, 2006

There is a new version 07 of the Tabulator out. This is the generic data browser which lets you do useful things with your RDF data the moment it's on the web.

It works by exploring the web of relationship between things, loading more data from the web as you go. Then, if you find a pattern of information you are interested in, it will search for all occurrences of that pattern and display them in tables, maps, calendars, and so on.

In the same session, you can explore, say, some geocoded photos taken from on a trip with a GPS, outline view of trip data and then separately explore where in the world the tabulator developers are based. outline view of trip data Then, you can project both datasets onto the same map. outline view of trip data Or onto the same calendar, for data with a time component. This shows the cross-domain power of the semantic web.

This means you can correlate data from completely different domains. Think of all the different mash-ups people have made for putting things like friends houses, photos, or coffee shops on the web. Each a different mash-up for a different data source.

For data in RDF (or any XML with a GRDDL profile), though, then you don't have to program anything. You can just explore it and map it. And you can map many different data sources at the same time.

Oh, and for developers, the core of the tabulator is an open source RDF library with a complete tested RDF/XML parser, a store which smushes on owl:sameAs and owl:[Inverse]FunctionalProperty, and web crawling query engine supporting basic SPARQL. Enjoy.

Uncategorized , , , , , ,

Tabulator: un navegador para la Web Semántica - Parte I

July 17th, 2006

¿De manos de quién más sino el mismo Tim Berners-Lee podía surgir un prototipo de navegador para la Web Semántica?

Con el creciente desarrollo de la web los usuarios nos vimos beneficiados por la segunda Guerra de Navegadores, donde, en una opinión plenamente personal, se destacan principalmente Firefox y Opera. Si bien sus capacidades son por todos ampliamente conocidas, han sido diseñados para la web actual y, a pesar de contar con algunas herramientas, no se adaptan correctamente a la Web Semántica en su instalación más simple. Tal vez por esta razón el padre de la WWW, Tim Berners-Lee desarrolló una página que, utilizando AJAX y los conceptos de la Web Semántica, nos proporciona un prototipo de cómo podría ser un navegador para la WS: Tabulator.

Antes de continuar, y debido a que es mucho más interesante ir siguiendo su funcionamiento a lo largo del articulo, veamos la compatibilidad con los diversos navegadores disponibles:

  • Firefox: único navegador con el que se ha probado en su totalidad. Si bien hay que realizar un ajuste de las reglas de seguridad del navegador para navegar recursos remotos, las mismas no transforman al sistema en inseguro.
  • Opera: no ha sido probada plenamente, y no funciona con recursos remotos, por lo que se desarrolló un widget para Opera 9.
  • Safari: presenta errores extraños, por lo que no recomiendo que lo utilicen, al menos, no de momento.
  • Internet Explorer: no funciona en este navegador, aunque están viendo el por qué. No se si ha sido probado con la versión 7.0, aunque de todos modos no lo recomiendo.

Pasemos ahora a la descripción de lo que podemos hacer con Tabulator. Para comenzar, digamos que es un navegador particular, en el sentido de que navega cosas y no documentos. Por supuesto que algunas de éstas cosas son documentos, pero Tabulator primero los considera una cosa y luego un documento. Es importante hacer esta distinción, dado que hasta el momento todos los navegadores solo navegan documentos: una página web, una imagen.

Por otra parte, Tabulator navega por estos recursos de manera escalable, es decir, no solo permite navegar por más de una cosa por vez, sino que, además, no es necesario cargar en memoria y luego navegar toda una base de conocimiento en RDF. Esto se ajusta a la perfección a una de las ideas de la WS, que es poder definir información parcialmente incompleta, e ir tomando la información complementaria a medida que la necesitamos. Para esto utiliza un protocolo llamado protocolo de migajas de pan.

Protocolo de Migajas de Pan

Un protocolo de migajas de pan es aquel en el cual la información se deja incompleta para luego ser incrementada, dejando un enlace a la siguiente migaja. Cualquier similitud con Hansel & Gretel, no es pura coincidencia. Si el proveedor deja un enlace al complemento de información indicando el tipo de la misma, el consumidor puede actuar en consecuencia y de antemano para discernir que fragmentos de información son necesarios. Un ejemplo de este protocolo es el de enlaces FOAF, y funciona así: el documento ?d1 hace una referencia a la cosa referenciada por ?x en el documento ?d2 cuando:

?d1 log:says { ?y foaf:mbox_sha1sum ?s. ?y rdfs:seeAlso ?d2}.
?d2 log:says { ?x foaf:mbox_sha1sum ?s }.

Si el proveedor de información de ?d1 deja esa información, el consumidor, luego de haber leido ?d1 y deseando incrementar la información de ?y busca en el documento referenciado por rdfs:seeAlso, y encuentra en ?d2 la referencia a algo con el mismo valor de foaf:mbox_sha1sum y deduce que es la misma cosa. En este caso el protocolo asume que solo una persona (o entidad) es identificado por una dirección de email univoca, de ahí la validez de la suma SHA1.

Si bien esto es claramente más complejo que un simple enlace, Tabulator puede utilizar ambos. Los enlaces que pueden ser seguidos son representados por puntos azules (enlace valido).

Con esto finalizamos esta primera parte sobre Tabulator. En el transcurso de los siguientes días nos adentraremos en ejemplos de utilización y otras funcionalidades. ¡Espero lo disfruten y me dejen sus comentarios!

Spanish

Web Semántica Hoy, parte del Planeta RDF

July 15th, 2006

Desde hace unos días este weblog forma parte del agregador de noticias sobre Web Semántica por excelencia: Planet RDF. En este sitio se pueden encontrar casí todas las noticias que se escriben en diversos sitios. Este es un paso importante en la difusión de la Web Semántica en español puesto que los principales autores de noticias relacionadas se encuentran listados.

La Web Semántica está dejando de ser un proyecto de laboratorio para transformarse día a día en una realidad, y a través de sitios como Web Semántica Hoy tenemos la posibildad de hacer llegar ésta realidad a todos aquellos que no hablan inglés. Mi intención es a partir de ahora comenzar a difundir las noticias que vayan surgiendo, e instar a todos aquellos que desarrollen proyectos o realicen investigaciones a compartir con nosotros sus dudas y logros y entre todos crear una comunidad en nuestro idioma, con nuestros códigos y cultura. Quienes compartan ésta visión o quieran hacerme llegar sus proyectos, pueden contactarse conmigo dejando su comentario aquí o a mi casilla personal. ¡Los espero a todos!

Spanish