Hace algunos meses, apareció Dublin Core Metadata Gen, una aplicación desarrollada en XHTML y Javascript que genera tres formas de representar metadatos usando los elementos de la Iniciativa de Metadatos de Dublin Core (DCMI):
- Los clásicos elementos
meta que aparecen entre las etiquetas <head> y </head> de un documento HTML.
- El contenido de un fichero RDF, el ya conocido estándar del W3C basado en la sintáxis de XML. Una forma de representar el contenido semántico de forma comprensible para las máquinas.
- Microformatos, otra forma de representar información semántica cuyo objetivo principal es ser útil a las personas y no a las máquinas (o mejor dicho a los agentes de software). Esta información aparece entre las etiquetas
<body> y </body> de un documento HTML
Cada uno de estos tipos de información semántica tiene sus características, que podemos simplificar en una incompleta lista de ventajas e inconvenientes. Espero que los comentarios de los lectores completen esta lista (Emmanuelle ya lo ha hecho, y muy bien, gracias).
Las etiquetas meta: ventajas e inconvenientes
Entre las virtudes que caracterizan a las etiquetas meta, se encuentran:
- Aparecieron en las primeras especificaciones oficiales de HTML.
- Las etiquetas
meta son ampliamente conocidas, y su uso está muy extendido.
- Como consecuencia del punto anterior, los agentes de software, como los buscadores, las conocen perfectamente.
- El número de etiquetas
meta es prácticamente ilimitado. Por un lado tenemos las clásicas, como <link rel="author" content="Alejandro Gonzalo Bravo García">, pero se pueden usar también otras etiquetas meta usando perfiles y esquemas, como podemos leer en Metadatos geográficos (2): Empleándolos en ficheros HTML, XHTML y RDF.
- Como consecuencia del punto anterior, su uso se puede considerar que entra dentro de los "estándares".
Pero no todas son ventajas, veamos algunos inconvenientes:
- Se ha abusado del uso de etiquetas
meta, y no siempre con propósitos correctos. La consecuencia: una buena parte de los buscadores ignoran estas etiquetas.
- Otra consecuencia del punto anterior es que en la actualidad no se utilizan demasiado, por ejemplo es raro encontrarse con elementos
meta en los CMS más habituales. Aunque siempre se pueden añadir plugins que cumplan esa función.
- Los valores de estas etiquetas son invisibles a los usuarios. Siempre se puede mirar el código fuente, o ver las propiedades de la página web, pero sinceramente no es muy habitual.
Ficheros RDF: ventajas e inconvenientes
Comenzamos con las ventajas...
- Es un estándar del W3C con todo lo que ésto significa.
-
Según podemos leer en la propia especificación...
Resource Description Framework (RDF) [Infraestructura para la Descripción de Recursos] es una base para procesar metadatos; proporciona interoperabilidad entre aplicaciones que intercambian información legible por máquina en la Web. RDF destaca por la facilidad para habilitar el procesamiento automatizado de los recursos Web. RDF puede utilizarse en distintas áreas de aplicación; por ejemplo: en recuperación de recursos para proporcionar mejores prestaciones a los motores de búsqueda, en catalogación para describir el contenido y las relaciones de contenido disponibles en un sitio Web, una página Web, o una biblioteca digital particular, por los agentes de software inteligentes para facilitar el intercambio y para compartir conocimiento; en la calificación de contenido, en la descripción de colecciones de páginas que representan un "documento" lógico individual, para describir los derechos de propiedad intelectual de las páginas web, y para expresar las preferencias de privacidad de un usuario, así como las políticas de privacidad de un sitio Web. RDF junto con las firmas digitales será la clave para construir el "Web de confianza" para el comercio electrónico, la cooperación y otras aplicaciones.
Resource Description Framework (RDF) Model and Syntax Specification, traducido por Eva Méndez
De aquí podemos extraer que tiene un potencial inmenso, desde el punto de vista técnico (interoperabilidad entre aplicaciones y procesamiento automatizado de recursos) y muchos ámbitos de aplicación.
- Para su contenido se pueden usar infinidad de
namespaces, cada uno de ellos con sus correspondientes elementos, como por ejemplo Dublin Core, FOAF, XMP, DOAC...
Y seguimos con los inconvenientes...
- Si bien es cierto que RDF Site Summary ha tenido una enorme difusión, no podemos decir lo mismo de RDF.
- Requiere más conocimientos ténicos para poder usarlo (no es tan sencillo como las etiquetas
meta).
- Los buscadores actualmente suelen ignorar este tipo de metadatos cuando están fuera de un documento HTML, aunque también pueden aparecer dentro del propio documento entre comentarios, como ocurre por ejemplo con las licencias Creative Commons.
- Actualmente no abundan agentes de software que aprovechen las capacidades de RDF (o al menos no hay tantos como nos gustaría).
- En general la información contenida en ficheros RDF no se muestra a las personas. Aunque siempre nos podemos encontrar con agradables excepciones, como la herramienta para visualizar informes RDF obtenidos al hacer una revisión automática con HERA y que podemos ver en funcionamiento en Informes Hera.
Microformatos: ventajas e inconvenientes
Veamos primero sus puntos fuertes:
- Las personas obtienen fácilmente la información contenida en los microformatos: es su principio básico. ¿Dónde puedo encontrar microformatos? Seguramente los hayas visto, aunque no te hayas dado cuenta. Los puedes encontrar, por ejemplo, en Gurú Web, donde se utilizan microformatos generados con Dublin Core Metadata Gen (también se usan los elementos
meta y los ficheros RDF, aunque tendrás que ver el código fuente para comprobarlo).
- A pesar del poco tiempo de vida, ha tenido bastante difusión.
- Existen multitud de microformatos con diferentes aplicaciones (consultar el listado Microformats Wiki), y cada vez van saliendo más.
Y ahora sus puntos menos fuertes...
- Es bastante reciente, y todavía no está muy asentado.
- La información no es interpretada con tanta facilidad como los ficheros RDF o las etiquetas
meta. Pero el hecho de usar fórmulas estándar para codificar los microformatos, debería minimizar esta dificultad a los buscadores.
- Aunque existe XMDP™ para crear pefiles para los microformatos, no están tan formalmente definidos como los perfiles para las las etiquetas
meta ó los namespaces. Además en el caso de los microformatos la relación entre los elementos del perfil y los microformatos no es tan exacta e inequivoca como en los perfiles o esquemas para las etiquetas meta ó los namespaces.
- Los microformatos son menos potentes, desde el punto de vista semántico, que otras formas de definir metadatos (como los mencionados ficheros RDF). Por ejemplo, no tienen la capacidad de definir formalmente relaciones complejas que puedan servir para que los agentes de software realicen inferencias o deducciones. Su campo de actuación es más limitado.
¿Más información semántica en HTML? ¿Cómo? ¿Dónde?
Por lo visto antes, parece que la única forma de incluir información semántica es mediante metadatos, ya sea en etiquetas meta, ficheros RDF ó microformatos. Pero no es así. Como podemos leer en la ayuda de HERA, al revisar la pauta 13.2
Son contenedores de metadatos, el elemento "title", el elemento "address", el elemento "meta", la declaración de tipo de documento (DTD), el elemento "link" y los elementos "del" e "ins", así como los atributos "title" y "cite".
Ayuda de HERA, al revisar la pauta 13.2
Para ampliar información, podemos leer el artículo de Emmanuelle titulado Navegación Semántica o Meta Navegación
meta, RDF, microformatos,... ¿qué metadatos son los mejores?
Como era de esperar, la respuesta es depende. En función de las características de cada tipo de metadatos, será más apropiado para unos desarrolladores o u otros. Igualmente depende también de dónde queramos utilizarlos y porqué.
Desde mi punto de vista, si queremos algo sencillo, lo mejor es usar meta. Con unos conocimientos un poco más avanzados se pueden usar elementos de perfiles ó esquemas muy potentes y versátiles (como por ejemplo Dublin Core). Si queremos usar unos metadatos más formales, aun a riesgo de que no se aproveche todo lo que se podría (al menos actualmente), creo que es una buena idea vincular en un documento web un fichero RDF externo. Aunque si no contamos con una aplicación que los genere de forma sencilla, como por ejemplo FOAF-a-Matic (traducido por inkel al español), puede ser algo más complicado y requiere conocimientos de XML y RDF.
Si tienes algunas dudas, en el artículo Metadatos geográficos (2): Empleándolos en ficheros HTML, XHTML y RDF se explican algunos conceptos básicos.
En el caso de que la prioridad sea facilitar a las personas la percepción de ciertos metadatos, una buena opción es usar microformatos. Algunos son muy sencillos de codificar (el ejemplo más claro es rel-tag, para que technorati catalogue mejor los artículos de las bitácoras), y no requieren grandes conocimientos: con saber un poco de HTML basta. Además puedes encontrar herramientas bastante útiles, como por ejemplo hCard Creator, para hacer tarjetas de visitas virtuales. Es muy interesante contar con la posibilidad de poder usar este tipo de microformatos, sobre todo teniendo en cuenta que algunos soy muy útiles. Pero su existencia y uso no resta importancia a los metadatos codificados más formalmente (si has pensado en RDF sumamos 10 puntos en tu marcador, je je).
Elementos meta, ficheros RDF, microformatos,... tres formas de mostrar metadatos generados con Dublin Core Metadata Gen
Volvamos otra vez a Dublin Core Metadata Gen, la herramienta que presentábamos al principio de este artículo. Y recordemos que era capaz de generar metadatos de Dublin Core de tres formas distintas:
- Elementos
meta
- Ficheros RDF
- Microformatos Dublin Core
Tres opciones a elegir, y todos generados de una forma sencilla: algunos inconvenientes que hemos mencionado antes como la complejidad para generarlos, desaparecen. Sólo tenemos que utilizar los metadatos que más nos interesen... sólos o en compañía de otros metadatos generados por la misma herramienta (si recuerdas que en Gurú Web se utilizaban a la vez los tres metadatos, tienes diez puntos más en tu marcador, je je).
Experimento práctico: comparar la popularidad en los buscadores de los tres metadatos
Desde aquí planteo un pequeño experimento práctico para los lectores de Web Semántica Hoy: comparar la popularidad de los tres metadatos en los buscadores más habituales. ¿Cómo? Generando metadatos sobre algún recurso que no tenga muchos resultados en los buscadores (¿una palabra inventada, tal vez?), colocarlos en diferentes páginas webs y tras unos días comparar qué documentos están mejor posicionados en algunos buscadores. El ganar esta pequeña competición no signifique que tal o cuál metadato sea mejor que los otros, sino que es reconocido con más facilidad por los buscadores (hay otras formas de compararlos, aunque quizás no sean tan sencillas).
Desde luego en la competición no todos tienen las mismas probabilidades de "ganar" (en mi opinión RDF parte con desventaja), y el éxito puede venir condicionado por otros elementos externos, como por ejemplo el elemento title, o los títulos y contenido,... por tanto habría que ser equitativo y partir de tres documentos HTML idénticos... salvo en los metadatos.
No olvidéis compartir los resultados en los comentarios.
Spanish