La lista de las ontologías más usadas
Semantic Web Logo by Laurian Gridinoc"A little semantics goes a long way", es una frase que se extiende en los foros (pruébala en tu buscador favorito).
El Semantic Web Interest Group del W3C la explica así: "Some simple shallow ontologies for concepts shared by many applications can play a very strong role in linking together many applications.".
O lo que es lo mismo, si utilizamos unas pocas ontologías simples conseguiremos enlazar nuestros datos en una red enorme, porque a fin de cuentas, la mayoría de los datos semánticos utilizan las mismas.
Al grano, siguiendo el anterior post ¿cómo buscar una ontología? obtenemos la siguiente lista de Namespaces más usados (según pingthesemanticweb):
- FOAF (http://xmlns.com/foaf/0.1/): describiendo personas, las relaciones entre ellas y las cosas que crean y hacen.
"FOAF defines an open, decentralized technology for connecting social Web sites, and the people they describe".
- Geospatial(http://www.w3.org/2003/01/geo/wgs84_pos#): describiendo la posición de los objetos.
"A vocabulary for representing latitude, longitude and altitude information in the WGS84 geodetic reference datum.
See http://www.w3.org/2003/01/geo/ for more details.".
- Geonames (http://www.geonames.org/ontology#):
"The GeoNames Ontology makes it possible to add geospatial semantic information to the Word Wide Web.
All over 6.2 million geonames toponyms now have a unique URL with a corresponding RDF web service.
Other services describe the relation between toponyms."
- SIOC (http://rdfs.org/sioc/ns#): describiendo información de comunidades en la Red.
"SIOC (Semantically-Interlinked Online Communities) is an ontology for describing the information in online communities.
This information can be used to export information from online communities and to link them together.
The scope of the application areas that SIOC can be used for includes (and is not limited to) weblogs,
message boards, mailing lists and chat channels."
- OWL (http://www.w3.org/2002/07/owl#): No comment.
- Semantic Media Wiki (http://semantic-mediawiki.org/swivt/1.0#)
This ontology describes the elements used in the export of Semantic MediaWiki.
More information can be found at http://semantic-mediawiki.org
- DOAP (http://usefulinc.com/ns/doap#):
Describiendo proyectos de software libre mediante RDF, y que así puedan ser procesados fácilmente de una manera automática.
- RSS (http://purl.org/rss/1.0/):
"RDF Site Summary (RSS) is a lightweight multipurpose extensible metadata description and syndication format. RSS is an XML application, conforms to the W3C's RDF Specification and is extensible via XML-namespace and/or RDF based modularization."
- RDF (http://www.w3.org/1999/02/22-rdf-syntax-...): no comment.
- contentelabel (http://www.w3.org/2004/12/q/contentlabel):
"Base RDF schema for content labelling vocabularies."
- BIO: (http://purl.org/vocab/bio/0.1/)
"Describes a vocabulary for describing biographical information about people, both living and dead.
It has been designed to be compatible with both RDF and non-RDF XML formats such as FOAF, RSS 1.0 and RSS 2.0. It contains terms useful for finding out more about people and their backgrounds and has some cross-over into genealogical information."
- CreativeCommons (http://web.resource.org/cc/):
"Describing copyright in RDF"
- Atom (http://atomowl.org/ontologies/atomrdf#)
- ICRA (http://www.icra.org/rdfs/vocabularyv03#)
La Asociación para la clasificación de contenidos de Internet (ICRA)
- WORDNET (http://xmlns.com/wordnet/1.6/)
WordNet es una enorme base de datos léxica del idioma Inglés.
Agrupa las palabras en conjuntos de sinónimos llamados 'synsets', proporcionando definiciones cortas y generales, y almacenando las relaciones semánticas entre estos conjuntos de sinónimos. El propósito del proyecto es doble:
por un lado producir una combinación de diccionario y tesauro cuyo uso es más intuitivo, y ayudar al análisis automático de textos y a las aplicaciones de inteligencia artificial.
La base de datos y las herramientas se han liberado bajo una licencia BSD y pueden ser descargadas y usadas libremente. Además la base de datos puede consultarse online.
Así, resulta evidente, en base a estos y otros muchos ejemplos, que Google utiliza algún detector de términos que no es comparable con la detección de contenido real que pueden proporcionar los análisis semánticos.
Sobre el sistema de Hakia, se basa en middleware (El Middleware según Wikipedia es un software de conectividad que ofrece un conjunto de servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas. Funciona como una capa de abstracción de software distribuida, que se sitúa entre las capas de aplicaciones y las capas inferiores (sistema operativo y red).
Y puede ser útil, no sólo para extraer palabras clave, insertar meta-tags, etc. sinó para proporcionar resultados más relevantes, que aporten mayor calidad y resultados a los distintos proveedores de publicidad contextual.
Os dejo, para terminar, las líneas que finalizan la presentación en Hakia:








creo que la novedad que aportará será similar complementar lo que viene haciendo Twine:
Lo presentan como una forma fácil de evitar el caos en las búsquedas. Y realmente, y a pesar de que su autodefinición como herramienta semántica no es del todo exacta, si estamos seguros de lo que vamos a buscar y no queremos dejarnos llevar por la a veces dulce serendipia (el azar), puede ayudarnos.









