FREEBASE

Posted on 31 enero, 2013 por

0


FREEBASE

Freebase es una base da datos de dominio general creada por la empresa estadounidense Metaweb Technologies, Inc., y que Google compró en julio de 2010. Sus creadores la definen como una base de datos abierta y compartida del conocimiento del mundo.

Freebase es una base de datos colaborativa de conocimiento, online, gratuita y estructurada. Contiene información de diferentes disciplinas como música, cine, tecnología, geografía, arte, etc. No es sólo una base de datos textual, sino que ofrece imágenes, videos y audios. Los datos se registran bajo licencias Creative Commons de Reconocimiento.

Actualmente, Freebase contiene más de 22 millones de entidades o topics (persona, lugar o cosa única y singular del mundo real), pero este número aumenta diariamente. Cada una de estas entidades tiene su propio identificador (id), lo que permite distinguirlas de otras entidades que puedan ser similares, evitando así los errores. La mayoría de la entidades suelen ser un artículo de Wikipedia, aunque también contienen información procedente de otras fuentes como IMDB, MusicBrainz, etc.

Image Hosted by PicturePush - Photo Sharing
Ejemplo de una entidad en Freebase.

Estas etidades se encuentra conectadas y relacionadas unas con otras en forma de grafo de nodos, estableciendo así un conjunto de relaciones entre las entidades que pueden ser bastante complejas debido a que su información se encuentra estructurada de manera no jerárquica. En estos momentos, la base de datos tiene más de 400 millones de relaciones.

Estas relaciones utiliza Schema, que estructura los datos siguiendo este modelo:

  1. Dominios: son conjuntos de types que comparte un namespace.
  2. Types: define a la persona, cosa o lugar, y establece una relación con la entidad definida por “es un/a”. Por ejemplo Paul Newman es un actor, donde Paul Newman es la entidad y actor es un type. Una misma entidad puede tener muchos types
  3. Properties: define las cualidades de un type. Establece una relación con la entidad y el valor de la propiedad definida por “tiene un/a”, por ejemplo, Blade Runner (entidad) tiene un director (propiedad) Rydley Scott (valor).

Por tanto, Schema es la ontología que utiliza Freebase, o mejor podría identificarse con una folksonomía, ya que se crea de manera colaborativa por parte de los usuarios, de tal modo que este sistema de clasificación permite una indexación social, utilizando una clasificación mediante etiquetas en un espacio sin jerarquías ni relaciones predeterminadas.

http://youtu.be/kMn-HigfqZc

El principal objetivo de Freebase es crear un gran repositorio donde los datos se encuentren bien estructurados y donde los usuarios colaboren constantemente aportando nuevo conocimiento y aplicaciones, además de la recuperación de información multimedia.