+
Los datos volcados Los datos RDF se serializa utilizando el formato N-Triples, codificado como UTF-8 texto y comprimido con gzip. Si usted está escribiendo su propio código para analizar el RDF vuelca su a menudo más eficiente para leer directamente desde un archivo gzip en lugar de la extracción de los datos en primer lugar y luego procesar los datos sin comprimir. Nota: En Freebase, los objetos tienen MID que se parecen a / m / 012rkqx. En RDF esos MID se convierten en m.012rkqx. Del mismo modo, Freebase como esquema / common / tema se escribe como common. topic. El tema es el ID de un objeto de base libre. Puede ser un MID Freebase (ex. M.012rkqx) para los temas y CVT o una identificación legible por humanos (ex. Common. topic) para el esquema. El predicado es siempre una identificación legible para una propiedad de base libre o una propiedad de un vocabulario RDF estándar como RDFS. Freebase espacios de nombres de clave externa también se utilizan como predicados para que sea más fácil para buscar las llaves por el espacio de nombres. El campo de objeto puede contener una base libre MID para un objeto o un documento de identidad legible por humanos para el esquema de Freebase u otros vocabularios RDF. También puede incluir valores literales como las cadenas, booleanos y valores numéricos. descripciones de diversos temas a menudo contienen nuevas líneas. Con el fin de hacer que cada ajuste triple en una línea, hemos escapado con saltos de línea. Freebase eliminado Triples también de un volcado de triples que han sido eliminados de la base libre con el tiempo. Este es un basurero de una sola vez a través de marzo de 2013. En el futuro, podríamos considerar proporcionar actualizaciones periódicas del triples borrados recientemente, pero por el momento no tenemos ningún plazo específico para hacerlo, y estamos proporcionando sólo este basurero de una sola vez. El vertedero se distribuye como un archivo. tar. gz (2,1 GB comprimido, 7.7Gb sin comprimir). Contiene 63,036,271 triples eliminados en 20 archivos (no hay ningún significado particular a los archivos individuales, es más fácil de manipular varios archivos más pequeños de un archivo enorme). Gracias a Chun Cómo Tan y John Giannandrea para hacer posible esta publicación del informe. El formato de datos es esencialmente CSV con una salvedad importante. El campo de objeto puede contener cualquier carácter, incluyendo comas (así como cualesquiera otros delimitadores razonables que usted podría pensar). Sin embargo, todos los demás campos no están garantizados para contener comas, por lo que los datos aún se pueden analizar de forma inequívoca. Las columnas en el conjunto de datos se definen como: creationtimestamp (hora de tiempo UNIX en milisegundos) deletiontimestamp creador (hora de tiempo UNIX en milisegundos) deletor sujeto (MID) predicado (MID) objeto (MID / literal) languageCode CSVFreebase / Wikidata Asignaciones Los datos han sido creado en base a la Wikidata volquete de 28 de octubre de 2013, y contiene sólo aquellos enlaces que tienen al menos dos enlaces de Wikipedia comunes y no un solo desacuerdo Wikipedia-Link. Por otra parte, las líneas están ordenados por el número de común Wikipedia-Enlaces (aunque en Turtle esto realmente no importa). Los datos RDF se serializa utilizando el formato N-Triples, codificado como UTF-8 texto y comprimido con gzip. Licencia Freebase datos volcados se proporcionan de forma gratuita para cualquier propósito con actualizaciones periódicas de Google. Se distribuyen, como la misma Freebase, bajo la licencia Creative Commons Reconocimiento (también conocido como CC-BY) y el uso está sujeto a las Condiciones del servicio. Las asignaciones de identificación Freebase / Wikidata se proporcionan bajo CC0 y se pueden utilizar sin restricciones. Citando Si youd como para citar estos datos volcados en una publicación, puede utilizar: Salvo que se indique lo contrario, el contenido de esta página se ofrece bajo la licencia 3.0 de Creative Commons. y ejemplos de código están licenciados bajo la licencia Apache 2.0. Para más detalles, ver políticas de nuestro sitio. 2, 2016
No comments:
Post a Comment