Tuesday, July 19, 2011

Word Bank is giving public access to 7000 data sets

The Data Catalog of Word Bank provides now download access to over 7,000 indicators from World Bank data sets.

Schema.org: Spoonfeeding Library Data to Search Engines

Not sure what Schema.org is about ? Read the nice post of Eric Hellman.

The internet of thinks

Nice explanation of what the internet of thinks could be : http://blogs.cisco.com/news/the-internet-of-things-infographic/

Definition of an Open Government Data Ontology (OGDO)

Let say we aim to build an open government data catalog with the following properties:
  • the solution should be based on open source software
  • with minimal self-development. One should be able to configure an existing framework
  • the content of the catalog should be readable for computer (as LOD) and for human (HTML)
  • everyone should be able to edit and add content.
The first step will be to develop a formal context of the catalog, to define an OGD-ontology. An OGD-ontology can be subdivided in 3 parts that are orthogonal. They can be define separately:
  1. a Data-ontology (D-ontology)
  2. an Open-ontology (O-ontology)
  3. a Government-ontology (G-ontology)


1) eine Data-Ontologie (og[D]) : diese Ontologie (ein SKOS Taxonomie könnte erstmal reichen) definiert die Semantik der Daten. Die hätte Konzepten wir "Healthcare", "Army", "Defence", "Religion", "Education", ... einfach alle die nötigen Schubladen die wir brauchen um OGD einzuordnen. Bevor eine richtige OWL Ontologie zu definieren kann man hier erstmal mit einer SKOS Taxonomie anfangen. Das sollte auch einfacher das in semantic MediaWiki zu integrieren. Diese Ontologie ist auch ganz generisch. Sie gilt in Prinzip für alle Landen. Ein gut Anfang wäre die Katalog von open.gov anzuschauen. Wahrscheinlich hat man das auch schon gemacht. Ich habe bis jetzt noch nichts gefunden. Bis jetzt das beste das ich habe ist [ ]

2) eine Open-Ontologie ([O]gd) : diese Ontologie beschreibt die Art wir die Daten veröffentlicht sind, den so genannte Dienst Vertrag, die nicht funktionalen Aspekten der Schnittstelle: wo sind die Daten zu finden (URI)? in welche Format (in LOD sollte das eher mit Content-Negociation machen), gibt es ein Gebühr ? Wenn ja wieviel. Welche Copyright ist mit der Daten gebunden, wie grosse sind die Daten?, Wann wurden sie das letzte Mal aktualiesiert? gibt es ein Kontakt Personn ? ... Genau wie bei der Daten-Ontologie ist diese Ontologie ganz generisch und gar nicht CH-spezifisch. Im SOA Umfeld hat man bestimmt etwas ähnlich schon definiert.

3) eine Government-Ontologie (o[G]d): mit dieser Ontologie kann man die politische Organisation/Strukturen des Landes spezifizieren. Wir haben hier Konzepten wie "Bund", "Kantonen", "Gemeide", "Departement",... In Prinzip wird so eine Ontologie einmal für die Schweiz definiert und sollte sich nicht so viel ändern (es hat sich diese letzte 100 Jahren kaum geändert ...). Hier auch sollte erstmal ein Taxonomie reichen.

Diese 3 Ontologien definieren den formalen Rahme des Verzeichnis. Dann sollte man semantic MediaWiki so konfiguriert das es nur möglich ist, diese OGD-Ontologie/Taxonomie zu instanzieren. Da weiss ich nicht genau ob die semantic extension von MediaWiki so etwas ermöglicht. Grundsätzlich kann man 2 Sichten auf die Daten definieren: eine Daten Sicht und eine Government Sicht. Die Daten Sicht listet (es wird eher ein Baum-hierachie) einfach die verschieden Arten von Daten. Für eine bestimmte OGD-Daten Kategorie (zum Beispiel "Kultur" ) sehe

Tuesday, July 12, 2011

Semantic Wiki with Referata

Referata offers hosting of semantic wikis (MediaWiki + semantic MediaWiki extension ) : http://tinyurl.com/67sm9u3

Data.gov catalogs

An interactive dataset containing the metadata for the Data.gov raw datasets and tools catalogs : http://explore.data.gov/Other/Data-gov-Catalog/pyv4-fkgv