Un progetto italiano vince al LODLAM2015 a Sidney, è Open Memory Project sulla Digital Library del CDEC realizzata con xDams e Bygle

OpenMemoryLodviewOggi un diluvio di tweets ha annunciato la vittoria del gran prize da parte di Open Memory Project, l’iniziativa nata per presentare al LODLAM2015 il lavoro realizzato in questi anni dal CDEC (Centro di Documentazione Ebraica Contemporanea) di Milano con la collaborazione di regesta.exe che ha realizzato per il Centro una infrastruttura d’avanguardia, utilizzanto xDams e Bygle, per consentire l’information management, in maniera nativa, in linked data.

L’OPAC della Digital Library del CDEC è on line da meno di un anno e Open Memory Project identifica in particolare il lavoro realizzato per la preparazione della prima Ontologia sulla Shoah, che è il fiore all’occhiello del progetto e descrive il dominio di conoscenza relativo agli eventi e alle persone travolte dalle persecuzioni  razziali tra il 1943 e il 1945.

Complimenti al CDEC e a regesta che hanno dimostrato che in Italia si può realizzare tecnologia di grande qualità, a tutti coloro i quali hanno lavorato a questo progetto ma anche a Diego Camarda che con Lodview era uno degli altri quattro progetti presenti nella shortlist finale di Sidney. Due progetti italiani su cinque, un grande risultato, lasciatelcelo dire, anche per regesta, dal cui laboratorio sono usciti i due progetti.

Open Memory Project, il crowdfunding per promuovere l’utilizzo dei dati aperti per la ricerca sull’Olocausto

L’Open Memory Project è un’iniziativa di crowdfunding che desideriamo sostenere perchè finalizzata alla diffusione della cultura dei dati aperti tra le istituzioni che si occupano di ricerca sull’Olocausto. Laura Brazzo e Silvia Mazzini hanno presentato un paper alla Alliance of Digital Humanities Organizations  per partecipare alla conferenza internazionale promossa a Sidney, il 29 giugno, e raccontare l’esperienza del CDEC (Centro di Documentazione Ebraica Contemporanea) di Milano e della sua “Digital Library” (http://digital-library.cdec.it).

Il progetto, tra gli altri obiettivi, aveva lo scopo di utilizzare le tecniche del Web Semantico per favorire la condivisione della conoscenza, nel formato più aperto possibile (i Linked Open Data) e ha richiesto la realizzazione della prima Ontologia per descrivere la Shoah. Una iniziativa di rilievo internazionale che è stata già inserita nel recente censimento della Linked Open Data Cloud mondiale.

L’approvazione del paper ha aperto il problema di reperire i fondi per volare a Sidney per parlare di questa eccellenza italiana. Laura e Silvia non si sono perse d’animo ed è nata l’idea del crowdfunding attraverso la piattaforma jewcer  (http://jewcer.com/project/open-memory-project),  realizzando addirittura un bel video per raccontare il progetto.

Il CDEC sta gradualmente rilasciando il suo prezioso patrimonio documentale attraverso il progetto “Digital Library” (http://digital-library.cdec.it) realizzato con regesta.exe utilizzando le due piattaforme xDams e Bygle.

 

Press release, la Digital Library del CDEC: sul Corriere della Sera l’articolo di Antonio Carioti nelle pagine dedicate alla Cultura

Una breve anteprima dell’articolo pubblicato oggi, 17 gennaio 2015, sul Corriere della Sera a firma di Antonio Carioti.

La versione integrale dell’articolo è disponibile nella sezione Cultura a pagina 51 e racconta di tutto il progetto Digital Library del Centro di Documentazione Ebraica Contemporanea di Milano all’interno del quale xDams è il back end dedicato alla gestione degli archivi storici, fotografici e audiovisisvi.

L’articolo poi da enfasi all’approccio Linked (Open) Data adottato da CDEC su progetto di regesta per la gestione complessiva dell’information management dell’intero Istituto, una visione di grande innovazione a livello mondiale e in particolare una “prima” assoluta per gli studi sulla Shoah (Holocaust).

Martedi 20 gennaio prossimo alla Camera dei Deputati CDEC illustrerà il progetto con la collaborazione di esperti nazionali e internazionali

Workshop alla Camera dei Deputati sulla preservazione patrimonio culturale della comunità ebraica e Linked Data

xDams è un tassello fondamentale del progetto “Digital Library” del Centro di Documentazione Ebraica Contemporanea di Milano (CDEC) che ha come obiettivo quello di predisporre una innovativa architettura tecnologica a servizio del lavoro di ricerca del Centro.

Regesta.exe ha disegnato una soluzione che finalizza la catalogazione attraverso xDams al suo inserimento in una strategia più ampia, che mira a descrivere tutto il patrimonio di conoscenza del CDEC in un’ottica Linked Data, secondo il paradigma dell’information management immaginato da Tim Berners Lee in quella celebre “proposal” al CERN, da cui unanimamente si fa discendere la nascita del Web come oggi lo conosciamo.

Questa esperienza, tra le primissime al mondo, viene raccontata nel workshop “Linked Open Data & Jewish Cultural Heritage” che si terrà il 20 Gennaio presso l’auletta dei gruppi parlamentari a Montecitorio con il patrocinio di Camera dei deputati, Ministero dei beni e delle attività culturali e del Turismo (Mibact), W3C Italia, Unione delle Comunità Ebraiche Italiane (UCEI), Comitato di Coordinamento delle Celebrazioni in ricordo della Shoah della Presidenza del Consiglio dei Ministri.

Il work shop è organizzato dalla Fondazione Cdec in collaborazione con regesta.exe e Istituto di Telematica e Informatica del CNR di Pisa, maggiori dettagli sull’agenda dell’incontro sul sito di regesta

Open Data Awards 2014, la nomination per regesta un incoraggiamento aulla strada dei Linked Data

L’Open Data Institute di Londra, l’istituto fondato nel 2012 da Tim Berners-Lee per sostenere la cultura degli Open Data, ha nominato i finalisti per i premi della prima edizione degli Open Data Awards.

regesta ha ricevuto la nomination nella categoria Open Data Publisher Award proprio per la sua attività sui Linked Open Data nel campo dei Beni Culturali. Questo rappresenta un premio per il lavoro svolto fin qui ma soprattutto un incoraggiamento a proseguire su questa via.

La road map di xDams include già i task necessari a giungere alla pubblicazione di RDF direttamente dall’attività di catalogazione, ora non ci resta che continuare con sempre più determinazione per arrivare al rilascio delle nuove versioni.

xDams alla Delft University per parlare di Linked Open Data per i Beni Culturali. Silvia Mazzini racconta l’integrazione con openDams

Dopo il successo dell’iniziativa del W3C collegata all’Open Data Day xDams e la sua integrazione con la tecnologia opendams per produrre Linked Open Data viene presentata in un nuovo meeting internazionale alla Delft University in Olanda sul tema “Linked open data: conceptualizing an infrastructure for collaborative research“.

Per il secondo anno consecutivo Silvia Mazzini, amica e collega in regesta.exe (la società che sviluppa xDams) nonchè animatrice del progetto open source Lodlive è stata chiamata a raccontare dalla prestigiosa Universita per le Tecnologie in Olanda le nostre esperienze sulla pubblicazione di dati afferenti al mondo dei beni culturali in formato LOD. Silvia ha presentato in particolare i progetti che regesta ha realizzato in questo campo, il portale Linked Data della Camera dei Deputati, l’Archivio del Centro di Documentazione Ebraica  e la prima ontologia della Shoah in Italia, il progetto Reload.

Ecco le slide presentate da Silvia Mazzini

xDams e Linked Open Data per il Centro di Documentazione Ebraica Contemporanea al convegno del W3C

La Fondazione Centro di Documentazione Ebraica Contemporanea CDEC di Milano, principale archivio e istituto per la storia degli ebrei in Italia nell’età contemporanea, presenterà la prima sperimentazione con linked open data sulla storia della Shoah il 21 febbraio a Roma nel corso del convegno LOD2014 – Linked Open Data: where are we? organizzato dal W3C e CNR presso l’Archivio di Stato di Roma.

Il paper sarà presentato da Laura Brazzo (CDEC) e Silvia Mazzina (regesta.exe) e racconterà la sperimentazione  effettuata su un subset della banca dati sui deportati dall’Italia. Nel corso del convegno sarà anche possibile accedere a un endpoint con questa prima sperimentazione sui dati navigabili da un utente anche attraverso Lodlive di Diego Camarda, che ha aperto il convegno con un keynote sulla situazione dei LOD in Italia.

Il progetto LOD di CDEC è una novità assoluta per l’Italia ma, allo stato delle nostre conoscenze, anche in campo internazionale, e si è posto l’obiettivo di una formalizzazione dei concetti relativi alla persecuzione antiebraica in Italia tra il 1943 e il 1945, in uno sforzo di astrazione che potrà essere utile anche per allargare l’esperienza ad altri paesi o ad altri contesti di persecuzione e deportazione.

Questo è il primo importante risultato della seconda fase dei lavori del progetto per la pubblicazione di una banca dati sui documenti e le risorse del CDEC per la storia della Shoah in Italia.

Il Progetto CDEC integrazione tra la tecnologie xDams e openDams

Tale progetto, avviato a partire dalla fine del 2012 in collaborazione con regesta. exe, si inserisce nel quadro più ampio di un lavoro di risistemazione e integrazione del sistema archivistico dell’istituto, digitalizzazione di documenti, creazione di una “digital library”, basata sull’integrazione della piattaforma xDams per la gestione degli archivi storici e la tecnologia openDams, sempre sviluppata da regesta.exe, per la gestione delle risorse documentali secondo il paradigma dei linked data.

Le potenzialità offerte dalle tecnologie messe in campo per lo sviluppo di questo progetto, permetteranno alla Fondazione CDEC non solo di ribadire il proprio decennale impegno per la  conservazione della memoria della Shoah e dell’ebraismo italiano, ma anche di essere tra i primi istituti italiani promotori attivi del concetto di condivisione della cultura e dei contenuti culturali.

Formati standard e aperti

In questo un ruolo di primaria importanza è svolto dalla svelta sul formato dei dati, quelli utilizzati da xDams per la compliance scientifica  agli standard di settore e dal formato di rappresentazione dei dati Linked Open Data (LOD), adottato per lo sviluppo di tale progetto.  Il formato LOD infatti va incontro innanzitutto alle esigenze manifestate dal CDEC all’avvio del progetto di migliorare l’efficacia del lavoro interno e la conoscenza e rintracciabilità trasversale dei dati e dei documenti appartenenti alle diverse aree di lavoro dell’istituto (Biblioteca, archivio storico, archivio fotografico, archivio audiovisivo, archivio sul pregiudizio antiebraico). Il suo utilizzo anche in fase di pubblicazione dei contenuti, diventa efficace strumento per l’incremento delle opportunità di confronto e scambio di dati con altri istituti e con esse, delle potenzialità di ampliamento della ricerca scientifica e della conoscenza. I dati in formato LOD, supportati dalla definizione di una ontologia per il dominio “Shoah” – mai realizzata finora –rendono possibile infatti un maggiore e più libero approfondimento semantico delle informazioni relative a questo specifico ambito di conoscenza.

1. Aree di intervento
Il progetto del CDEC, da un punto di vista strettamente tecnologico, consiste di tre macro aree che hanno lo scopo di ottimizzare l’attività di ricerca e documentazione del Centro rendendolo collaborativo ed estendendo la fruizione dei contenuti al maggior numero di collaboratori e/o di studiosi esterni al Centro, nel minor tempo possibile. Questi tre settori d’intervento sono:

  • Consolidamento di metadati e documenti di natura storica e/o contemporanea, l’attività di studio e ricerca del Centro è stata supportata negli anni da differenti software specializzati che sono stati migrati in unica base dati XML.
  • Implementazione di un sistema di lavoro centralizzato e collaborativo, basato sul paradigma dei Linked Open Data (LOD) per costruire una visione integrata sia della documentazione storica che di quella corrente e/o proveniente da fonti esterne.
  • Piattaforma di pubblicazione dei dati d’archivio sia in forma tradizionalmente web che in modalità LOD.

2. Il consolidamento delle basi dati
Il primo obiettivo è stato ottenuto migrando le basi dati esistenti dai diversi software utilizzati in passato (Sesamo, Access, Fotostation, Excel, Erasmo) nella piattaforma xDams O.S. La natura open source del progetto consente al CDEC di sentirsi completamente autonomo ma al tempo stesso il supporto professionale che Regesta.exe ha fornito e la sua competenza sul prodotto hanno permesso di accorciare i tempi di realizzazione, ottimizzare i risultati con il miglior rapporto costi/benefici. I requisiti che xDams hanno convinto CDEC sono:

  • La storicizzazione in formato XML è una garanzia a riguardo la leggibilità dei dati a lungo termine, anche nel caso in cui il supporto dell’azienda che ha prodotto la piattaforma non fosse più disponibile. Relativamente alla parte “dati” questo rappresenta un valore, anche per il futuro,  paragonabile a quello costituito dalla modalità open source per quanto riguarda il software.
  • Rispetto degli standard di catalogazione. La ricerca da parte di regesta della compatibilità con le indicazioni nazionali e internazionali consente di aumentare grado di interoperabilità con istituzioni esterne.
  • L’approccio web nativo è un passaggio fondamentale tra l’organizzazione del CDEC prima e dopo questo progetto, ovvero la possibilità di delocalizzare l’attività di ricerca e studio rispetto alla sede fisica del Centro e agevolare la realizzazione di progetti di cooperazione scientifica internazionale.

3. L’attività di migrazione
In questi mesi sono stati importate  più di 50.500 schede fotografiche, circa 2.600 schede di archivio storico e sono state create 21.240 occorrenze di authority persone e famiglie ricavandole dagli archivi, inoltre sono state censite oltre a 2360 schede di luoghi. Oltre alla migrazione di dati esistenti è stato predisposto l’ambiente per realizzare la catalogazione anche di oggetti diversi, quali i materiali del ricco archivio audiovisivo.

E’ in corso di realizzazione la migrazione della Biblioteca, con la realizzazione degli opportuni meccanismi di collegamento con le istituzioni nazionali del settore e delle funzionalità di gestione operativa, ma a seguire saranno implementate anche funzionalità relative a tutti gli altri gruppi di lavoro del CDEC.

Di particolare rilevanza, come detto in introduzione, il task di individuazione e descrizione di una ontologia di riferimento, per ampliare la capacità di interpretazione semantica delle informazioni.

4. Differenziazione della gestione degli archivi storici e correnti
Il secondo obiettivo del CDEC era collegato alla necessità di supportare tutta l’attività del centro con adeguati strumenti tecnologici al fine di ridurre le successive attività di rilavorazione dei dati legate all’attuale sistema di raccolta dei dati solo in parte automatizzato.

Questa fase ha richiesto un ulteriore approfondimento perché ci si è posti la domanda se differenziare gli strumenti per tutta l’attività del Centro rispetto a quelli dell’archivio storico. Si è optato quindi per mantenere disgiunti i tools, a causa delle tante particolarità della archiviazione storica, con standard nazionali e internazionali che si è tenuti a rispettare. Da un lato si sentiva la necessità di avere uno strumento specializzato e collaudato in questo particolare ambito, da qui la scelta di utilizzare xDams, dall’altro emergeva il rischio che un software con una tale specifica verticalizzazione potesse essere limitante nell’affrontare le altre problematiche legate alla documentazione eterogenea sulla quale abitualmente lavoriamo.

Si è quindi optato per definire un sistema di virtualizzazione di tutte le basi dati secondo il già citato paradigma dei Linked Open Data. Ogni fonte di dati e documenti o funzionalità operativa che non richiedesse applicativi specifici è stata migrata su un unico strumento operativo, Open Dams, dove Open è appunto sinonimo di Open Data,  nel quale ogni provider di dati si interfaccia, attraverso plugin specifici, a un end-point accessibile con linguaggio SPARQL e  fruibile mediante la medesima piattaforma che funziona da unico punto di accesso a tutta la base dati.

5. Piattaforma centralizzata e collaborativa
OpenDams non assolve però solo alla funzione di consolidamento documentale in quanto fornisce anche importanti strumenti di lavoro collaborativo che permetteranno nel futuro di massimizzare i risultati del lavoro prodotto dai singoli in un ‘ottica di conoscenza complessiva del patrimonio.

L’interfaccia di OpenDams offre la possibilità di lavorare insieme su documenti, creare cartelle di documenti, aggiungere commenti personali e/o di condividerli, produrre opere derivate a partire da tutti gli oggetti presenti sul desk di lavoro.

6. LOD come paradigma di integrazione dei dati
L’architettura così costituita disegna un datawarehouse documentale e informativo che presenta, grazie a OpenDams e ai LOD, la visione di un’omogenea e completa base dati integrata di tutto il CDEC.
L’adozione dell’approccio LOD però, oltre all’ottimizzazione della gestione interna, trova un’ulteriore ragion d’essere nella prospettiva di condivisione delle informazioni con l’esterno, infatti la pubblicazione dell’End Point consentirà a soggetti terzi il riutilizzo dei dati, ma è importante sottolineare che ciò avverrà in un’ottica paritaria di scambio, per cui ciascuno conseguirà  l’arricchimento delle proprie informazioni grazie a  quelle pubblicate, con analoga modalità, in altre parti del mondo.

Già le prime sperimentazioni con importanti archivi italiani rendono concreta la possibilità di (ri)costruire ulteriore conoscenza a partire dall’integrazione di informazioni di archivi differenti. La definizione della prima parte dell’ontologia CDEC, redatta ovviamente in inglese, potrà costituire un modello di riferimento per chi desiderasse percorrere il medesimo cammino.

La metodologia Linked Open Data è stata descritta da Tim Berners Lee, il padre riconosciuto di internet, quale lo standard principe di condivisione della conoscenza, in quanto per sua natura non implica la definizione di un modello statico dei dati e permette di rappresentare gli stessi in maniera differente in base a diversi ambiti di applicazione. La visione di Berners Lee è stata adottata con entusiasmo dai principali governi che vi leggono la possibilità di passaggio ad una nuova fase di Internet che viene identificata comunemente come Web of Data.

Il progetto CDEC quindi rappresenta un modello di integrazione innovativo di gestione del patrimonio sia storico che corrente, che sfrutta lo standard di rappresentazione dei dati LOD sia all’interno che all’esterno del Centro con l’obiettivo di raggiungere il più alto livello di conoscenza condivisa con il più alto numero di utenti possibili.

[ReLoad] Rilasciato in Open Source su Github il mapping tra #OAD e #SAN #LODLAM

Il progetto ReLoad è promosso da alcuni utilizzatori di xDams quali l’Archivio Centrale dello Stato e l’Istituto Beni Culturali dell’Emilia Romagna in collaborazione con regesta.exe, la società che ha realizzato xDams e che lo ha pubblicato su Github sotto licenza open source nel 2012.

Oggi ReLoad compie un nuovo passo verso il web semantico e l’interoperabilità dei dati in campo archivistivo con uno studio dettagliato sulla compatibilità tra il modello concettuale esplicitato nelle sue ontologie archivistiche (EAC-CPF, OAD e OCSA) e il tracciato di scambio per le descrizioni archivistiche del Sistema Archivistico Nazionale.

Naturalmente anche questo passo è compiuto nella direzione della condivisione della conoscenza poichè tutta la documentazione tecnica e gli strumenti utili per la trasformazione in linked open data (LOD) dei dati in formato SAN sono disponibili in licenza open source sul sito di reload e su github.

Per avere informazioni più dettagliate su questa nuova iniziativa vi consigliamo di leggere questo post sul sito di regesta