giovedì 8 dicembre 2016

Contenuti 4.0... cioè? Struttura, semantica e rintracciabilità

Nel post precedente, siamo partiti dalla definizione di "Intelligent Content" fissata da Ann Rockley, che definisce gli attributi fondamentali di un contenuto "intelligente".
Analizziamo rapidamente tali attributi.


STRUCTURALLY RICH
Un contenuto è struttuato (Gibbon, 2014) se risponde ad una rappresentazione formale che si basa:

  • su un insieme di contenuti tipizzati
  • su un insieme di relazioni che legano tali contenuti

Se misurate questa definizione con le caratteristiche dei più comuni standard di documentazione (DITA, S1000D, ...), vi rendete conto che tali standard ricadono perfettamente dentro la definizione.

Ma se analizziamo il content model di un generico CCMS, potremmo rilevare anche in esso un notevole grado di conformità con la definizione di Gibbon.

Nella definizione, implicitamente, si fa riferimento ad un un contenuto "puro", non inquinato dalla formattazione e definito in base a delle regole di struttura che rendono quel contenuto riconoscibile dagli altri.

I contenuti strutturati secondo le specifiche SGML/XML rientrano perfettamente dentro questo schema.

Quindi, un documento Word, monolitico, dove forma e contenuto sono miscelati insieme (paradigma della frittata (Galiazzo)), non è strutturato, quindi non "intelligente" secondo la definizione della Rockley. Mentre, ad esempio, un contenuto espresso nello standard DITA lo è.

Questo è un indizio molto importante: se usate uno standard aperto ben definito per la strutturazione dei contenuti (ad esempio, DITA), siete AUTOMATICAMENTE sicuri di poter manipolare "contenuti intelligenti" secondo la definizione che abbiamo adottato.

In caso contrario, se vi affidate ad un content model proprietario di un generico CCMS, potreste magari ottenere lo stesso risultato ma dovete prima verificare con attenzione le caratteristiche del content model.


SEMANTICALLY CATEGORIZED
Un contenuto strutturato è semanticamente classificabile.

In DITA un Concept topic è ben distinto da un Troubleshooting topic: sono due tipi di contenuti diversi, definiti da due strutture diverse, che si basano su due diversi insiemi di tag XML (e tali tag possono essere utilizzati rispettando determinate regole di struttura), ed esprimono due semantiche diverse.

Ad esempio, posso produrre un manuale con tutte le informazioni concettuali relative alla versione 1.0 della Macchina A, collezionando tutti i Concept topic che descrivono i fondamentali principi di funzionamento della macchina.

Analogamente, posso produrre il manuale della risoluzione dei problemi collezionando solo i topic di tipo Troubleshooting.


AUTOMATICALLY DISCOVERABLE
Se posso riconoscere una struttura, posso recuperare automaticamente un contenuto basandomi sull'analisi della tipizzazione della struttura.

Contenuti strutturati e semanticamente classificabili possono essere ulteriormente "taggati", cioè associati a dei metadati che ne potenziano la semantica.

Se posso taggare un contenuto, lo posso recuperare con una procedura automatica che prende in considerazione solo i tag che mi interessano.

Ad esempio, posso descrivere una procedura di manutenzione per la Macchina A, versione 1.0 e posso taggare la procedura con un tag "MacchA-1.0".

Posso poi descrivere una procedura simile per la Macchina A, versione 1.1 ("MacchA-1.1").

Oppure posso taggare con "MacchB" tutti i contenuti relativi alla Macchina B.

Posso poi taggare tutti i topic di tipo Troubleshooting inerenti alla "MacchA-1.0" e alla versione successiva, "MacchA-1.1"; quindi posso produrre 2 diversi manuali di risoluzione dei problemi sfruttando il paradigma:

tipizzazione + tagging

E ora credo che la definizione della Rockley sia più chiara.
Ma non è finita qui.
A presto.


Condividi


Articoli correlati per categorie



Nessun commento:

Posta un commento