| Articolo sottoposto a Peer Review

Flusso XML e InDesign per la realizzazione di edizioni digitali nelle Humanities

 ARTICOLO SCIENTIFICO

  • Data ricezione: 22/12/2021
  • Data accettazione: 09/02/2022
  • Data pubblicazione: 23/03/2022

Abstract

Abstract


In questo articolo vengono presentate, in tutti i dettagli operativi e concettuali, la progettazione e la realizzazione di un flusso editoriale completo, per la realizzazione di un’edizione digitale a stampa dell’inventario dei manoscritti di Palazzeschi.

Gli autori, insieme ad alcuni collaboratori specialisti di varia provenienza (archivisti, informatici, grafici editoriali), hanno elaborato un flusso editoriale in grado di realizzare un’edizione a stampa in formato PDF di qualità dell’inventario del fondo manoscritti, partendo dall’estrazione dei dati archivistici dalla piattaforma di schedatura che rispetta gli standard internazionali. Tale lavoro si è svolto seguendo le linee guida ANAI e le scelte editoriali del Centro Studi “Aldo Palazzeschi”. Il flusso è stato progettato anche per favorire le attività preliminari di revisione e adattamento dei dati, nell’ottica di ottimizzarne le procedure e i tempi.

Il flusso descritto è stato adottato per realizzare il primo volume della nuova collana ad accesso aperto del Centro Studi “Aldo Palazzeschi”; altre edizioni sono in lavorazione per dare vita ad opere quali cataloghi di mostre, carteggi e guide archivistiche. Tutti questi volumi si basano sui dati contenuti nella piattaforma di Carte d’autore online, ma ognuno di essi viene realizzato con l’impiego di un template InDesign adattato al progetto specifico, a partire da quello descritto in questo articolo.


The aim of this paper is to show the project and development of an entire editorial workflow, by focusing on all its practical and conceptual details. The workflow under analysis has been conceived to produce a to-be-printed digital edition of the inventory of the “Fond of manuscripts of Palazzeschi”.

Both authors, in collaboration with archivists, developers and graphic designers, have been setting up an editorial workflow able to produce a quality PDF, starting from data stored in a cataloguing platform that complies with international standards. This work was carried out following both ANAI guidelines and Centro Studi Aldo Palazzeschi’s editorial rules. This flow is also meant to support some preliminary tasks, like data review and proofreding, in order to optimize their processes and time concerns.

This workflow has been adopted to publish the first volume of the new Open Access series by Centro Studi “Aldo Palazzeschi”. Some other editions are still in progress so as to deliver exhibition catalogues, epistolary exchanges and archival guides. All these volumes take their data from "Carte d’autore online" database and each of them requires a settled template, set up on the basis of the specific one in the present article.


Parole chiave
Keywords

1. Introduzione

In questo articolo presentiamo l’intero progetto di ideazione e realizzazione di un inventario di archivio storico, come esempio di interazione tra l’umanistica digitale e l’editoria accademica.

All’interno del portale Carte d’Autore online promosso dal Centro Studi “Aldo Palazzeschi”, in collaborazione con altri archivi istituzionali, sono presenti dieci archivi che alimentano la piattaforma WCM-Archeotheke1 per oltre 100 fondi e 300 serie archivistiche, per un totale di 80.000 unità documentarie.

A partire da questi dati, si è deciso di produrre un inventario (o una guida) a stampa al fine, da un lato, di documentare il risultato di questa attività di schedatura avvenuta negli anni e, dall’altro, di valorizzare il lavoro effettuato dagli studiosi, lasciando anche uno strumento di consultazione e di accesso ai materiali di archivio. Solitamente, la realizzazione di questi volumi ha una lavorazione editoriale molto lunga e complessa, se svolta con le consuete modalità editoriali, poiché richiede al curatore di trasformare un’informazione in partenza molto strutturata e organizzata su livelli gerarchici in un’uscita per la pubblicazione, con un testo organizzato e strutturato, ma pur sempre sequenziale per la natura stessa del supporto cartaceo su cui viene riprodotto.

Ci sembra opportuno approfondire questo elemento sostanziale, tipico e peculiare del mondo archivistico, che è alla base della schedatura: la descrizione di un archivio è su base gerarchica2, organizzata secondo un numero di livelli di annidamento a piacere, con schede organizzate secondo una struttura per campi molto definita e con una terminologia internazionale ben assestata (Fig. 1).



Fig. 1. La struttura a livelli di descrizione di un archivio (tratto dalla normativa ufficiale ISAD).


Nell’uscita per il volume cartaceo si è quindi optato per il mantenimento di una struttura gerarchica nella visualizzazione delle varie schede, con una differenziazione tra le schede logiche (le schede di livello più alto, tipo fondo, serie, sottoserie, fascicolo, ecc.) e quelle di ultimo livello (Item, dette anche Unità documentarie), a cui corrispondono i materiali fisici conservati negli archivi. Per le prime ci si è limitati all’esposizione dei campi obbligatori previsti dalla normativa ISAD(G) di riferimento, ossia titolo, livello, codice, datazione e consistenza, mentre il soggetto produttore è stato omesso in quanto sempre uguale ed ereditato dall’Archivio Palazzeschi (come indicato nell’introduzione del volume). Si è inoltre data visibilità ai due campi contenuto e ordinamento per le schede di livello superiore, per fornire le rispettive informazioni che poi sono ereditate da tutte le schede sottostanti.

Nella descrizione della singola unità documentaria, invece, sono specificati il codice, il titolo, la tipologia documentaria, lo stato di conservazione (nel caso il manoscritto risultasse danneggiato), la consistenza, la data e l’autore.

2. Il gruppo di lavoro e le scelte generali adottate

Per la realizzazione del progetto, durato complessivamente quattro mesi, è stato costituito un gruppo di lavoro posto sotto la responsabilità scientifica del Prof. Simone Magherini, presidente del Centro Studi “Aldo Palazzeschi” e direttore dell’Archivio. Il gruppo si è composto di professori, ricercatori e tecnici professionisti di varia estrazione e provenienza, coinvolti tutti in un progetto chiamato ad affrontare problematiche tecniche articolate e specifiche, insieme a valutazioni teoriche e generali.

Per l’ideazione del flusso e la messa a punto dell’intera realizzazione del volume, si è stabilito come criterio fondamentale quello dell’individuazione degli standard di riferimento (normativi o pratici, in assenza dei primi). Inoltre, nell’individuazione, nell’assegnazione e nell’esecuzione delle varie fasi di lavoro operative si è sempre data la precedenza alla semplicità e all’efficienza, con l’intento di raggiungere l’obiettivo finale nei tempi concordati.

È esattamente dal criterio fondante del progetto che deriva la prima scelta strategica, ossia quella di utilizzare il principale software di riferimento nel settore dell’impaginazione: Adobe InDesign (InDesign d’ora in avanti). Vista l’intenzione di produrre un volume con uscita PDF accompagnato anche da un’edizione cartacea, InDesign è stato da subito identificato come lo strumento più adatto: trattasi infatti del programma più diffuso e potente nel settore della stampa, con un rapporto qualità-prezzo non paragonabile ad altre soluzioni presenti sul mercato. Partendo da questa scelta, le procedure e le fasi successive sono state predisposte e adattate alle potenzialità e ai limiti individuati nel programma, su cui non è possibile effettuare in alcun modo modifiche o integrazioni.

L’ultimo aspetto che si è tenuto in considerazione è la resa grafica finale. I grafici editoriali hanno avanzato proposte grafiche riguardanti il formato, la scelta dei font e dei caratteri, la gabbia e le formattazioni da applicare al testo, tali da valorizzare i differenti contenuti informativi presenti nel volume, secondo le indicazioni degli archivisti, e infine approvate dai curatori del volume.

3. Articolazione del progetto

Il progetto si è articolato in tre macrofasi: analisi, sviluppo del prototipo e messa in produzione. Queste vengono di seguito descritte a grandi linee, nelle parti comunemente note e con maggiori dettagli in quelle più innovative.


3.1. Analisi iniziale

In questa prima macrofase sono stati coinvolti tutti i partecipanti, con ruoli e tempi diversi, così da acquisire sinergicamente le informazioni su requisiti e le funzionalità da implementare, valutare rischi e benefici, individuare gli standard da seguire, stabilire i blocchi operativi da realizzare e le loro priorità.

Dal punto di vista della gestione dell’informazione – intendiamo qui per informazione l’insieme di dati di partenza che, opportunamente rielaborati, diventano il contenuto della pubblicazione –, il flusso individuato nel corso dell’analisi può essere così riassunto:

  • Fase 1: revisione iniziale

I dati di provenienza sono registrati nel database di schedatura della piattaforma dell’archivio e provengono da attività di schedatura svolte da operatori diversi in tempi diversi (anche nell’arco di alcuni anni talvolta). Con la visualizzazione sul web, scheda per scheda, non era stato semplice sino a quel momento accorgersi di eventuali incongruenze o disomogeneità nella descrizione; questi aspetti invece appaiono molto chiaramente quando si estraggono o si visualizzano più schede una di seguito all’altra, come su una pubblicazione a stampa. Si è quindi deciso di introdurre una prima fase di revisione sistematica di tutte le schede coinvolte nella pubblicazione, partendo dunque dalla scheda Fondo o Serie che le contiene tutte per ricostruirne la sequenza e gli annidamenti per intero.

Per effettuare questa revisione, una volta mappati i campi per ciascuna tipologia di scheda, come indicato in precedenza, si è costruita una query ricorsiva sul database in grado si estrarre i dati richiesti insieme ad altri ritenuti necessari per gli ordinamenti. Nella revisione dei dati, infatti, si è talvolta reso necessario il ricollocamento di qualche scheda, spostata all’interno della struttura logica dell’archivio, al fine di emendare eventuali errori di posizionamento.

L’estrazione è stata effettuata sulla base di un file Excel che ha consentito per l’appunto di ordinare facilmente i blocchi di schede, confrontare fra di loro i dati, correggerli a blocchi con funzioni di trascinamento, ecc. Le attività di correzione, integrazione e verifica sono state svolte dagli archivisti, i quali hanno poi restituito agli informatici il file Excel di lavoro, riportando la correzione dei dati tramite l’aggiornamento diretto del database di schedatura.

Data la loro natura puntuale, altre operazioni di ripulitura e controllo (quali, ad esempio, l’eliminazione di qualche scheda doppia, la modifica in qualche datazione, ecc.) sono state d’altro canto effettuate dagli archivisti al termine della revisione e direttamente dall’interfaccia del programma di schedatura.

  • Fase 2: impaginazione automatica e giro bozze

Questa fase rappresenta il cuore e l’innovazione del progetto, che mette insieme elementi e passaggi altamente automatizzati con un’attività manuale di correzione bozze su un PDF tradizionale. Si tratta di una fase che richiede di essere progettata, dal momento che può essere ripetuta più volte prima che si raggiunga il livello desiderato della qualità dei dati. Nel modello tradizionale di una produzione editoriale, essa corrisponde all’impaginazione e al giro di bozze, anche queste ripetute più volte, di norma, per la realizzazione di un volume di analoga tipologia.

Nello schema sottostante rappresentiamo i passaggi individuati e gli strumenti utilizzati (Fig. 2).



Fig. 2. Il flusso della impaginazione automatica progettato e realizzato, con gli operatori coinvolti.

  • a) estrazione dati in XML

L’informatico lancia sul database dell’archivio la query di estrazione dati ai fini dell’impaginazione, producendo un file XML per il grafico impaginatore.

  • b) impaginazione automatica

L’impaginatore riceve il file XML, lancia gli script di ripulitura di InDesign e importa il file ripulito utilizzando il Template di InDesign, rimappando i tag e creando un file per l’inventario. Da questo file si esporta un PDF per la correzione delle bozze che viene mandato all’autore / curatore del Volume.

  • c) revisione bozze

L’autore e il curatore annotano le modifiche direttamente sul PDF e segnalano eventuali errori e correzioni. L’autore/curatore, o in sua vece l’archivista incaricato, riporta le modifiche e le correzioni utilizzando la piattaforma di schedatura dell’archivio. Inserire le correzioni sempre nel database alla sorgente dei dati estratti della pubblicazione consente di migliorare i dati dell’archivio, così come di effettuare contemporaneamente la correzione necessaria per la pubblicazione. I dati corretti infatti possono essere riestratti e reimpaginati automaticamente, a ripetizione dell’intera fase. Se si intervenisse apportando le correzioni direttamente sul file di InDesign, queste sarebbero apportate dal grafico e non dall’archivista, e quest’ultimo dovrebbe successivamente replicare l’inserimento dei dati.


3.1.1. Le scelte scientifiche ed editoriali

Nella scelta della pubblicazione, si è optato per la realizzazione di un inventario a stampa. Sebbene in archivistica la definizione di cosa sia un inventario sia ben chiara3, ci sono comunque ampi margini sul livello di dettaglio e sulla quantità di informazioni che ciascun elemento inserito deve avere.

Secondo le indicazioni ANAI, sia la Guida che l’Inventario sono definiti come strumenti a corredo di un archivio tali da consentire ai consultatori di rendersi conto dell’articolazione di un archivio ordinato. Sulla base dei criteri che sovraintendono alla loro elaborazione, la Guida è una descrizione sommaria dei fondi conservati presso uno o più archivi di riferimento, con un taglio generale, particolare, tematico, ecc. Si tratta quindi di un elaborato più discorsivo e meno strutturato. Per l’Inventario, invece, viene data una definizione più precisa:

inventario: uno strumento di ricerca, risultato finale dell’attività di descrizione di un fondo o di una sua parte, e delle sue articolazioni interne, fino al livello di fascicolo.”

A volte, tuttavia, l’inventario può essere realizzato ad un livello di analiticità maggiore, che può spingersi fino al livello della singola unità documentaria.

Gli archivisti coinvolti nel gruppo di lavoro hanno dovuto prendere una decisione in tal senso, tenendo anche conto che l’inventario da realizzarsi era in questo caso uno strumento di supporto in formato PDF in aggiunta alla piattaforma digitale accessibile via web, tale da consentire l’accesso completo, gratuito e ricercabile all’intero archivio e a tutti i materiali schedati. La piattaforma stessa è quindi considerata lo strumento principale e privilegiato, mentre l’inventario è pensato per una consultazione offline e per consentire uno sguardo d’insieme.


3.2. Sviluppo del prototipo

L’interazione dell’XML con InDesign è quindi il fulcro dell’intero processo, ma nell’affronto pratico c’è da tenere in considerazione che la documentazione ufficiale è scarsa; inoltre il motore (parser) di importazione del file XML presente in InDesign ha evidenti limiti operativi. Per questo motivo, la messa a punto del tracciato non è stata svolta se non a grandi linee nella fase di analisi, ma è stata riservata alla fase operativa.

Gli informatici e i grafici editoriali hanno lavorato utilizzando molti dei principi descritti nella modalità agile4, facendo esperimenti, studiando soluzioni simili descritte sul web e andando spesso per tentativi. Il principale limite evidenziato dal parser di InDesign risiede nel fatto che esso gestisce strutture XML ad un’unica struttura e un livello unico di annidamento, unitamente al fatto che il supporto degli attributi è davvero limitato.

Ci siamo interrogati sul perché di queste limitazioni in un programma così diffuso e che può contare su molti anni e versioni di aggiornamento. Tenendo conto dell’utilizzo prettamente commerciale del prodotto, a nostro avviso, la gestione XML è stata implementata per l’automazione nella realizzazione di cataloghi prodotti a partire da dati ed immagini estratti da gestionali aziendali. Gli esempi presenti in rete, e anche addirittura la vendita di plugin aggiuntivi e/o di template per la realizzazione di cataloghi strutturati che appunto utilizzano questa funzionalità, ne sono la conferma. In questo scenario commerciale, le funzionalità ridotte del parser non impediscono il raggiungimento dello scopo, in quanto, qualora servissero schede prodotti con strutture differenti, si potrebbero confezionare template diversi. Inoltre, per descrivere una scheda prodotto per un catalogo, contenente anche immagini o dettagli, una struttura ad un unico livello è più che sufficiente.

Nel nostro caso, rappresentato da un archivio con un numero libero di livelli di annidamento e con diverse tipologie di schede che si succedono l’un l’altra, abbiamo dovuto ideare un’estrazione XML che linearizzasse in qualche modo i diversi livelli archivistici, così come una macrostruttura di scheda generica che potesse adattarsi alle diverse tipologie di schede archivistiche: tutto questo proprio per venire incontro ai limiti funzionali del parser di InDesign.

Nella figura sottostante si vede una porzione del file XML estratto dalla procedura, contenente le stesse schede mostrate in seguito nella loro resa tipografica (Fig. 3).



Fig. 3. Una porzione di esempio del contenuto della estrazione XML.


Nella figura sottostante viene riportata invece la porzione di una pagina estratta dal volume, contenente i dati di una scheda Fondo, di una scheda Serie, di una scheda Fascicolo e infine di una scheda unità documentaria dattiloscritta (Fig. 4).



Fig. 4. Una porzione in facsimile di una pagina del PDF finale per la stampa.


3.2.1. La realizzazione del template InDesign per XML

Per importare un file XML all’interno di un documento InDesign è necessario che quest’ultimo venga innanzitutto predisposto ad accogliere dei dati a cui sono applicati dei tag, ordinati su vari livelli di nidificazione. Questo metodo d’impaginazione risulta utile e funzionale quando i dati da impaginare si organizzano in piccole strutture che si ripetono e che, proprio per questo, sono clonabili. La struttura che si ripete può, di volta in volta, contenere più o meno elementi; ciò che conta innanzitutto individuare è l’organizzazione gerarchica che si ripete. Una volta individuata e studiata tale struttura, è possibile riprodurla all’interno di un documento InDesign, impiegando gli stessi tag del documento XML.

I tag possono essere direttamente ricreati uno ad uno nel documento InDesign, o, preferibilmente, caricati dal documento XML: questa seconda opzione è tendenzialmente migliore, perché più veloce ma soprattutto perché in grado di prevenire il rischio di eventuali errori di battitura o dimenticanze.

Da questa premessa si evince che per tale tipo di operazione è importante avere sempre aperte e sott’occhio le due finestre “Struttura” (Visualizza −> Struttura −> Mostra struttura) e “Tag” (Finestra −>Utility −> Tag) di InDesign.

Per la realizzazione, nello specifico, del template di InDesign dell’inventario, si è innanzitutto fatto, con l’aiuto di un’archivista, uno studio sui contenuti e sul rapporto dei vari elementi tra loro, rispetto al posizionamento sulla pagina. Di seguito lo schema previsto dall’analisi iniziale (Fig. 5):



Fig. 5. Indicazioni tipografiche definite dall’archivista.


Da questa traccia si nota che la differenza sostanziale riguarda i paragrafi e il loro rientro sinistro, mentre gli elementi all’interno di ogni paragrafo non presentano differenze di formattazione. Tutti i livelli sono, dunque, assimilabili tra loro a livello di organizzazione e nidificazione, e sono stati trattati come dei contenitori in cui, di volta in volta, potevano essere inseriti o sottratti una serie di elementi. Si considerano come elementi non solo i dati propri dell’archivio, ma tutte le unità concettuali che devono comparire sulla pagina, quindi anche le etichette che li accompagnano e li definiscono, ossia le diciture “titolo”, “consistenza”, “autore” e così via. Ogni elemento compariva, dunque, nell’XML con il proprio tag (Fig. 6).



Fig. 6. Porzione di codice XML di alcune schede.


Come si vede nell’immagine, ogni livello costituisce nell’XML un componente a sé: nella struttura XML si è considerato infatti un generico componente , mantenendo il tag archivistico, all’interno del quale sono stati disposti tutti gli elementi caratterizzanti per l’inventario, indipendentemente dal fatto che questi appartenessero ad una serie, ad un fascicolo o ad un’unità documentaria.

Nelle immagini di seguito si vedono, rispettivamente, la struttura annidata che è stata riprodotta poi in InDesign e la disposizione dei tag sulla pagina. All’interno di ogni tag in InDesign, è stato però inserito, per comodità, un testo segnaposto che, con l’importazione, è stato poi rimpiazzato dal testo XML.

Per vedere con maggiore chiarezza la disposizione degli elementi nei rispettivi tag, è possibile lavorare nell’editor brani di InDesign, anziché direttamente nella pagina del documento. Per inserire un tag è sufficiente selezionare la porzione di testo desiderata e cliccare poi sul tag corrispondente. Nel momento della disposizione dei tag è fondamentale rispettare da un lato i ritorni a capo e, dall’altro, l’ordine di apparizione dei tag. L’ordine che si vede nelle immagini riportate qui di seguito è infatti stato studiato in modo da evitare ogni possibile inversione dei tag, indipendentemente dal livello archivistico (Fig. 7a, 7b, 7c).



Fig. 7a, 7b, 7c. Riquadro “Struttura” (a) template con testi segnaposto e tag (b) editor brani (c) in InDesign.


Nel caso specifico dell’inventario, come si è visto poco sopra, si è scelto di includere ogni livello all’interno di un generico tag, questo proprio perché la questione dell’ordine non riguarda solo gli elementi, ma anche i livelli che fanno loro da contenitore. Nel caso dell’inventario, l’ordine di comparsa di serie, fascicolo e unità documentaria non era prevedibile in modo univoco. Per differenziare tra loro i diversi tipi di livello e assegnare ad ognuno di essi uno stile specifico, si è dunque fatto ricorso all’impiego degli attributi. Dichiarando, infatti, all’inizio di un documento XML il namespace xmlns:aid=“http://ns.adobe.com/AdobeInDesign/4.0/” è infatti possibile associare ai tag l’attributo aid:pstyle; se il valore dell’attributo corrisponde al nome di uno stile di paragrafo presente nel documento InDesign, il contenuto del tag in questione viene trattato come un paragrafo uniforme e lo stile dichiarato viene, durante l’importazione, assegnato automaticamente a tutti gli elementi contenuti all’interno del tag. Questa funzione è dunque stata utile per far sì che ognuno dei diversi tipi di livello potesse ricevere il trattamento grafico previsto.

  • La definizione degli stili

Per definire lo stile di un paragrafo in InDesign è innanzitutto necessario aprire il pannello “Stili di paragrafo” (Finestra −> Stili −> Stili di paragrafo), che si presenta come mostrato nell’immagine qui di seguito (Fig. 8).



Fig. 8. Finestra degli stili di paragrafo.


Per creare un nuovo stile, basta selezionare la voce “Nuovo stile di paragrafo” dal menu a comparsa e definirne le specificità. Nel caso dell’impaginazione di un testo XML, gli stili possono essere preventivamente associati ai tag che strutturano il testo, in modo che ogni elemento riceva il proprio stile al momento dell’importazione.

Gli stili possono essere associati ai tag, tramite la funzione “Mappa tag su stili” senza particolari restrizioni sulla scelta dei nomi per gli stili, anche se una corrispondenza tra il nome dello stile e del tag è sempre preferibile per rendere l’associazione più veloce. Tuttavia, nel momento in cui si fa ricorso all’impiego degli attributi, si rientra in un caso particolare per il quale è necessario che il nome dello stile e il valore dell’attributo siano esattamente uguali, perché l’associazione avviene in automatico sulla base di questa corrispondenza e non viene fatta a monte nella progettazione del template.

Nella fattispecie, sono stati creati tre stili, come si vede nell’immagine sopra, ovvero “u” per unità documentaria, “f” per fascicolo e “s” per serie, che nel file XML si presentano in questo modo (Fig. 9a, 9b, 9c):



Fig. 9a, 9b, 9c. Porzione del file XML che mostra gli attributi utilizzati per identificare il tipo di scheda.


Di seguito, l’immagine del riquadro “Struttura” in InDesign, dopo l’importazione di un documento XML contenente elementi e attributi (Fig. 10):



Fig. 10. Riquadro “Struttura” di InDesign dopo limportazione dellXML.


Come si vede nell’immagine sopra, il riquadro “Struttura” di InDesign si apre sempre con un elemento Root, caratterizzato dal simbolo che si trova sempre al primo posto della gerarchia. Segue il cosiddetto elemento brano, caratterizzato dal simbolo , che corrisponde alla cornice entro cui il brano è inserito; in questo caso si chiama ancora Root perché si è scelto di non alterare il nome del tag XML. Dal momento che questo è l’elemento che racchiude tutto il contenuto del documento, prima dell’importazione, il tag Root, deve essere associato alla cornice di testo principale, che a sua volta contiene tutto il testo in un documento InDesign. Fatta questa operazione, si può selezionare l’elemento brano all’interno del riquadro “Struttura” (come mostrato nell’immagine di seguito) e procedere all’importazione (File −> Importa XML: Fig. 11).


Fig. 11. Riquadro “Struttura” di InDesign prima dellimportazione.


Il template appena mostrato può essere salvato, prima dell’importazione, come modello, selezionando l’opzione .indt al momento di salvare con nome il documento, così da permettere che il template possa essere riutilizzato per altre importazioni future (Fig. 12).



Fig. 12. Finestra di salvataggio.

  • Importazione automatica e impaginazione finale

Al momento invece dell’importazione, InDesign consente di selezionare le “Opzioni di importazione XML”, che vanno selezionate in base alle esigenze specifiche del documento che si vuole creare. Per l’inventario, le opzioni scelte sono visibili nell’immagine seguente (Fig. 13):



Fig. 13. Maschera con le opzioni per limportazione del file XML.


Si segnala, in particolare, il metodo “Unisci contenuti” per importare il testo nei tag segnaposto e l’opzione “Crea collegamento”, grazie alla quale ogni eventuale modifica dell’XML originale viene letta da InDesign e segnalata.

Quando il documento da inserire contiene molti dati, può temporaneamente comparire questa barra di avanzamento (Fig. 14):



Fig. 14. Messaggio di avanzamento durante l’importazione.


Le immagini seguenti mostrano il risultato dell’importazione dell’XML per come esso risulta senza l’apporto di alcuna modifica (Fig. 15).


Fig. 15. Documento di InDesign dopo l’importazione.


È possibile visualizzare il testo anche senza i marcatori (Visualizza −> Struttura −> Nascondi marcatori Tag) e senza le cornici (Visualizza −> Struttura −> Nascondi cornici con Tag); di seguito una pagina a titolo esemplificativo (Fig. 16):



Fig. 16. Documento dopo l’importazione, con cornici e marcatori nascosti.


Ad ogni modo, da entrambi i tipi di visualizzazione si nota che il risultato dell’impaginazione automatica necessita di essere ritoccato. Ad esempio, si possono notare dei ritorni a capo superflui o dei record spezzati tra una pagina e l’altra: sistemare questi aspetti richiede l’intervento manuale del grafico, che agisce però soltanto dopo la validazione definitiva di tutti i dati. Tuttavia, già questa prima importazione fa sì che i livelli ricevano automaticamente l’indentazione e la formattazione corretti, il che velocizza di molto il processo di impaginazione in quanto ne automatizza la parte più consistente.

  • L’impaginazione automatica e la generazione del PDF delle bozze

A lavoro completato è poi possibile esportare il PDF delle bozze a partire dal documento InDesign (File −> Esporta), selezionando tutte le impostazioni desiderate per il documento.



3.3. La messa in produzione

Una volta che i dati estratti dall’archivio sono risultati corretti e completi e si sono completate più iterazioni della fase 2 (effettuando quindi più giri di bozze), abbiamo ottenuto un file di InDesign che è di fatto l’impaginato valido per la pubblicazione (per la parte del contenuto dell’Inventario). A questo punto, e solo a questo punto, è dunque intervenuto il grafico editoriale per le attività legate all’impaginazione manuale, ossia la correzione di tutti i difetti legati ai limiti strutturali dei sistemi di impaginazione automatica, ad esempio l’eliminazione degli “orfani” e delle “vedove”5, piccoli interventi sul kerning6 per ottimizzare lo sviluppo delle righe, formattazioni manuali e applicazione di stili per particolari situazioni.

Per il completamento del volume è stato poi necessario assemblare l’intero volume, utilizzando il template di collana e posizionando tutti gli altri elementi o apparati del volume, ad esempio l’introduzione, il sommario, gli eventuali altri saggi, l’indice e realizzare la copertina. Tutta questa attività, ovviamente, è ben nota nella grafica editoriale e non viene modificata nel flusso che si è descritto nel presente articolo.

Il volume così assemblato nella sua interezza è quindi stato sottoposto ad altri giri di bozze (le correzioni ulteriori sono evidentemente legate agli apparati aggiunti in seguito). Il contenuto estratto dall’archivio era già nella forma corretta e definitiva. Se si fossero trovati altri refusi o errori da correggere, sarebbe stato allora necessario intervenire sia correggendo il testo su InDesign (per liberare l’uscita del libro) sia, successivamente, sui dati d’archivio per correggere gli errori nelle schede d’archivio. Data l’eccezionalità di questi interventi, il dover in questo caso ripetere l’operazione due volte in sistemi differenti non è certamente un problema; non sarebbe conveniente a questo punto effettuare una reimpaginazione automatica, in quanto si perderebbe tutto il lavoro del grafico editoriale di messa a punto e ottimizzazione descritta in precedenza.

4. Vantaggi e svantaggi

Il flusso semiautomatizzato di impaginazione XML-InDesign descritto in questo contributo apporta grandi vantaggi e risparmio di tempo nello svolgimento dei giri di bozze necessari per la realizzazione del volume di un Inventario di Archivio.

Considerando un volume che contenga circa 3000 schede sviluppate su 200 pagine a stampa, l’estrazione dei dati in formato XML impiega un minuto, mentre le procedure di ripulitura in InDesign ne richiedono uno in più; l’importazione sempre in InDesign richiede circa 10 minuti – è il tempo impiegato dal parser per importare e impaginare il file XML nel template, senza intervento dell’impaginatore – e l’esportazione in PDF, ancora un minuto. Ciò vuol dire che, nonostante siano necessari più passaggi nei quali si ricorre a supporti e ambienti operativi differenti, si passa dai dati al PDF in circa quindici minuti.

Il primo vantaggio evidente di tale automatizzazione consiste nel fatto che ciascun collaboratore interviene per svolgere un’attività pertinente alle proprie competenze: il grafico impagina, l’autore/curatore revisiona i dati, l’archivista corregge, mentre nel flusso editoriale tradizionale, al contrario, le correzioni sono apportate dal grafico editoriale il quale non ha normalmente competenze archivistiche. Questo aspetto si rivela sostanziale in quanto, per esempio, la necessità di spostare una o più schede per errori di posizionamento o di ordinamento nei dati, se effettuata dal grafico direttamente in InDesign, porta ad un lavoro non banale di reimpaginazione e a tempi anche lunghi per la predisposizione di una nuova bozza in PDF. Se quest’operazione viene invece effettuata dall’archivista, essa consiste semplicemente nella modifica dell’aggancio alla scheda padre o nella modifica del numero di ordinamento all’interno della scheda; corretto questo, si arriva alla nuova bozza in PDF in circa quindici minuti. Segnaliamo in secondo luogo che le correzioni sono apportate una volta sola e direttamente sulla sorgente primaria che contiene l’informazione completa (il database di schedatura dell’archivio). In questo modo la pubblicazione del volume consente automaticamente di migliorare la qualità dei dati contenuti nell’Archivio.

Un ulteriore vantaggio risiede nel fatto che questo flusso è facilmente estendibile alla predisposizione di altre tipologie di pubblicazioni (ad esempio la Guida) o alla realizzazione di inventari di altre Serie contenenti materiali archivistici differenti: a tal proposito, è in corso di realizzazione la predisposizione dell’Inventario della serie Biblioteca di Palazzeschi (che contiene prevalentemente schede di tipo monografie, periodici e articoli di rivista) e del Carteggio Palazzeschi (che consta, ovviamente, della corrispondenza).

Come ogni soluzione, il flusso descritto in questo contributo ha anche degli svantaggi e dei punti di criticità: innanzitutto, il flusso utilizza un programma commerciale (Adobe InDesign) che, pur essendo lo standard di riferimento nel settore della impaginazione editoriale, non è prevedibile se e come potrà supportare questo processo anche in futuro. La gestione di file XML c’è sempre stata fin dalla prima versione del programma uscita nel 1999, ma non c’è garanzia che il template sviluppato per la versione corrente del prodotto possa funzionare anche per le future versioni. Ci auguriamo semmai che vengano apportate delle migliorie al parser, di modo che si possa avere un controllo maggiore sui dati e sulla resa editoriale con la possibilità di gestire una struttura più articolata del file XML di partenza. Di questo non c’è tuttavia certezza.

Un altro aspetto da tenere in considerazione, qualora si volesse adottare un flusso come quello descritto nel presente articolo, è che l’intero processo ha comunque una barriera d’ingresso notevole: occorre infatti partire da dati archivistici organizzati secondo standard internazionali e gli incaricati della pubblicazione devono inoltre possedere discrete competenze di XML e InDesign per riuscire a personalizzare le procedure e ottenere un risultato finale paragonabile a quello ottenuto con un flusso di impaginazione tradizionale.

Note
Informazioni
Cita come: Arianna Marini e Giovanni Salucci, Flusso XML e InDesign per la realizzazione di edizioni digitali nelle Humanities in DILEF. Rivista digitale del Dipartimento di Lettere e Filosofia - 1 (2022), pp. 147-168. 10.35948/DILEF/2022.3295
Condivisione della ricerca
Contenuto in: