Risultati per " electronic lexicography"

L’articolo prende le mosse da una delle principali criticità che rendono piuttosto lenta e complessa l’informatizzazione delle risorse lessicali e lessicografiche: il mark-up manuale in XML-TEI. Accanto agli indubbi vantaggi offerti dalle versioni elettroniche – in primis l’accessibilità e la valorizzazione delle risorse – la conversione dei dizionari di seconda generazione (specialmente quelli di secondo livello, che prevedono l’informatizzazione del testo e della sua struttura) si rivela spesso onerosa in termini di tempo e risorse.

A partire da questa premessa, la ricerca propone un approccio sperimentale che prevede l’impiego dell’intelligenza artificiale – nello specifico ChatGPT – per marcare i testi in XML-TEI in modo semiautomatico: dopo una fase preliminare di formalizzazione del testo (il cosiddetto file pre-markup), orientata all’individuazione di pattern ricorrenti, il modello viene guidato attraverso istruzioni mirate per generare file .xml conformi alle linee guida TEI, con l’obiettivo di ottenere risultati di livello medio-alto pur riducendo significativamente i tempi di lavorazione, e favorire così la sostenibilità di progetti di lessicografia elettronica su larga scala.

 

This paper starts from one of the main critical issues that slow down and complicate the computerizing lexical and lexicographic resources: manual XML-TEI markup. Alongside the undeniable advantages offered by electronic versions – notably in terms of accessibility and resources enhancement – the conversion of retro-digitized dictionaries (especially second-level dictionaries, which involve the digital encoding of both the text and its internal structure) often proves time-consuming and resource-intensive.

Building on this premise, the study proposes an experimental approach involving the use of artificial intelligence – specifically ChatGPT – to perform semi-automatic XML-TEI markup. Following a preliminary phase of text formalization (the so-called pre-markup file), aimed at identifying recurring structural patterns, the model is guided through targeted instructions to generate .xml files compliant with TEI guidelines. The ultimate goal is to produce medium-to-high quality outputs while significantly reducing processing time, thereby promoting the sustainability of large-scale electronic lexicography projects.


Il Centro di Studi «Aldo Palazzeschi» ha promosso un progetto finalizzato alla pubblicazione in rete di inventari del materiale palazzeschiano tramite un processo innovativo che ha origine dai dati archivistici della piattaforma di schedatura. La pubblicazione è il frutto di un flusso di lavoro che ha previsto l’esportazione dei dati del programma d’archivio, basati sullo standard ISAD (International Standard Archival Description), nel nuovo modello dati EAD (Encoded Archival Description) che definisce la codifica elettronica in formato XML dei record di descrizione archivistica. Partendo da un’analisi approfondita della struttura archivistica del fondo Palazzeschi, sono stati progettati dei tracciati XML con l’obiettivo di estrapolare, in maniera organizzata, dati specifici contenuti nel Fondo. I tracciati sono stati la base di partenza di un lavoro editoriale multifase che mira alla pubblicazione in Open Access degli inventari dei manoscritti di Palazzeschi e della biblioteca palazzeschiana.


Study Center «Aldo Palazzeschi» has promoted a project for the purpose of the online publication of inventories of Palazzeschi's material through an innovative process that originates from the archival data of the cataloguing platform. The publication is the result of a workflow which involved exporting the archive program data, based on the ISAD (International Standard Archival Description) standard, into the new EAD (Encoded Archival Description) data model which defines the electronic coding in XML format of archival description records. Starting from an in-depth analysis of the archival structure of the Palazzeschi Fund, XML paths were designed with the aim of extrapolating, in an organized way, specific data contained in the Fund. XML paths were the starting point of a multi-phase editorial work in order to the Open Access publication of the inventories of Palazzeschi's manuscripts and the Palazzeschi’s library.



Il contributo, che si inserisce in una ricerca più ampia sulle marche diasistematiche nella lessicografia italiana otto-novecentesca, intende proporre un primo studio sull’uso in particolare di marche di tipo diafasico/diastratico nella quinta impressione del Vocabolario della Crusca. Questo tratto microstrutturale può essere infatti foriero di informazioni e indicazioni importanti sia per collocare, anche storicamente, una parola, una sua accezione o una locuzione nel suo appropriato livello di varietà della lingua, sia anche per approfondire la conoscenza delle idee linguistiche che sono alla base di un’opera lessicografica.


The essay, which is part of a broader research on diasystematic labels in 19th-20th century Italian lexicography, intends to propose an initial study on the use of diaphasic/diastratic labels in the fifth edition of the Vocabolario della Crusca. This microstructural trait can in fact offer important information and indications both for placing, also from a historical point of view, a word, its meaning or a locution in its appropriate level of linguistic variation, and also for getting to know the linguistic ideas behind a certain lexicographic work.