Risultati per " lessicografia"

Il contributo, che si inserisce in una ricerca più ampia sulle marche diasistematiche nella lessicografia italiana otto-novecentesca, intende proporre un primo studio sull’uso in particolare di marche di tipo diafasico/diastratico nella quinta impressione del Vocabolario della Crusca. Questo tratto microstrutturale può essere infatti foriero di informazioni e indicazioni importanti sia per collocare, anche storicamente, una parola, una sua accezione o una locuzione nel suo appropriato livello di varietà della lingua, sia anche per approfondire la conoscenza delle idee linguistiche che sono alla base di un’opera lessicografica.


The essay, which is part of a broader research on diasystematic labels in 19th-20th century Italian lexicography, intends to propose an initial study on the use of diaphasic/diastratic labels in the fifth edition of the Vocabolario della Crusca. This microstructural trait can in fact offer important information and indications both for placing, also from a historical point of view, a word, its meaning or a locution in its appropriate level of linguistic variation, and also for getting to know the linguistic ideas behind a certain lexicographic work.


Nei progetti lessicografici digitali viene consigliato di utilizzare gli Identificatori persistenti. In questo contributo si esplora l’opportunità di utilizzare il DOI (Digital Object Identifier) come strumento per la diffusione e promozione di un progetto lessicografico digitale, usando Crossref come agenzia di registrazione. Occorre registrare una serie di DOI, in corrispondenza dei vari livelli gerarchici con cui la banca-dati lessicografica è organizzata, prevedendo la compilazione di metadati di qualità e ricchi di informazioni, con l’obiettivo di identificare il sistema più ampio di metadati che possa favorire la diffusione del progetto e massimizzarne l’impatto.

Nell’articolo viene quindi analizzato in dettaglio il tracciato di registrazione del DOI, mettendo in evidenza le informazioni necessarie e consigliate per la diffusione, esemplificando come collocarle nel sistema di tag previsti dallo schema di registrazione.

 

In digital lexicographic projects, the use of persistent identifiers is recommended. This contribution explores the opportunity to adopt Digital Object Identifiers (DOIs) as a tool for the dissemination and promotion of a digital lexicographic project, utilizing Crossref as the registration agency. To achieve maximum dissemination, a series of DOIs need to be registered, corresponding to the various hierarchical levels through which the lexicon database is organized. This necessitates the compilation of high-quality metadata that is rich in information.

This article provides a detailed analysis of the DOI registration process, highlighting the necessary and recommended information for dissemination. It exemplifies how to incorporate this information into the tag system specified by the registration schema.


Tra le novità del Vocabolario Dantesco spicca l'apertura del suo lemmario alla varia lectio testimoniata dalla ricca e complessa tradizione del poema. Il contributo si sofferma sul trattamento lessicografico di tale particolare materiale lessicale, mettendone a fuoco i criteri, i problemi metodologici e i risultati in acquisizione (anche alla luce del recente finanziamento PRIN, specificamente inteso alla valorizzazione della lezioni alternative lessicalmente rilevanti). Si discutono inoltre, come casi esemplari, le voci imbiancare (Purg. IX 2) e appulcrare (Inf. VII 60), con le relative varianti.

 

The Vocabolario Dantesco also considers, within its lemmarium, the words that come from the varia lectio of the poem, so rich and complex. The essay focuses on the innovative lexicographic treatment of this particular lexical material, focusing on the criteria, the methodological problems and the first results (also in light of the recent PRIN funding, specifically aimed at enhancing lexically relevant alternative lessons). The essay also discusses, as exemplary cases, the entries imbiancare (Purg. IX 2) and appulcrare (Inf. VII 60), with their relative variants.


L’articolo prende le mosse da una delle principali criticità che rendono piuttosto lenta e complessa l’informatizzazione delle risorse lessicali e lessicografiche: il mark-up manuale in XML-TEI. Accanto agli indubbi vantaggi offerti dalle versioni elettroniche – in primis l’accessibilità e la valorizzazione delle risorse – la conversione dei dizionari di seconda generazione (specialmente quelli di secondo livello, che prevedono l’informatizzazione del testo e della sua struttura) si rivela spesso onerosa in termini di tempo e risorse.

A partire da questa premessa, la ricerca propone un approccio sperimentale che prevede l’impiego dell’intelligenza artificiale – nello specifico ChatGPT – per marcare i testi in XML-TEI in modo semiautomatico: dopo una fase preliminare di formalizzazione del testo (il cosiddetto file pre-markup), orientata all’individuazione di pattern ricorrenti, il modello viene guidato attraverso istruzioni mirate per generare file .xml conformi alle linee guida TEI, con l’obiettivo di ottenere risultati di livello medio-alto pur riducendo significativamente i tempi di lavorazione, e favorire così la sostenibilità di progetti di lessicografia elettronica su larga scala.

 

This paper starts from one of the main critical issues that slow down and complicate the computerizing lexical and lexicographic resources: manual XML-TEI markup. Alongside the undeniable advantages offered by electronic versions – notably in terms of accessibility and resources enhancement – the conversion of retro-digitized dictionaries (especially second-level dictionaries, which involve the digital encoding of both the text and its internal structure) often proves time-consuming and resource-intensive.

Building on this premise, the study proposes an experimental approach involving the use of artificial intelligence – specifically ChatGPT – to perform semi-automatic XML-TEI markup. Following a preliminary phase of text formalization (the so-called pre-markup file), aimed at identifying recurring structural patterns, the model is guided through targeted instructions to generate .xml files compliant with TEI guidelines. The ultimate goal is to produce medium-to-high quality outputs while significantly reducing processing time, thereby promoting the sustainability of large-scale electronic lexicography projects.