In principio fu la Bibbia: il primo testo a essere trasformato in concordanze, cioè in un elenco alfabetico di tutte le parole usate al suo interno, ciascuna accompagnata dall’indicazione dei luoghi in cui compare e da una lista di brevi contesti.

concordanze2

 

Anche negli studi letterari sono stati prodotti numerosi repertori di concordanze: strumenti utili non solo per avere informazioni quantitative sulle parole (come la frequenza con cui una parola ricorre in una certa opera o in un certo autore), ma anche qualitative: l’osservazione dei diversi contesti con la parola-chiave al centro permette infatti di osservarne le regolarità grammaticali e le solidarietà lessicali. Sfogliando online le concordanze dei Promessi sposi (edizione Èulogos IntraText), per esempio, si può scoprire non solo quali fossero le parole predilette da Manzoni all’interno del romanzo, ma anche come amasse combinarle. È possibile anche fare ricerche di squisito interesse linguistico: è noto per esempio che Manzoni cambiò i pronomi soggetto egli in lui nel passaggio dalla ventisettana alla quarantana. In quest’ultima edizione i lui risultano in complesso 557 (non tutti necessariamente usati in funzione di soggetto) a fronte di 64 egli: l’esame dei contesti permette di valutare, caso per caso, le ragioni della scelta, legata magari all’alternanza dialogo/narrazione, oppure ai diversi registri linguistici.
Se poi vogliamo fare ricerche sull’italiano contemporaneo, possiamo ricorrere a uno dei corpora disponibili online: si tratta di grandi raccolte di testi in formato elettronico interrogabili attraverso software che producono automaticamente concordanze nel formato KWIC (Key-Word In Context).
Per l’italiano scritto possiamo interrogare il CoLFIS (Corpus e Lessico di Frequenza dell’Italiano Scritto del CNR), che raccoglie quotidiani, periodici e libri, per un totale di più di 3 milioni di occorrenze lessicali (un romanzo come quello di Manzoni ne contiene poco più di 200.000…). Il corpus è interrogabile sia nella versione lemmatizzata (in cui, come nel dizionario, si cercano lemmi a cui possono corrispondere forme diverse della parola: es. amare) sia in quella non lemmatizzata (in cui si può cercare una forma di parola specifica, come amiamo).
Un altro corpus di riferimento per l’italiano scritto contemporaneo è il CORIS (Corpus dell’Italiano Scritto dell’Università di Bologna), una raccolta di 130 milioni di parole, articolata in sezioni o sottocorpora (stampa, narrativa, prosa accademica, prosa giuridico-amministrativa ecc.) interrogabili anche separatamente nella versione dinamica del corpus (CODIS). Si potrà così trovare evidenza statistica della sopravvivenza del pronome egli nelle diverse tipologie testuali dell’italiano scritto contemporaneo.
Se poi siamo curiosi di sapere che ne è di egli nell’italiano parlato contemporaneo, notoriamente più aperto alle innovazioni e semplificazioni morfosintattiche, potremo interrogare un altro corpus online ad accesso libero e gratuito (come i precedenti, del resto): si tratta del LIP, il Lessico di frequenza dell’Italiano Parlato di Tullio De Mauro e altri, ora interrogabile sul sito del BADIP (Banca Dati dell’Italiano Parlato).
Alcuni software di interrogazione dei corpora elettronici (come il CORIS) consentono anche di ottenere dati statistici sulle collocazioni, ovvero sulle parole che si trovano più spesso in combinazione con la parola ricercata. Sulla base di informazioni di questo tipo, negli ultimi anni sono stati elaborati dizionari combinatori (o delle combinazioni lessicali) che, partendo da una lista alfabetica di parole-base (sostantivi, verbi, avverbi), consentono di trovare le parole che con la base formano una combinazione frequente o consolidata dall’uso (una collocazione, appunto). Si tratta di strumenti che, più ancora dei dizionari dei sinonimi e dei contrari, permettono di migliorare le abilità di scrittura perché consentono di trovare le parole più appropriate da collocare accanto a una determinata parola: si potrà così scoprire che una discussione si può imbastire o intavolare ma non sollevare; che inforcare si dice, oltre che degli occhiali, solo del fieno o di una moto, e così via.
Pubblicati in formato cartaceo, possono essere sfogliati, almeno parzialmente, online: si tratta del Dizionario delle Combinazioni Lessicali di Francesco Urzì (Convivium, 2009, che offre un estratto) e del Dizionario Combinatorio Italiano di Vincenzo Lo Cascio (John Benjamins, 2011, disponibile in anteprima su Google books).

Cristiana De Santis

Ricercatrice di Linguistica italiana presso l’Università di Bologna (sede di Forlì). È coautrice della grammatica Sistema e testo (Loescher, 2011).

 
Segui La Ricerca
ultimi tweet

Logo Loescher