ISSN 1122 - 1917
L’ANALISI
LINGUISTICA E LETTERARIA
FACOLTÀ DI SCIENZE LINGUISTICHE E LETTERATURE STRANIERE
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
2
ANNO XXVI 2018
EDUCATT - UNIVERSITÀ CATTOLICA DEL SACRO CUORE
L’ANALISI
LINGUISTICA E LETTERARIA
FACOLTÀ DI SCIENZE LINGUISTICHE
E LETTERATURE STRANIERE
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
2
ANNO XXVI 2018
PUBBLICAZIONE QUADRIMESTRALE
L’ANALISI LINGUISTICA E LETTERARIA
Facoltà di Scienze Linguistiche e Letterature Straniere
Università Cattolica del Sacro Cuore
Anno XXVI - 2/2018
ISSN 1122-1917
ISBN 978-88-9335-391-5
Comitato Editoriale
Giovanni Gobber, Direttore
Maria Luisa Maggioni, Direttore
Lucia Mor, Direttore
Marisa Verna, Direttore
Sarah Bigi
Elisa Bolchi
Alessandro Gamba
Giulia Grata
Esperti internazionali
Thomas Austenfeld, Université de Fribourg
Michael D. Aeschliman, Boston University, MA, USA
Elena Agazzi, Università degli Studi di Bergamo
Stefano Arduini, Università degli Studi di Urbino
György Domokos, Pázmány Péter Katolikus Egyetem
Hans Drumbl, Libera Università di Bolzano
Jacques Dürrenmatt, Sorbonne Université
Françoise Gaillard, Université de Paris VII
Artur Gałkowski, Uniwersytet Łódzki
Loretta Innocenti, Università Ca’ Foscari di Venezia
Vincenzo Orioles, Università degli Studi di Udine
Gilles Philippe. Université de Lausanne
Peter Platt, Barnard College, Columbia University, NY, USA
Andrea Rocci, Università della Svizzera italiana
Eddo Rigotti, Università degli Svizzera italiana
Nikola Rossbach, Universität Kassel
Michael Rossington, Newcastle University, UK
Giuseppe Sertoli, Università degli Studi di Genova
William Sharpe, Barnard College, Columbia University, NY, USA
Thomas Travisano, Hartwick College, NY, USA
Anna Torti, Università degli Studi di Perugia
Gisèle Vanhese, Università della Calabria
I contributi di questa pubblicazione sono stati sottoposti
alla valutazione di due Peer Reviewers in forma rigorosamente anonima
© 2018 EDUCatt - Ente per il Diritto allo Studio universitario dell’Università Cattolica
Largo Gemelli 1, 20123 Milano | tel. 02.7234.2235 | fax 02.80.53.215
e-mail: editoriale.dsu@educatt.it (produzione); librario.dsu@educatt.it (distribuzione)
web: www.educatt.it/libri
Redazione della Rivista: redazione.all@unicatt.it | web: www.analisilinguisticaeletteraria.eu
Questo volume è stato stampato nel mese di settembre 2018
presso la Litografia Solari - Peschiera Borromeo (Milano)
Indice
Metafora e ideologia in Hamlet: il discorso mercantilista
Renato Rizzoli
Esotismo, antischiavismo, colonialismo: Adventures in Borneo di Catherine Gore
Luca Brezzo
“La parola di un uomo onesto significa ciò che dice”
Romano Guardini lettore di Rilke.
Lucia Mor
La narrazione lecléziana e il pluralismo dei procedimenti espressivi
Marilena Genovese
Come scrivono i politici italiani su Facebook
Appunti per un’analisi linguistica comparativa
Yahis Martari
5
29
45
67
81
La corpus revolution russa e il corpus parallelo italiano-russo:
storia, criteri di compilazione e usi
Valentina Noseda
115
The Home of the Brave. Sezione monografica a cura di G. Segato
Hard, Stoic, Isolate, and a Killer. Appunti sul carattere americano
Giulio Segato
133
A Man of Honor. Note sulle origini dell’eroe del romanzo poliziesco americano
Giulio Segato
137
Eroismo e femminile, un binomio difficile: il caso di Margaret Fuller
Anna De Biasio
145
“Una silenziosa litania operaia”. L’America di Carl Sandburg
Franco Lonati
155
Recensioni
165
l’analisi linguistica e letteraria xxvi (2018) 115-132
La corpus revolution russa e il corpus parallelo
italiano-russo
Valentina Noseda
Il presente contributo ha lo scopo di presentare il corpus parallelo italiano-russo, ampliato nel
2015 e ora disponibile all’interno del Corpus Nazionale della Lingua russa (Nacional’nyj Korpus
Russkogo Jazyka). In particolare, nel saggio si descrivono la storia, i criteri di progettazione, le
fasi di compilazione e le potenzialità offerte da questo strumento per gli studi linguistico-letterari della slavistica italiana.
This paper aims at presenting the Italian-Russian parallel corpus, expanded in 2015 and now
available within the Russian National Corpus (Nacional’nyj Korpus Russkogo Jazyka). In particular, the paper describes the history, the design criteria, the phases of construction and the
potential offered by this tool for language and literary studies in the field of Italian Slavistics.
Keywords: Corpus linguistics, parallel corpora, corpus design, contrastive linguistics, applied
linguistics
1. Introduzione
La cosiddetta corpus revolution, segnalata all’attenzione della comunità scientifica all’inizio
degli anni Novanta1, rappresenta l’esito dello sviluppo tecnologico sugli studi linguistici,
iniziato in Inghilterra già negli anni Sessanta. Proprio in quegli anni la riflessione metodologica sul modo di studiare una lingua ha determinato la nascita della Linguistica dei
Corpora (LC), che definiremo qui come un approccio2 adottato nell’analisi linguistica e
basato sull’osservazione dei dati empirici estrapolati da uno o più corpora elettronici3.
Questo modo di trattare il dato linguistico deriva da una base teorica ben precisa, formulata in particolar modo da J.R. Firth4, M. Halliday e J. Sinclair, in parte in contrapposiM. Rundell – P. Stock, The corpus revolution, “English Today”, 8, 1992, 3, pp. 21-32.
Vige tuttora un dibattito sullo status della LC, considerata da alcuni semplicemente come un metodo e da
altri, in particolare dai linguisti legati alla corrente Neo-Firthiana, come una disciplina a se stante (G. Gilquin,
Corpus, Cognition and Causative Constructions, John Benjamins, Amsterdam/Philadelphia 2010, pp. 5-6; T.
McEnery – A. Hardy, Corpus Linguistics. Method, Theory and Practice, Cambridge University Press, New York
2012, pp. 1-147).
3
Un corpus, a sua volta, è definibile come un insieme di testi, selezionati secondo precisi criteri, raccolti su un
portale e consultabili grazie a un software di interrogazione.
4
Si ricorda la celebre affermazione di Firth “you shall know a word by the company it keeps”, con la quale il
linguista voleva sottolineare l’importanza del contesto per comprendere il senso di una data parola ( J.R. Firth,
Papers in linguistics 1934-1951, Oxford University Press, London 1957, p. 11).
1
2
116
Valentina Noseda
zione ad un’altra corrente sorta nello stesso periodo: il generativismo di Noam Chomsky5.
Si può addirittura affermare che la LC si sia sviluppata e consolidata proprio grazie al dibattito con i generativisti, che basano le loro riflessioni e lo studio della lingua esclusivamente
sull’intuizione dei parlanti nativi e sull’osservazione di esempi inventati6. La LC, al contrario, ha dimostrato, da un lato, che solo un’analisi supportata da esempi di lingua autentica
può riflettere l’uso effettivo di una lingua, e, dall’altro, che l’intuizione dei parlanti spesso è
insufficiente per individuare e comprendere a fondo tutti i fenomeni linguistici.
Riassumiamo dunque brevemente i principi su cui si fonda la LC e che hanno contribuito a ridefinire la descrizione linguistica tradizionale: i) la linguistica è una scienza
sociale e applicata; ii) lo studio della lingua deve basarsi su esempi autentici; iii) il linguista
dovrebbe considerare intere porzioni di testo inserite in un contesto specifico e non proposizioni, sintagmi o parole isolate; iv) è bene che i testi siano confrontati tra loro per mezzo
di corpora compilati con criterio; v) la classica concezione dualistica tra forma e significato7
è superata a favore di una teoria linguistica che considera forma e significato inseparabili, e
la LC è in grado di fare luce su questa connessione8.
A partire dagli anni Sessanta, vengono quindi creati i primi corpora elettronici, tra cui
il Brown Corpus e il LOB Corpus, e poco più tardi, presso l’Università di Birmingham,
in particolare grazie al contributo di John Sinclair, nascono i primi dizionari e le prime
grammatiche corpus-based, quali la Cobuild English Grammar9 e il Cobuild Dictionary of
Idioms10. Nei decenni successivi la LC si sviluppa considerevolmente arrivando a coprire un
gran numero di lingue. In Italia si considerano gli anni Novanta come periodo di diffusione di questo approccio, in particolare con la compilazione del PIXI Corpus, un corpus di
lingua parlata in italiano e inglese11, mentre in Russia la corpus revolution approda all’inizio
del nuovo millennio, con l’apertura del Corpus Nazionale della Lingua Russa (Nacional’nyj
Korpus Russkogo Jazyka – NKRJa)12. Negli ultimi 15 anni, grazie al rapido ampliamento e
sviluppo del NKRJa, la LC russa ha recuperato alcune tappe importanti: sempre più dizio-
Cfr. N. Chomsky, Syntactic Structures, Mouton, The Hague 1957.
T. McEnery – A. Wilson, Corpus Linguistics, Edinburgh University Press, Edinburgh 2001.
7
Si veda la distinzione saussuriana tra signifiant e signifié, abbracciata anche da Chomsky, secondo il quale
grammatica e significato sono indipendenti ( J. Sinclair, Trust the Text. Language, corpus and discourse, Routledge, London/New York 2004, p. 2).
8
M. Stubbs, Text and Corpus Analysis, Blackwell, Oxford 1996, pp. 23-28; S. Johannson, On the role of corpora
in cross-linguistic research, in Corpora and Cross-linguistic Research: Theory, Method and Case Studies, S. Johansson – S. Oksefjell ed., Rodopi, Amsterdam/Atalanta 1998, pp. 3-24.
9
J. Sinclair et al., Collins Cobuild English Grammar, HarperCollins, London 1990.
10
J. Sinclair et al., Collins Cobuild Dictionary of Idioms, HarperCollins, London 1995.
11
M.T. Prat Zagrebelsky, L’introduzione della corpus linguistics o linguistica dei corpora nelle università italiane:
una ricostruzione ‘personale’ dagli anni ’60 a oggi, “Quaderni del CIRSIL”, 4, 2005, www.lingue.unibo.it /cirsil
(ultima consultazione gennaio 2017).
12
Per un quadro più esaustivo sulle caratteristiche e le applicazioni del NKRJa, cfr. i contributi raccolti in Nacional’nyj korpus russkogo jazyka: 2006-2008. Novye rezul’taty i perspektivy, V.A. Plungjan ed., Nestor-Istorija,
Sankt-Peterburg 2009.
5
6
La corpus revolution russa e il corpus parallelo italiano-russo
117
nari vengono compilati sulla base del NKRJa13 e nasce la Korpusnaja grammatika, con lo
scopo di descrivere parte della grammatica russa in base ai dati del NKRJa14. Infine, sebbene
quest’ultimo rimanga lo strumento favorito dai russisti per le ricerche corpus-based, nuovi
web-corpora15 della lingua russa hanno fatto gradualmente la loro comparsa: citiamo, ad
esempio, RuTenTen o i corpora dell’Aranea family16.
In questo quadro, alla fine degli anni Novanta, comincia a diffondersi, inizialmente in
area anglosassone, anche la cosiddetta parallel corpus linguistics17 che grazie all’uso dei corpora paralleli18 applica i principi sopraelencati all’analisi contrastiva tra le lingue. Sebbene
la compilazione dei corpora paralleli risulti più lunga e difficoltosa, e nonostante lo scetticismo inziale di alcuni studiosi, riluttanti ad inserire nei corpora testi tradotti19, è ormai
innegabile che i corpora paralleli, seppur con qualche limite20, svolgano una funzione fondamentale nella didattica di una L2, negli studi sulla traduzione umana e automatica e in
numerosi ambiti della ricerca linguistica21, in chiave contrastiva e non solo. Anna Zaliznjak
Al link http://dict.ruslang.ru/ (ultima consultazione: 19 gennaio 2018) sono disponibili i primi dizionari
compilati interamente sulla base del NKRJa: E.A. Grišina – O.N. Ljaševskaja, Grammatičeskij Slovar’ novych
slov russkogo jazyka, 2008; O.N. Ljaševskaja – S.A. Šarov, Novyj Častotnyj slovar’ russkoj leksiki, 2008; G.I. Kustova, Slovar’ russkoj idiomatiki. Sočetanija slov so značeniem vysokoj stepeni, 2008; O.L. Burjuk – V.Ju. Gusev
– E.Ju. Kalinina, Slovar’ glagol’noj sočetaemosti nepredmetnych imen russkogo jazyka, 2008.
14
La grammatica è consultabile interamente online al link http://rusgram.ru/ (ultima consultazione: 19 gennaio 2018).
15
I web-corpora sono ingenti risorse elettroniche formate da testi estratti in maniera automatica da internet.
16
Cfr. V. Benko – V.P. Zacharov, Very large Russian corpora: new opportunities and new challenges, “Dialog”, 15,
2016, pp. 83-98.
17
L. Borin, … And never the twain shall meet?, in Parallel corpora, parallel worlds. Selected papers from a symposium on parallel and comparable corpora at Uppsala University, Sweden, 22-23 April 1999, L. Borin ed., Rodopi,
Amsterdam/New York, pp. 1-43.
18
Raccolte di testi originali in una lingua (Source Language), allineati – generalmente a livello di frase – con le
rispettive traduzioni in una o più lingue diverse (Target Language) (cfr. S. Gandin, Linguistica dei corpora e traduzione: definizioni, criteri di compilazione e implicazioni di ricerca dei corpora paralleli, “Annali della Facoltà.
Università degli Studi di Sassari”, 5, 2009, pp. 133-152).
19
Come accenneremo anche nel paragrafo 2, le traduzioni sono spesso influenzate dal testo fonte e sono caratterizzate da proprietà universali (universali traduttivi) che le rendono un tipo di testo a sé stante. Ciò ha fatto sì
che molti linguisti escludessero inizialmente la possibilità di condurre analisi contrastive sulla base dei corpora
paralleli (cfr. M. Olohan, Introducing Corpora in Translation Studies, Routledge, London/New York 2004, p.
13; R. von Waldenfels, Polish tea is Czech coffee: advantages and pitfalls in using a parallel corpus in linguistic research, in Methods in contemporary Linguistics, A. Ender – A. Leemann – B. Wälchli ed., Mouton/De Gruyter,
Berlin 2012 (Trends in Linguistics, 247), pp. 263-281; F. Zanettin, Translation-driven corpora, Routledge, New
York 2012, p. 12). Tuttavia, come spiegheremo nel secondo paragrafo, è possibile ovviare a questo problema
disponendo di un corpus parallelo bi-direzionale.
20
Oltre ai problemi sopra accennati, relativi all’influsso del testo fonte e agli universali della traduzione, R. von
Waldenfels cita anche la questione della non equivalenza di significato nel passaggio da L1 a L2 e della libera
interpretazione di cui ogni traduttore può avvalersi nel produrre un testo di arrivo: “translation is a creative
process of language production like others. There are more than one way to say and conceptualize things” (R.
von Waldenfels, Polish tea is Czech coffee, p.).
21
Si vedano, a questo proposito, M. Baker, Corpus Linguistics and Translation Studies. Implications and Applications, in Text and technology. In honour of John Sinclair, M. Baker – G. Francis – E. Tognini-Bonelli ed., John
Benjamins, Philadelphia/Amsterdam 1993, pp. 233-250; S. Granger, The corpus approach: a common way for13
118
Valentina Noseda
e Aleksej Šmelev22, infatti, dimostrano come i corpora paralleli possano essere impiegati,
oltre che a scopi contrastivi, per individuare cioè le differenze tra due lingue, anche per
approfondire la semantica di date unità linguospecifiche di una lingua di interesse23.
In russistica i primi corpora paralleli compaiono nel 2005, quando all’interno del
NKRJa viene creato il corpus parallelo russo-inglese, che al momento conta più di 20 milioni di parole. Con il tempo la sezione dei corpora paralleli si è ampliata notevolmente
arrivando a contare 15 coppie di lingue24, tra cui quella russo-italiano.
Nel contesto sopra accennato si inserisce dunque il presente saggio; avendo infatti partecipato, insieme ad altri, all’ampliamento del corpus parallelo italiano-russo (CP ita-ru)
presente oggi nel NKRJa, vogliamo qui descriverne lo stato dell’arte e le prospettive future, illustrando i criteri e i procedimenti adottati per la sua compilazione. Evidenzieremo
inoltre le possibilità di ricerca che questo innovativo strumento offre agli studi contrastivi
linguistico-letterari della slavistica italiana.
Il CP ita-ru nasce come esperimento pilota pochi anni dopo il Corpus Nazionale della
Lingua Russa (aperto alla pubblica consultazione nel 2004): in tutto cinque testi – tre
originali italiani con la traduzione russa e due originali russi con la traduzione italiana25 –,
per un totale di sole 706.246 parole26. Il corpus presentava evidenti lacune che lo rendevano
inadatto ad essere uno strumento di ricerca sia per l’esiguo numero di parole e di testi, sia
per il suo carattere non sistematico, ossia l’assenza di chiari e dichiarati criteri di progettazione e costruzione27.
ward for contrastive Linguistics and Translation Studies?, in Corpus-based Approaches to Contrastive Linguistics
and Translation Studies, S. Granger – J. Lerot – S. Petch-Tyson ed., Rodopi, Amsterdam/New York 2003, pp.
17-29; S. Johansson, Contrastive linguistics and corpora, in Corpus-based Approaches to Contrastive Linguistics
and Translation Studies, S. Granger – J. Lerot – S. Petch-Tyson ed., Rodopi, Amsterdam/New York 2003, pp.
31-45.
22
A.A. Zaliznjak, Lingvospecifičnye edinicy russkogo jazyka v svete kontrastivnogo analiza, “Dialog”, 14, 2015,
1, pp. 683-695; A.D. Šmelev – A.A. Zaliznjak, Reversivnyj perevod kak instrument lingvističeskogo analiza,
“Dialog”, 16, 2017, 2, pp. 394-406.
23
Particolarmente efficace è il metodo della “traduzione inversa” impiegato dai due autori, che sfrutta le traduzioni russe di testi originali in inglese o francese per analizzare quali elementi della lingua di partenza stimolano
l’uso della struttura linguistica indagata nella lingua d’arrivo (in questo caso il russo). Esempi di questo tipo si
trovano anche in linguistica inglese. Cfr. ad esempio, D. Noël, Translation as evidence for semantics: an illustration, “Linguistics”, 41, 2003, 4, pp. 757-785.
24
Tutti i corpora paralleli del NKRJa sono disponibili a questo link: http://ruscorpora.ru/search-para-en.html
(ultima consultazione: 21 gennaio 2018).
25
M.A. Bulgakov, Master i Margarita (prima e seconda parte), 1929-1940; C. Collodi, Pinocchio, 1883; F.M.
Dostoevskij, Belye Noči, 1848; U. Eco, Il nome della rosa, 1980; L. Pirandello, La signora Frola e il signor Ponza,
suo genero, 1917.
26
In linguistica dei corpora per numero di parole si intendono le occorrenze effettive (denominate token), che
vanno distinte dai types, corrispondenti ai lessemi.
27
N. Nesselhauf, Corpus linguistics: a practical introduction, 2011, versione elettronica disponibile al link
http://www.as.uniheidelberg.de/personen/Nesselhauf/files/Corpus%20Linguistics%20Practical%20Introduction.pdf (ultima consultazione: 2 febbraio 2016).
La corpus revolution russa e il corpus parallelo italiano-russo
119
La carenza di corpora paralleli russo-italiani28 e la necessità di non procrastinare ulteriormente l’impiego delle tecnologie informatiche per l’analisi contrastiva di queste due
lingue, per gli studi traduttivi e la didattica della lingua russa, ne imponevano dunque un
ampliamento, iniziato nel gennaio 2014 grazie alla collaborazione fra l’Istituto di Lingua
Russa di Mosca (Institut Russkogo Jazyka imeni V.V. Vinogradova), la cattedra di lingua e letteratura russa dell’Università Cattolica di Milano29 e la Scuola Superiore di Lingue Moderne per Interpreti e Traduttori di Forlì (Università di Bologna). Si è così giunti, nel dicembre
2015, a un sostanziale incremento del corpus (ora disponibile al link: http://ruscorpora.
ru/search-para-it.html), grazie al quale non solo è superata l’iniziale fase pilota, ma sono
state messe le basi per assicurarne uno sviluppo sistematico30.
2. Criteri di compilazione del corpus
Per progettare l’ampliamento del CP ita-ru abbiamo in primo luogo analizzato i più significativi corpora esistenti (paralleli e non) e preso in considerazione la letteratura scientifica sviluppatasi intorno alla loro compilazione31. La nostra attenzione si è concentrata
sui seguenti punti: i) finalità e tipologia; ii) generi testuali; iii) dimensione del corpus; iv)
lunghezza dei testi; v) periodo di redazione dei testi; vi) selezione delle traduzioni; vii)
rappresentatività e bilanciamento; viii) sistematicità.
Abbiamo innanzitutto stabilito che il corpus sarebbe stato bi-direzionale, caratteristica
fondamentale non solo per consentire un maggior numero di ricerche, ma anche per rendere il corpus comparabile, oltre che parallelo. La differenza tra questi due tipi di corpora sta
Il portale Opus raccoglie alcuni testi allineati in russo e italiano, tuttavia non sono chiari i criteri di compilazione e non viene data alcuna informazione extralinguistica sui singoli testi inseriti (http://opus.lingfil.uu.se/
ultima consultazione 12 gennaio 2018). Si parla in questo caso di collezioni di testi, per distinguerle dai corpora tradizionali, ovvero compilati secondo precisi criteri e con lo scopo di condurre ricerche linguistiche. I testi
raccolti su portali come Opus hanno come fonte risorse multilingue specifiche e preesistenti, come ad esempio
Europarl, che raccoglie i documenti prodotti in più lingue all’interno del Parlamento Europeo.
29
Più precisamente, per quanto riguarda l’Università Cattolica, l’ampliamento è stato realizzato nell’ambito del
Dottorato di Ricerca dell’autore di questo contributo, svoltosi presso l’Università Cattolica del Sacro Cuore
di Milano (gennaio 2014-gennaio 2017) e sfociato nella dissertazione dottorale: V. Noseda, Corpora paralleli
e linguistica contrastiva: ampliamento e applicazioni del corpus italiano russo nel Nacional’nyj Korpus Russkogo
Jazyka, A.A. 2015/16, Università Cattolica del Sacro Cuore, Milano 2017.
30
Analogamente all’intero NKRJa, infatti, il nostro corpus parallelo non nasce come statico, ma verrà continuamente ampliato e monitorato.
31
In particolare si è scelto di prendere in esame i seguenti corpora: tre corpora della lingua inglese, da sempre
considerati come esempi validissimi in termini di progettazione: il Brown Corpus (BrC), il British National
Corpus (BNC), il Corpus of Contemporary American English (COCA); uno dei maggiori corpora di lingua
italiana CORIS/CODIS; e due corpora paralleli, ovvero l’English-Norwegian Parallel Corpus (ENPC), considerato uno dei migliori corpora paralleli esistenti per il rigore e la sistematicità dei criteri di compilazione, e
CEXI (the English Italian Translational Corpus), in quanto unico corpus parallelo per la lingua italiana che rispondesse ai criteri di sistematicità e bilanciamento, e sebbene non sia mai stato portato a termine, la descrizione dei criteri in base a cui avrebbe dovuto essere compilato si è rivelata molto utile per definire le caratteristiche
del nostro corpus (cfr. V. Noseda, Corpora paralleli e linguistica contrastiva, pp. 50-51).
28
120
Valentina Noseda
nella relazione che intercorre tra i testi che li compongono: un corpus parallelo raccoglie
testi in una lingua 1 allineati con la rispettiva traduzione in lingua 2; un corpus comparabile è invece formato da testi dello stesso genere ma in due lingue diverse, senza che vi sia tra
di essi un rapporto traduttivo, oppure può essere composto da traduzioni e originali redatti
nella stessa lingua. Quest’ultimo tipo è particolarmente utile sia negli studi traduttivi (in
particolare per le ricerche sui cosiddetti universali traduttivi)32, sia, come spiega Johansson33, per verificare se le tendenze linguistiche riscontrate nei testi tradotti siano attribuibili
solo alle traduzioni o anche alla maggior parte dei testi prodotti in una data lingua. Decidendo di inserire sia originali italiani sia originali russi appartenenti a stessi tipi testuali
(romanzi, memorie, saggi) è dunque possibile usare il CP ita-ru per confrontare non solo
gli originali in russo o italiano con le rispettive traduzioni, ma anche testi russi originali e
traduzioni russe, come pure testi originali italiani e traduzioni italiane.
Abbiamo infine deciso di creare quello che, secondo la terminologia di Merkel, viene
definito “target-variant corpus”34: un corpus parallelo che contenga, ove presenti, diverse
traduzioni di uno stesso testo. La possibilità di disporre di diverse traduzioni di una stessa
opera è infatti estremamente utile in diversi ambiti di ricerca: nella linguistica contrastiva,
per analizzare in modo più scrupoloso le caratteristiche e gli usi di una data struttura linguistica; negli studi traduttivi, per condurre analisi comparate delle diverse traduzioni; nella ricerca letteraria e negli studi sulla storia della traduzione, per approfondire la recezione
di un autore o di una sua opera35.
Trattandosi di un corpus contenente testi originali con le rispettive versioni in una lingua 2, la scelta tra i vari tipi testuali è più limitata rispetto a un corpus monolingue, dal momento che non tutti i generi vengono tradotti: da questo punto di vista, in un CP le opere
letterarie sono il genere testuale dominante, seguite dalla saggistica36. Alla luce di quanto
L’idea che i testi tradotti subiscano l’interferenza del testo fonte è di Toury (G. Toury, Descriptive Translation
Studies and beyond, John Benjamins, Amsterdam/Philadelphia 1995, pp. 267-279; si pensi in particolar modo
alle due leggi – growing standardization (standardizzazione crescente) e interference (interferenza) – enunciate
dallo studioso), ma è Baker (M. Baker, Corpus-based Translation Studies: the Challenges that lie ahead, in Terminology, LSP and Translation. Studies in language engineering in honour of Juan C. Sager, H. Somers ed., John
Benjamins, Amsterdam/Philadelphia 1996, pp. 175-186) a precisare questo concetto, rendendolo universale
mediante l’affermazione che, indipendentemente dalla lingua di partenza e da quella di arrivo, esistono fenomeni caratteristici del processo traduttivo di per sé, denominati, appunto, universali della traduzione (o universali traduttivi), ossia: simplification (semplificazione), explicitation, (esplicitazione), normalization (normalizzazione) e levelling out (convergenza). Le ricerche sugli universali caratterizzano gli studi traduttivi descrittivi
(descriptive translation studies), che confrontano testi originali in una data lingua A con testi tradotti nella stessa
lingua A senza prendere in considerazione né i testi fonte, né la lingua in cui questi ultimi sono redatti.
33
S. Johansson, On the role of corpora in cross-linguistic research, e., l. 1998.
34
Cfr. L. Borin, … And never the twain shall meet?
35
Cfr. Biber sui “corpus stylistic studies”, ovvero le indagini corpus-based che analizzano lo stile di un autore (D.
Biber, Corpus linguistics and the study of literature. Back to the future?, “Scientific Study of Literature”, 1, 2011,
1, pp. 15-23).
36
È stata presa in considerazione anche l’idea di inserire in un secondo momento articoli di giornale, ma il progetto è ancora al vaglio. Gli articoli pubblicati da alcuni giornali online sono infatti spesso traduzioni di pezzi
apparsi su testate estere, e il loro inserimento in un corpus parallelo è problematico per almeno due motivi: 1)
le traduzioni vengono nella maggior parte dei casi rivisitate o accorciate dalla redazione prima di essere pubbli32
La corpus revolution russa e il corpus parallelo italiano-russo
121
detto, per differenziare il più possibile i testi del CP ita-ru, si è deciso, per la sezione di
saggistica, di scegliere brani che trattassero argomenti diversi, utilizzando la classificazione
degli argomenti proposta dal motore di ricerca dell’Index Translationum37.
Per quanto riguarda le dimensioni, abbiamo stabilito come obiettivo preliminare di
raggiungere almeno 3 milioni di parole, pari all’entità dell’English-Norwegian Parallel Corpus, adottato come modello nella progettazione del nostro come di diversi altri corpora
paralleli, per via della sistematicità e del bilanciamento che lo caratterizzano38. Il criterio
della dimensione è influenzato chiaramente dalla lunghezza dei testi inseriti nel CP, che
possono essere in versione integrale o ridotta. Per non ledere il copyright e non allungare
oltremodo i tempi necessari per il lavoro di allineamento39 dell’originale con la sua traduzione, abbiamo deciso di inserire per ogni titolo un estratto che andasse dalle 10.000 alle
15.000 parole40, partendo dall’inizio di ogni opera, ma non si esclude in futuro la possibilità
di aggiungere estratti ulteriori di uno stesso testo.
Per consentire studi di tipo diacronico non abbiamo limitato la scelta dei testi ad un
solo periodo, come nel caso di alcuni corpora sincronici quali il BrC o il BNC41: tenendo
in considerazione l’evoluzione della lingua russa, sono state dunque utilizzate opere redatte
a partire dal XVIII secolo, e pertanto anche i testi italiani, con la loro traduzione russa, non
sono anteriori a questo periodo.
Un criterio importante nella progettazione di un corpus parallelo è la scelta delle traduzioni: abbiamo stabilito che i traduttori dei testi selezionati dovessero essere noti (ovvero
non anonimi) e parlanti nativi della lingua del testo di arrivo. Nel caso di testi tradotti più
volte da diversi traduttori, siamo partiti dalle traduzioni considerate più autorevoli, senza
escludere che altre possano essere inserite in un secondo momento (cfr. par. 3.1 sulla scelta
delle traduzioni de Il Cappotto di N. Gogol’).
Tutte le decisioni sopracitate si ricollegano ai criteri della rappresentatività e del bilanciamento, due concetti tanto importanti quanto difficili da realizzare nella compilazione
di un corpus. Per rappresentatività Leech intende la possibilità di estendere ad una lingua
le caratteristiche che si riscontrano in un corpus di testi redatti in quella stessa lingua42. Per
cate, risultando quindi poco fedeli al testo fonte, ed è difficile reperire i testi originali e le traduzioni prima della
manipolazione. 2) Rimangono ignote le identità degli autori degli articoli originali e dei traduttori.
37
Un database dell’UNESCO che registra in maniera quasi completa i libri tradotti dal 1979 al 2012 e suddivide i titoli nelle seguenti categorie: arte-giochi-sport, bibliografie, filosofia-psicologia, letteratura, giurisprudenza-scienze sociali-istruzione, scienze naturali-scienze esatte, scienze applicate, storia-geografie-biografie.
[http://www.unesco.org/xtrans/ (ultima consultazione: settembre 2017)].
38
Zanettin, ad esempio, lo identifica come modello per la progettazione del corpus CEXI. Cfr. F. Zanettin,
CEXI. Designing an English-Italian Translational Corpus, “Language and Computers”, 42, 2002, 2, pp. 329343.
39
Sul processo di allineamento di un testo si veda il paragrafo 3.2.
40
L’allineamento di testi integrali, infatti, oltre a creare più problemi per quanto riguarda i diritti d’autore,
richiedeva una mole di lavoro ingestibile nel periodo di tempo stabilito per il primo ampliamento del CP ita-ru
(tre anni).
41
I due corpora raccolgono testi risalenti, rispettivamente, agli anni Sessanta e Novanta.
42
G. Leech, The state of the art in corpus linguistics, in English corpus linguistics: Studies in Honour of Jan Svartvik, K. Aijmer – B. Altenberg ed., Longman, London/New York 1991, pp. 8-29.
122
Valentina Noseda
essere rappresentativo un corpus dovrà pertanto non solo essere vasto, ma anche bilanciato
e variegato. ovvero contenere, in ugual misura, testi appartenenti a vari generi e riguardanti
temi diversi. Inoltre, nel caso di corpora paralleli bi-direzionali, la quantità dei testi in lingua 1 non dovrebbe discostarsi eccessivamente da quella dei testi in lingua 2. Da ultimo,
per evitare di inserire un gran numero di testi appartenenti allo stesso stile43 – il che comprometterebbe i risultati dell’analisi linguistica – abbiamo deciso di inserire inizialmente
una sola opera per autore, facendo in modo che anche i traduttori variassero il più possibile.
Infine, per rispondere al criterio della sistematicità, abbiamo annotato (e continueremo
ad annotare) ogni fase del nostro lavoro, così da rendere le informazioni accessibili ai futuri
utenti. Riteniamo, infatti, che sia estremamente importante per un ricercatore conoscere le
caratteristiche dei testi contenuti nel corpus che sta utilizzando, poiché informazioni quali
autore, anno di redazione, titolo dell’opera, possono rivelarsi decisive per interpretare i dati
dell’analisi.
3. Le fasi della compilazione
3.1. La selezione dei testi
Una volta stabiliti i criteri per la creazione del nostro corpus sono stati scelti i testi. Per dare
continuità al corpus pilota già presente sul NKRJa è stato deciso di partire dall’ampliamento della sezione di prosa letteraria. A tale scopo ci siamo affidati ai database delle maggiori
biblioteche nazionali44, all’Index Translationum e ai cataloghi delle case editrici, così da
stabilire, in primo luogo, i testi tradotti in una e nell’altra direzione e, in seguito, quante
traduzioni fossero state pubblicate per ciascuna opera. Esiste una notevole discrepanza tra
il numero di versioni italiane di una stessa opera russa e il numero di versioni russe di una
stessa opera italiana (nettamente più esiguo), tuttavia, tale sbilanciamento caratterizza solo
i classici dell’Ottocento e dei primi del Novecento; per la maggior parte delle opere più recenti, in molti casi meno popolari, è stata pubblicata una sola traduzione, sia che si tratti di
originali russi, sia che si tratti di originali in italiano. Pertanto, durante questa fase, è stato
necessario distinguere tra opere russe dei secoli XIX e XX, tradotte più volte in italiano
(che chiameremo gruppo A), e opere russe più recenti, dei secoli XX e XXI, tradotte una
sola volta (gruppo B)45: per il gruppo B ci si è basati su quanto effettivamente presente nei
cataloghi sopraindicati, mentre per il gruppo A abbiamo scelto innanzitutto gli autori più
noti e influenti nel panorama letterario del Paese di arrivo. Per ognuno di essi è stato poi
necessario scegliere l’opera da inserire, seguendo i criteri della recezione e della popolarità,
solitamente testimoniate dal numero di traduzioni pubblicate in lingua 246.
Dove per ‘stile’ qui si intende quello proprio di un autore.
http://opac.sbn.it/opacsbn/opac/iccu/free.jsphttp://opac.sbn.it/opacsbn/opac/iccu/free.jsp, sito che raccoglie i cataloghi di tutte le biblioteche d’Italia (ultima consultazione: agosto 2017) e il catalogo della Biblioteca Statale Russa di Mosca http://www.rsl.ru/ru (ultima consultazione: agosto 2017).
45
Si precisa che questa distinzione non emerge sul Corpus, ma ha riguardato solamente la fase di selezione.
46
Ad esempio, una volta scelto Tolstoj come autore da inserire necessariamente nel nostro corpus, è stato selezionato il romanzo Anna Karenina, in quanto tradotto un maggior numero di volte rispetto a Guerra e Pace
43
44
La corpus revolution russa e il corpus parallelo italiano-russo
123
Per quanto riguarda il gruppo A, abbiamo acquisito anche alcune opere allineate in
modo autonomo dal nostro progetto47, che hanno permesso di raggiungere in breve tempo
le dimensioni da noi prestabilite per il corpus. Tuttavia, alcuni dei criteri di progettazione
da noi previsti (cfr. paragrafo 2) non sono stati rispettati. In particolare, in questo sotto-corpus48:
– sono state allineate opere integrali, anziché estratti;
– l’acquisizione dei testi è avvenuta in un’unica direzione – russo-italiano – compromettendo il bilanciamento auspicato tra lingua 1 e lingua 2;
– Il criterio usato per selezionare i testi e le loro traduzioni non ha seguito parametri
qualitativi ma ragioni di pura praticità, ossia la facile reperibilità. Di conseguenza
per alcuni autori sono state allineate fin da subito più opere (perché disponibili nel
web), e dove erano presenti più traduzioni, sono state semplicemente scelte quelle
disponibili in formato elettronico.
Pertanto, durante la prima fase di ampliamento del CP la riflessione sui criteri di selezione delle
traduzioni ha riguardato solo il racconto di Gogol’ Šinel’49 (tradotto il per lo più come Il Cappotto50), su cui è necessario soffermarsi brevemente. Le prime traduzioni italiane de Il Cappotto51
sono state spesso considerate dalla critica poco valide e infedeli, poiché presumibilmente tradotte
dal francese anziché direttamente dal russo, come precisato da Inkova52 e Pala53. La prima versione che abbiamo dunque voluto inserire è quella del 1922 di C. Rebora, unica nel suo genere
grazie “all’impronta personale che hanno tutte le traduzioni del Rebora”54. La seconda traduzione selezionata, in ordine cronologico, è quella di E. Carafa D’Andria (1937): nonostante alcune
scelte traduttive opinabili e oggi obsolete, la popolarità della duchessa D’Andria negli ambienti
editoriali della sua epoca (testimoniata anche da Lo Gatto) ci ha indotto ad inserire anche la sua
versione intitolata inizialmente Il Pastrano e ripubblicata successivamente come Il Cappotto. Per
quanto riguarda le traduzioni successive, abbiamo scelto innanzitutto quelle svolte da traduttori
noti nel mondo della slavistica italiana: T. Landolfi (1941), L. Pacini-Savoj (1957), G. Pacini
o ad altre opere. Si precisa che le informazioni relative al numero di traduzioni sono state reperite grazie agli
strumenti precedentemente citati (database delle biblioteche e Index Translationum), i quali possono presentare delle lacune. Ad esempio, nel caso del Cappotto di N. Gogol’, un approfondimento (V. Noseda, Corpora
Paralleli e linguistica contrastiva, p. 202) evidenzia che N. Marcialis, nei commenti alla sua traduzione del racconto, cita versioni non menzionate da altri e nemmeno presenti nei database consultati.
47
In particolare si tratta dei testi elaborati da Ksenja Balakina dell’Università di Bologna.
48
Nel paragrafo 4 presenteremo l’elenco di queste opere e una nostra proposta per il futuro ampliamento del
corpus che tenga conto di questo intervento.
49
Inserito dall’unità di Milano.
50
Vi sono traduttori che hanno proposto titoli alternativi: Il mantello (C. Alvaro e T. Landolfi), La mantella
(N. Marcialis e S. Prina), Il pastrano (E. Carafa D’Andria) e l’uniforme (D. Ciampoli).
51
Vale a dire le traduzioni di G. Loschi (1903 e 1919), D. Ciampoli (1916) e C. Alvaro (1920).
52
O. Inkova, Le prime traduzioni romanze del “Cappotto” di Gogol’: precisazioni cronologiche e traduttologiche,
“Diversité et identité culturelle en Europe”, 13, 2016, 2, pp. 93-120.
53
V. Pala, Tommaso Landolfi traduttore di Gogol’, Bulzoni Editore, Roma 2009.
54
E. Lo Gatto, Recensione a N.V. Gogol’, Il cappotto, traduzione di C. Rebora, “L’Italia che scrive”, 5, 1922, 8,
p. 151.
124
Valentina Noseda
(1963), P. Zveteremich (1967), E. Bazzarelli (1980), N. Marcialis (1991)55, S. Prina (1994), E.
Guercetti (1995). Le restanti traduzioni, seppur di traduttori meno noti, sono state inserite per
rispondere al criterio della rappresentatività. Riteniamo infatti che una lingua storico-naturale sia
formata da tutti i testi prodotti in quella lingua, anche se ritenuti meno validi dalla critica e dai
lettori. Trattandosi poi di traduzioni, abbiamo voluto in parte raccogliere quanto affermato nei
Descriptive Tranlsation Studies56, secondo cui l’analisi dei testi tradotti non dovrebbe tener conto
del testo di partenza, superando così definizioni quali ‘fedele’ o ‘infedele’.
Alle opere letterarie è seguita la selezione della saggistica, al momento ancora in fase di allineamento. Come accennato, sono state scelte opere su vari argomenti, secondo la classificazione
tematica e per generi proposta dall’Index Translationum57, e per mantenere il bilanciamento abbiamo scelto non più di uno o due testi per categoria.
3.2. Acquisizione e allineamento dei testi
Dopo la conversione dei testi in formato digitale (quando non già disponibile) e la loro revisione58, una volta ottenuti dalle case editrici i permessi per utilizzarli59 (momento problematico per la compilazione di qualsivoglia corpus elettronico), tramite il software Euclid è stato
eseguito l’allineamento degli originali alle loro traduzioni. Ciò avviene in modo automatico,
ma richiede tuttavia un intervento di correzione manuale nel frequente caso in cui vi siano
differenze di punteggiatura tra testo fonte e testo di arrivo. Euclid suddivide infatti i due testi in periodi delimitati da un punto fermo: se in traduzione quest’ultimo è sostituito da un
Per un problema tecnico in fase di allineamento, la versione di Marcialis non è comparsa sul CP a dicembre
2015.
56
Cfr. G. Toury, Descriptive Translation Studies.
57
Fanno eccezione alcuni casi in cui abbiamo denominato le categorie in modo diverso, per esempio nel caso
degli epistolari e delle memorie.
58
Il programma di allineamento legge esclusivamente file in formato txt. Se si utilizza l’OCR (riconoscimento
ottico dei caratteri), che permette di convertire direttamente l’immagine scansionata in un file di testo modificabile, il passaggio al formato txt è possibile, ma un controllo degli errori sarà anche in questo caso necessario.
59
L’utilizzo dei testi sarebbe regolato dalla legge sul copyright, valida in tutti i casi in cui un autore non sia
deceduto da più di 70 anni. La richiesta alle case editrici che detengono i diritti il più delle volte non è rifiutata,
bensì ignorata. Per ovviare a questo problema Zanettin suggerisce di accompagnare alla richiesta una dichiarazione in cui si afferma che il consenso sarà dato per scontato in caso di mancata risposta entro un certo periodo (F. Zanettin, Translation-Driven Corpora: Corpus Resources for Descriptive and Applied Translation Studies,
Routledge, New York 2012, pp. 52-55). Altri compilatori di corpora si appellano invece alla legge sul fair use
(uso legittimo) (cfr., ad esempio, M. Davies, The 385 + million-word Corpus of Contemporary American English (1990-2008+). Design, architecture and linguistic insights, “International Journal of Corpus Linguistics”,
14, 2009, 2, pp. 159-190), ritenendo che l’utilizzo dei testi in un corpus sia legittimo per almeno due motivi:
innanzitutto ha come scopo esclusivamente la ricerca e, in secondo luogo, i testi presenti in un corpus non sono
mai visualizzabili per intero (nel NKRJa è possibile visualizzare contemporaneamente un massimo di 500 caratteri). In Italia le questioni legate alla richiesta dei permessi potrebbero essere risolte grazie all’articolo 70 della
legge n. 633 del 22 aprile 1941, comma 1, secondo il quale: “Il riassunto, la citazione o la riproduzione di brani
o di parti di opera e la loro comunicazione al pubblico sono liberi se effettuati per uso di critica o di discussione,
nei limiti giustificati da tali fini e purché non costituiscano concorrenza all’utilizzazione economica dell’opera;
se effettuati a fini di insegnamento o di ricerca scientifica l’utilizzo deve inoltre avvenire per finalità illustrative
e per fini non commerciali”.
55
La corpus revolution russa e il corpus parallelo italiano-russo
125
segno di interpunzione differente, il programma non è in grado di allineare correttamente
le due parti60.
Abbiamo infine provveduto alla compilazione dei metadati, necessari per l’annotazione meta-testuale del corpus, grazie alla quale è possibile conoscere il titolo di un’opera, l’autore, l’anno di
composizione, il traduttore, il genere e la lunghezza dell’estratto (espressa in numero di parole). I
programmatori del NKRJa hanno infine curato l’annotazione (cfr. paragrafo 4d) eseguita grazie
al supporto di Yandex61.
4. Stato dell’arte, applicazioni e proposte per un futuro ampliamento
In questo paragrafo daremo alcune informazioni relative ai testi inseriti nel CP ita-ru e
alle potenzialità di ricerca di questo strumento. Le nostre riflessioni concerneranno alcuni dei criteri di progettazione considerati nel paragrafo 2. Come accennato, non tutte le
decisioni prese in fase di progettazione sono già state realizzate, mentre l’aggiunta di testi
da parte di collaboratori esterni ha reso necessari alcuni interventi correttivi che illustreremo.
a) Testi presenti sul corpus
Non ci sembra inutile, per completezza d’informazione, riportare in ordine cronologico i titoli delle opere letterarie rappresentate nel CP ita-ru dopo il primo sostanziale ampliamento
(fino a dicembre 2017). Il primo elenco contiene, in ordine cronologico di composizione, le
opere del gruppo A, ossia quelle che presentano più di una traduzione italiana, e in particolare: i) le opere inserite integralmente; ii) i due titoli già compresi nel corpus pilota62; iii) 15
versioni italiane del Cappotto di Gogol’63. A queste seguiranno, in ordine cronologico, anche
le opere del gruppo B, ovvero tradotte solo una volta in italiano, attualmente presenti nel corpus. Da ultimo i) l’elenco delle opere letterarie italiane tradotte in russo; ii) le opere italiane
che formavano il corpus pilota, inserite in versione integrale; iii) alcuni racconti di D. Buzzati
aggiunti dall’unità di Forlì64.
Opere ru-ita del gruppo A disponibili nel NKRJa (dicembre 2017):
Gli errori di allineamento possono essere legati allo stile di autori e traduttori, oppure al tipo sintattico delle
due lingue considerate, più o meno ipotattiche. Su questo tema cfr. D.O. Dobrovolskij – A.A. Kretov – C.A.
Šarov, Korpus parallel’nyh tekstov. Architektura vozmožnosti ispol’zovanija, in Nacional’nyj korpus russkogo jazyka: 2003-2005, Indrik, Moskva 2005, pp. 263-296.
61
Una delle maggiori società informatiche russe.
62
Allineate e inserite integralmente.
63
Quest’opera gogoliana è stata in assoluto in Italia la più tradotta dal russo. Secondo un recente studio di O.
Inkova, si contano almeno 32 versioni, sebbene Inkova riporti due versioni di E. Carafa d’Andria, una del 1937
e una del 1960 (che corrisponde alla versione da noi acquisita), ma confrontando parte dei due testi si evince
che a cambiare è solo il titolo: Il Pastrano del ’37 e Il Cappotto del ’60 (O. Inkova, Tradurre il titolo: le traduzioni
italiane del “Cappotto” di Gogol’, “Kwartalnik neofilologiczny”, 61, 2014, 1, pp. 41-56). Inoltre, come già accennato, N. Marcialis menziona nelle sue note due ulteriori versioni: una di Nerina Martini Bernardi Carrescia
(1975) e un’altra di Anjuta Gančikov (1981).
64
Questi testi sono in versione integrale, ma non raggiungono le 10.000 parole.
60
126
Valentina Noseda
i)
–
–
–
–
–
–
–
–
–
–
–
–
–
N.V. Gogol’, Mertvye duši (1835-1852) / Le anime morte (P. Nori, 2009)
I. Gončarov, Oblomov (1859) / Oblomov (A. Michettoni, 2000)
I.S. Turgenev, Otcy i deti (1862) / Padri e figli (F. Verdinois, 1908)
F.M. Dostoevskij, Prestuplenie i nakazanie (1866) / Delitto e Castigo (G. Kraiski,
1983)
L.N. Tolstoj, Anna Karenina (1875-1877) / Anna Karenina (M. B. Luporini,
1961)
F.M. Dostoevskij, Velikij inkvizitor (1879) / Il grande inquisitore (S. Vitale, 2010)
A.P. Čechov, Rasskazy (1885) / Racconti (F. Malcovati, 2004)
A.P. Čechov, Palata N. 6 (1892) / La corsia N. 6 (F. Malcovati, 2004)
M. Gor’kij, Byvšie ljudi (1897-1898) / Gli ex-uomini (E. W. Foulques, 1905)
M. Gor’kij, Ozornik (1897-1898) / Il burlone (E. W. Foulques, 1905)
M. Gor’kij, Suprugi Orlovy (1897-1898) / I coniugi Orlof (E. W. Foulques, 1905)
M. Gor’kij, Toska (1897-1898) / L’angoscia (E. W. Foulques, 1905)
B.L. Pasternak, Doktor Živago (1945-1955) / Il dottor Živago (P. Zveteremich,
1957)
V.V. Nabokov, Lolita (196765) / Lolita (G. Arborio Mella, 1993)
V.T. Šalamov, Kolymskie rasskazy (1973) / I racconti di Kolyma (M. Binni, 1999)66
–
–
ii)
– F.M. Dostoevskij, Belye noči (1848) / Le notti bianche (P. Biloni, 2006)
– M.A. Bulgakov, Master i Margarita (1929-1940) / Il Maestro e Margherita (V.
Drisdo 1967)
iii)
– N.V. Gogol’, Šinel’ 1842 / Il Cappotto67 [C Rebora (1922) / Il Pastrano. Duchessa
D’Andria (1937) / Il Mantello. T. Landolfi (1941) / O. Del Buono (1949) /
L. Pacini-Savoj (1957) / G. Pacini (1963) / A Julovic (1964) / P. Zveteremich
(1967) / E. Bazzarelli (1980) / S. Beffa (1986) / F. Mariano (1986) / L. De Nardis (1993) / La Mantella. S. Prina (1994) / E. Guercetti (1995) / F. Legittimo
(2001)]68.
Opere ru-ita del gruppo B disponibili nel NKRJa (dicembre 2017):
– I.A. Bunin, Mitina ljubov’ (1923) / L’amore di Mitja (R. Kufferle, 1934) – cap.
1-14
– V.Ja. Zazubrin, Šepka (1923) / La scheggia (S. Vitale, 1990) – cap. 1-4
– A.P. Platonov, Ščastlivaja Moskva (1933-1936) / Mosca felice (O. Discacciati – S.
Vitale, 1996) – cap. 1-6
Si intende l’anno di pubblicazione della versione russa, che seguì la pubblicazione in inglese nel 1955.
Se precisa che di quest’opera sono stati allineati, a parte, anche 6 capitoli con due traduzioni (quella di Binni
del 1999 e di S. Rapetti del 1998).
67
I casi in cui un traduttore abbia scelto un titolo alternativo sono segnalati nell’elenco.
68
Il racconto conta poco più di 10.000 parole, pertanto è stato inserito in versione integrale.
65
66
La corpus revolution russa e il corpus parallelo italiano-russo
127
– V.V. Nabokov, Dar (1937) / Il dono (S. Vitale, 1998) – parte del cap. 1
– Č.T. Ajtmatov, Proščaj, Gul’sary! (1966) /Addio Gul’sary (C. Di Paola – S. Leone, 1988) – cap. 1-5
– S. Sokolov, Škola dlja durakov (1973) / La scuola degli sciocchi (M. Crepax, 2007)
– cap. 1
– S.D. Dovlatov, Inostranka (1987) / Straniera (L. Salmon, 1991) – cap. 1-4
– S.D. Dovlatov, Filial (1987) / La filiale (L. Salmon, 2010) – versione integrale69
– Ju.I. Druznikov, Angely na končike igly (1988) / Angeli sulla punta di uno spillo
(F. Aceto, 2006) – cap. 1-4
– V.O. Pelevin, Žizn’ nasekomych (1993) / La vita degli insetti (V. Piccolo, 2000) –
cap. 1-4
– L.E. Ulickaja, Veselye pochorony (1997) / Funeral Party (E. Guercetti, 2004) –
cap. 1-7
– B. Akunin, Azazel’ (1998) / La regina d’inverno (P. Pera, 2000) – cap. 1-4
– V.V. Erofeev, Chorošij Stalin (2004) / Il buon Stalin (L. Montagnani, 2008) –
cap. 1- e parte del cap. 2
– A.Ju. Kurkov, Zakon ulitki (2005) / I pinguini non vanno in vacanza (D. Osimo,
2006) – cap.1-8
Opere ita-ru allineate, disponibili nel NKRJa (dicembre 2017):
i)
– C. Goldoni, La locandiera (1753) / Traktirščica (A. Dživelegov, 1933) – I atto,
scene 1-22
– E. De Amicis, Cuore (1886) / Serdce (V. Davidenkova, 1958) – cap. 1-2
– L. Pirandello, Il fu Mattia Pascal (1904) / Pokojnyj Mattia Paskal’ (G. Rubcova,
N. Rykova, 1967) – cap. 1-5
– I. Calvino, Il Barone rampante (1957) / Baron na dereve (L. Veršinin, 1965) –
cap. 1-5
– G. Bassani, Il Giardino dei Finzi-Contini (1962) / Sad Finci-Kontini (I. Soboleva, 2008) – cap. 1-6
– U. Eco, Il pendolo di Focault (1988) / Majatnik Fuko (E. Kostjukovič, 2006) –
cap. 1-6
– A. Baricco, Novecento (1994) / Legenda o pianiste (N. Kolesova, 2005)70
– A. Camilleri, Il cane di terracotta (1996) / Sobaka iz terrakotty (А. Kondjurina,
2005) – cap. 1-5
– V.M. Manfredi, Aléxandros, III, Il confine del mondo (1998) / Aleksandr makedonskij. Predely mira (M. Kononov, 2003) – cap. 1-7
– N. Ammaniti, Io non ho paura (2001) / Ja ne bojus’ (V. Nikolaev, 2005) – cap. 1-2
– G. Faletti, Io uccido (2002) / Ja ubivau (I. Kostantinova, 2005) – cap. 1-4
ii)
69
70
Inserita dalla Scuola Superiore di Lingue Moderne per Interpreti e Traduttori di Forlì.
Testo allineato in versione integrale perché conta in tutto 11.700 parole.
128
Valentina Noseda
– C. Collodi, Pinocchio (1883) / Priključenija Pinokkio (E. Kazakevič, 1959)
– L. Pirandello, La signora Frola e il signor Ponza, suo genero (1917) /Gospoža Frola
i ee zjat’ gospodin Ponca (M. Gasanova-Mijat, 2006)
– U. Eco, Il nome della rosa (1980) / Imja rozy (E. Kostjukovič, 1989)
iii)
– D. Buzzati, Eppure battono alla porta (1942) / I vse že stučat v dver’ (I. Smagin,
2010)
– D. Buzzati, I sette messaggeri (1942) / Sem’ goncov (F. Dvin, 2010)
– D. Buzzati, Il borghese stregato (1942) / Očarovannyj buržua (P. Chlodovskij,
2010)
– D. Buzzati, Il mantello (1942) / Plašč (G. Kiselev, 2010)
– D. Buzzati, L’assalto del Grande Convoglio (1942) / Napadenie na bol’šoj konvoj
(P. Chlodovskij, 2010)
– D. Buzzati, L’uccisione del drago (1942) / Kak ubili drakona (F. Dvin, 2010)
– D. Buzzati, Sette piani (1942) / Sem’ etažej (G. Kiselev, 2010)
Per quanto riguarda la saggistica, fra gli autori dei saggi russi selezionati ricordiamo
M.M. Bachtin (per la categoria ‘critica letteraria’), N.A. Berdjaev (religione/teologia),
P.A. Florenskij (epistolario), L.D. Laundau, (scienze esatte e naturali), A.S. Politkovskaja (storia/biografia), E.N. Trubeckoj (arte), V.S. Solovev, (filosofia/psicologia),
A.I. Solženicyn (scienze sociali), K.S. Stanislavskij (memorie).
Per la sezione di saggistica italiano-russo, invece, sono stati selezionati saggi di P.
Grassi (arte), F. De Sanctis (critica letteraria), E. Lo Gatto (critica leteraria), U. Eco (filosofia/psicologia), M. Montessori (scienze sociali/formazione), A. Donini (religione/
teologia), T. Regge (scienze esatte e naturali), G. Boffa (storia/biografia)71. Solo pochi
di questi, tuttavia, sono già disponibili sul corpus (dicembre 2017)72, e precisamente:
– M.M. Bachtin, Problemy poetiki Dostoevskogo (1929) / Dostoevskij: Poetica e stilistica (G. Garritano, 1968) – cap 1
– L.K. Cukovskaja, Zapiski ob Annoj Achmatovoj (1976) / Incontri con Anna Achmatova, 1938-1941 (G. Moracci, 1990)73
– V.S. Solovev, Krizis zapadnoj filosofii (1874) / La crisi della filosofia occidentale
(A. Dell’Asta, 1980) – cap. 1
– S.N. Bulgakov, U sten Chersonisa (1922) / Presso le mura di Chersoneso (M. Campatelli, 1998) – cap. 1-2
Per un elenco completo si rimanda a V. Noseda, Corpora Paralleli e linguistica contrastiva, pp. 97-101, e al sito
del NKRJa, dove è possibile consultare l’elenco delle opere di volta in volta inserite (http://search1.ruscorpora.
ru/search.OPERE RU-ITA) (http://search1.ruscorpora.ru/search.OPERE ITA-RU) (ultima consultazione:
gennaio 2018).
72
La maggior parte è ancora in fase di allineamento.
73
Manca una suddivisione in capitoli, perciò sono state inserite le prime pagine fino a contare circa 10.000
parole.
71
La corpus revolution russa e il corpus parallelo italiano-russo
129
– A.S. Politkovskaja, Putinskaja Rossija (2004) / La Russia di Putin (C. Zonghetti,
2010)74
b) Dimensione del corpus e lunghezza dei testi
Grazie al primo ampliamento qui descritto il CP ita-ru è passato da 700.000 a 4.429.600
parole. L’intervento dei collaboratori esterni (cfr. par. 3) è stato prezioso per raggiungere tale entità, ma ha creato una discrepanza, non solo tra il sotto-corpus dei testi in
direzione russo-italiano e quello dei testi in direzione italiano-russo, ma anche tra testi
in versione integrale ed estratti (sebbene alcune delle opere intere siano brevi racconti al
di sotto delle 15.000 parole). Una possibile soluzione per rimediare a questo sbilanciamento è creare due sezioni separate del corpus, separando appunto i testi integrali dagli
estratti. Tuttavia, per un ampliamento futuro continueremo a privilegiare l’inserimento
di estratti, avendo potuto constatare75 che per la ricerca linguistica disporre di un numero elevato di esempi tratti dalla stessa opera è di scarsa utilità (non così, certamente, per
l’analisi letteraria), poiché le tendenze linguistiche riscontrate dal ricercatore potrebbero dipendere dallo stile individuale di un determinato autore o traduttore. La presenza
di opere in versione integrale non crea invece alcun sbilanciamento quantitativo del
corpus, se queste non superano le 15.000 parole, come per Il Cappotto di N. Gogol’, Il
grande inquisitore di F. Dostoevskij e Novecento di A. Baricco, da noi inserite.
c) Bilanciamento
Come già accennato, il CP ita-ru nella versione attuale presenta un certo sbilanciamento di cui indichiamo qui sotto i termini quantitativi:
– 33 sono i testi letterari russi, mentre quelli italiani sono 21;
– 5 i testi di saggistica russi e nessuno italiano;
– la sezione ru-ita conta 3.705.044 parole, contro le 724.556 parole della sezione
ita-ru;
– 17 opere sono in versione integrale (di entità superiore alle 15.000 parole) mentre della lunghezza prestabilita (non oltre le 15.000 parole) sono 42 (racconti
integrali o estratti di opere).
Il futuro ampliamento dovrà pertanto tener conto di questi dati, così da ristabilire un
corpus il più possibile bilanciato. In particolare, considerando l’esiguo numero di titoli
di saggistica al momento disponibili, e visto lo sbilanciamento generale tra originali
russi e originali italiani, gli obiettivi che ci proponiamo per il futuro in merito alla selezione dei testi sono i seguenti:
• inserire le seguenti opere letterarie italiane selezionate e in parte già allineate76:
– A. Manzoni, I promessi sposi (1827) / Obručennye (N. Georgievskaja, 2011)
Anche in questo caso manca una suddivisione in capitoli.
Cfr. V. Noseda, Corpora Paralleli e linguistica contrastiva, p. 139.
76
Tutte queste opere sono in fase di allineamento e appariranno sul corpus nel 2018.
74
75
130
Valentina Noseda
– R. Giovagnoli, Lo Spartaco (1873-1874) / Spartak (S. Stepnjak-Kravčinskij,
1881 / L. Frenkel’, 1936 /
– Jasnaja, 1954)
– E. Salgari, Il corsaro nero (1898) / černyj korsar (G. Smirnov, 1991)
– I. Svevo, La coscienza di Zeno (1923) / Samopoznanie Dzeno (S. Buševa, 1972)
– A. Moravia, Gli indifferenti (1929) / Ravnodušnye (L. Veršinin, 2010)
– G. Guareschi, Don Camillo: Mondo piccolo (1948) / Malyj mir (O. Gurevič,
2014)
– G. Rodari, Le avventure di Cipollino (1951) / Priključenija Čipollino (Z. Potapova, 1955)
– N. Ginzburg, Lessico famigliare (1963) / Semejnye besedy (G. Smirnov, 1898)
– L. Sciascia, I pugnalatori (1976) / Palermskie ubijcy (E. Solonovič, Z. Potapova,
1982)
– B. Pitzorno, La casa sull’albero (1984) / Dom na dereve (T. Stamovaja, 2012)
– G. D’Agata, Il ritorno dei templari (1997) / Vozvrašenie tamplierov (I. Kostantinova, 2005)
• aumentare sensibilmente le opere di saggistica;
• realizzare un target variant corpus più completo: per il momento abbiamo nel CP
ita-ru solo due opere allineate con più di una versione in lingua 2.
d) La ricerca con il corpus
Concludiamo con alcune osservazioni relative alla potenzialità del CP per la ricerca.
Innanzitutto, le ricerche possono essere condotte sul corpus in base ai parametri delle
annotazioni. Il CP ita-ru presenta infatti tre tipi di annotazione:
– Meta-testuale: comprende le informazioni extralinguistiche sull’opera inserita
(vi si accede cliccando sul titolo dell’opera).
– Morfologica: descrive ogni forma di parola dal punto di vista grammaticale (appartenenza alla classe, genere, transitività o intransitività, aspetto, caso, numero,
tempo, persona ecc.).
– Semantica: fornisce informazioni di tipo semantico sui lemmi. Troviamo categorie tassonomiche riferite a nomi concreti (es.: “animali”, “cibo”), nomi astratti
(es.: “emozioni”, “percezioni”), aggettivi (es.: “qualitativi”, “quantitativi”), verbi
(es.: “moto”, “causativo”) e via dicendo.77
Vogliamo fornire di seguito un esempio di come vengono visualizzati i metadati relativi
a un’opera (fig. 1) e le informazioni morfologiche e semantiche relative a un lemma (fig.
2):
77
Purtroppo, la sezione dei corpora paralleli non è stata sottoposta ad un processo di disambiguazione, per
cui il sistema non distingue gli eventuali omonimi presenti, sia lessicali sia grammaticali. Un obiettivo a lungo
termine, realizzabile da un gruppo di lavoro numeroso, potrebbe essere la disambiguazione del CP ita-ru, per
ovviare e problemi di omonimia e rendere la ricerca ancora più precisa.
La corpus revolution russa e il corpus parallelo italiano-russo
131
Fig. 1. Esempio di visualizzazione dei metadati relativi ad un’opera
Fig. 2. Esempio di visualizzazione delle informazioni morfologiche e semantiche relative a un lemma
È dunque possibile condurre la propria interrogazione su una o più forme di parola
specifiche (poisk točnych form) (un esempio è fornito dall’analisi di A. Bonola del ‘comunque’ italiano78 che consente di confermare la spiccata polisemia e polifunzionalità di questa
parola79, nonché di stabilire una discrepanza tra descrizione lessicografica e uso effettivo),
oppure in base alle categorie semantiche e grammaticali (leksiko-grammatičeskij poisk) evidenziate dall’annotazione, che il ricercatore può combinare in base al suo quesito di ricerca
(per esempio, verbi al futuro perfettivo, sostantivi astratti femminili al caso strumentale
ecc.). Come per l’intero NKRJa, anche nel CP i risultati possono essere richiesti in formato
standard (ogni periodo è seguito dalla traduzione in lingua 2), oppure in formato KWIC
A. Bonola, Il corpus parallelo italiano-russo-italiano come strumento per l’indagine contrastiva delle marche discorsive e testuali: il caso di ‘comunque’ e i suoi traduttivi russi, “Contrastive Linguistics”, 42, 2017, 4, pp. 89-104.
79
In particolare, si registrano quattro tratti: demarcativo, conclusivo, modale, generalizzante (Ibid., p. 102).
78
132
Valentina Noseda
(key words in context). La ricerca lessico-grammaticale (leksiko-grammatičeskij) rileverà tutte le forme di parola in cui un dato lessema può manifestarsi. È possibile anche inserire
linguaggi di interrogazione speciali, ad esempio *pomnit’ -napomnit’, che troverà tutte le
parole che terminano in pomnit’, tranne napomnit’. Questo tipo di interrogazione può essere utile per indagare i verbi prefissali russi e la loro resa in italiano. Il russo, in quanto lingua
satellite-framed80 è ricca di verbi prefissali i cui satelliti (i prefissi) conferiscono a verbi con
la medesima base verbale (come ad esempio pomnit’ [ricordare]) tratti semantici specifici
e distintivi. Il confronto corpus-based con l’italiano (al contrario annoverabile tra le lingue
verb-framed) rivela le possibili strategie di resa di verbi quali vspomnit’ [venire in mente] e
zapomnit’ [memorizzare], concludendo che il mancato impiego di tali strategie porta nella
maggior parte dei casi a una perdita di informazione. L’analisi degli esempi, inoltre, consente di registrare tratti semantici non riportati negli strumenti lessicografici tradizionali (che
spesso trattano i verbi sopracitati come sinonimi) e funge dunque da stimolo per integrare
e migliorare i dizionari bilingui russo-italiano sulla base dei corpora81.
Dal motore di ricerca del corpus possono essere estratti anche interi sintagmi. Ne è un
esempio l’analisi della costruzione causativa italiana ‘fare’ + infinito, che si ottiene richiedendo al sistema di cercare tutte le occorrenze del verbo ‘fare’ (in ogni sua forma) seguito
direttamente da qualsiasi verbo all’infinito. Nello specifico tale indagine è utile per registrare le modalità di espressione di una situazione causativa in russo e in italiano82.
Infine, è possibile creare sotto-corpora ad hoc per effettuare la ricerca solo su una sezione desiderata del corpus (una determinata opera o un gruppo di opere selezionate secondo
i parametri cronologici e stilistici con cui è stato annotato l’intero NKRJa): creando un
sotto-corpus comprendente esclusivamente Il Cappotto di N. Gogol’ e le sue traduzioni
italiane, è possibile ad esempio concentrare l’indagine sul confronto tra le diverse versioni
del racconto, tracciando così la storia delle sue traduzioni83.
In conclusione, avendo coniugato l’ampliamento quantitativo con l’applicazione dei
più collaudati criteri di composizione dei corpora paralleli, il CP ita-ru presente oggi nel
NKRJa si configura come uno strumento sufficientemente ampio e affidabile per condurre
ricerche linguistico-letterarie comparate che abbiano anche un fondamento statisticamente rilevante nella pratica traduttiva scritta, sia letteraria sia saggistica. Inoltre, è stato dato
l’avvio alla possibilità di un aggiornamento del corpus che sia continuo e, soprattutto, sistematico, caratteristiche indispensabili per assicurare nel tempo l’efficienza e l’affidabilità di
questo strumento di ricerca.
Sulla distinzione tra lingue satellite-framed e lingue verb-framed cfr. L. Talmy, Towards a Cognitive Semantics.
Typology and Process in Concept Structuring, MIT Press, Cambridge/London, 2, 2001.
81
Cfr. V. Noseda, Corpora paralleli e linguistica contrastiva, pp. 120-147.
82
Ibid., pp. 175-193.
83
Ibid., pp. 199-246.
80