📚 Corpus di Analisi

53 autori della letteratura mondiale analizzati attraverso le loro opere più rappresentative

📖 Visualizza i Testi Esaminati

Ripetizione e Varietà Lessicale
Analisi Quantitativa

Spiegazione delle Metriche

% Parole ripetute
Indica la percentuale di parole che compaiono più di una volta rispetto al totale delle parole usate in un testo.
Utilità: valuta la varietà lessicale e individua ridondanze o povertà di vocabolario.

% Ripetizione globale
Percentuale di tutte le occorrenze di parole ripetute sul totale delle parole presenti nel testo.
Utilità: misura quanto il testo sia dominato da ripetizioni.

% Ripetizione lessicale
Percentuale di ripetizione riferita solo alle parole “di contenuto” (nomi, verbi, aggettivi).
Utilità: evidenzia se la ripetizione riguarda termini chiave e concetti importanti.

Coefficiente di ripetizione
Indice che misura la tendenza di un testo a ripetere le stesse parole (token/type).
Utilità: quantifica la ricchezza o la povertà lessicale.

Frequenza media delle parole
Valore medio di quante volte ciascuna parola viene utilizzata nel testo.
Utilità: misura sintetica della ripetitività.

Questi indicatori sono fondamentali per valutare la qualità, la leggibilità e la varietà di un testo, sia in ambito letterario che scientifico. Aiutano a individuare stili ridondanti, a migliorare la scrittura e a confrontare testi diversi in modo oggettivo.

Tabella: Indicatori di Ripetizione e Frequenza

Autore % parole ripetute % ripetizione globale % ripetizione lessicale Coefficiente di ripetizione Frequenza media delle parole
Omero43,5692,3143,567,347,34
Verga42,4491,8142,447,037,03
Tolstoj41,3193,1341,318,558,55
Salinger40,6190,4540,616,226,22
Austen40,4991,2940,496,836,83
Dumas40,3192,5240,317,977,97
Cervantes39,2492,2339,247,827,82
Dostoevskij39,2092,1339,207,737,73
Manzoni39,1490,0839,146,136,13
Hemingway 138,3588,9338,355,575,57
Brown37,9588,6737,955,485,48
Salgari37,9087,8737,905,125,12
Murakami37,3788,1137,375,275,27
Woolf37,3089,5737,306,016,01
Mann36,5189,4736,516,036,03
Buzzati36,3585,6736,354,444,44
De Amicis36,0687,5236,065,125,12
Moravia35,7288,3035,725,505,50
Hemingway 235,5285,5235,524,454,45
Camus34,8385,7134,834,564,56
Eco34,8287,6934,825,295,29
Melville34,6987,6234,695,275,27
D’Annunzio34,5784,9634,574,354,35
Baricco34,0285,0034,024,404,40
London33,7584,6433,754,314,31
Hesse32,8983,3332,894,024,02
Joyce32,8584,0232,854,204,20
Flaubert32,8184,7332,814,404,40
Wilde32,3785,2932,374,604,60
Marquez32,1482,3032,143,833,83
Bellow32,0684,8032,064,474,47
Marinetti31,9380,5431,933,503,50
Pavese31,9282,6131,923,913,91
Lee31,8684,2331,864,324,32
James31,7883,7031,784,184,18
Pirandello31,7483,7131,744,194,19
Sartre31,7183,8731,714,234,23
Balzac31,7083,3931,704,114,11
Goethe31,0282,6131,023,973,97
Calvino30,9183,0130,914,074,07
Fitzgerald30,8581,5730,853,753,75
Pasolini30,1581,4530,153,773,77
Camilleri29,6679,3029,663,403,40
Voltaire29,6081,3429,603,773,77
Conrad29,0079,0429,003,393,39
Proust28,9381,2128,933,783,78
Kafka28,6080,6328,603,693,69
Dickens28,1779,2228,173,463,46
Poe27,9176,0427,913,013,01
Puskin26,6371,6526,632,592,59
Arpino21,3264,7021,322,232,23
Eliot20,9257,5520,921,861,86

Analisi Stilistica

La tabella evidenzia alcuni aspetti interessanti riguardanti l’uso della ripetizione lessicale nei testi di diversi autori. Ecco un’analisi stilistica basata sui dati forniti:

  1. Analisi delle Percentuali
    La percentuale di parole ripetute varia significativamente tra gli autori, da valori superiori al 40% (come in Omero, Verga e Tolstoj) fino a valori molto bassi, come in Eliot (20,92%) e Arpino (21,32%).
    Alto livello di ripetizione (es. Omero, Verga, Tolstoj): Potrebbe riflettere stili narrativi epici o realistici che si avvalgono di termini ricorrenti per rafforzare concetti, descrizioni o temi centrali.
    Basso livello di ripetizione (es. Eliot, Arpino): Probabilmente legato a un linguaggio più poetico, astratto o sperimentale, in cui la varietà lessicale è privilegiata.
    La percentuale di ripetizione globale mostra tendenze simili, ma mette in evidenza anche quanto il testo sia dominato da parole ricorrenti. Omero, con il 92,31%, guida questo aspetto, seguito da Tolstoj (93,13%) e Dumas (92,52%). Autori con valori più bassi, come Eliot (57,55%), segnalano una maggiore varietà nel tessuto lessicale complessivo.
  2. Coefficiente di Ripetizione e Frequenza Media delle Parole
    Questi due valori coincidono e rappresentano la ripetitività media di ogni parola unica (tipo).
    Alti coefficienti (Omero: 7,34, Tolstoj: 8,55): Indicativi di una ricorrenza significativa, che potrebbe essere legata a testi lunghi, con un vocabolario deliberatamente reiterativo per facilitare la memorizzazione (es. testi epici) o per creare un forte legame tematico.
    Bassi coefficienti (Eliot: 1,86, Arpino: 2,23): Sottolineano un uso più vario del vocabolario, che potrebbe corrispondere a stili più complessi o a una narrativa più frammentata e innovativa.
  3. Differenze tra Generi e Stili
    Epico e Realistico (Omero, Verga, Tolstoj): Alta ripetizione lessicale e globale: indicativo di strutture narrative che enfatizzano la ciclicità e la centralità di temi o eventi (es. epica orale o narrativa dettagliata). La ripetizione può essere interpretata come una strategia per costruire un ritmo narrativo avvolgente e un senso di familiarità con il lettore/ascoltatore.
    Sperimentale o Poetico (Eliot, Kafka, Marinetti): Bassa ripetizione lessicale e globale, con coefficienti di ripetizione ridotti: riflette un linguaggio più frammentato o complesso, in cui la ricchezza semantica di ogni parola gioca un ruolo cruciale. Marinetti, in particolare, con un coefficiente di 3,50, può rappresentare il dinamismo e la varietà tipici del Futurismo.
    Narrativa Modernista (Woolf, Joyce, Proust): Dati intermedi suggeriscono un equilibrio tra ripetizione e varietà lessicale, utile per creare flussi di coscienza e profondità semantica senza perdere coerenza stilistica.
  4. Stili Narrativi Accessibili o Complessi
    Accessibili (Manzoni, Hemingway): Relativamente alti valori di ripetizione, ma non estremi: segno di una narrativa semplice e chiara, con un vocabolario ripetuto per migliorare la comprensione. Hemingway, ad esempio, con un coefficiente di ripetizione intorno a 5,57, si distingue per uno stile conciso ma ricco di significato attraverso poche parole chiave.
    Complessi (Joyce, Proust, Kafka): Bassi valori di ripetizione lessicale e globale: segnalano un lavoro stilistico sofisticato, in cui la densità semantica prevale sulla ripetizione. Questi autori richiedono maggiore attenzione al lettore per cogliere le sfumature del testo.
Ripetizioni

Il grafico a barre mostra i 10 autori con la più alta percentuale di ripetizione globale.
Per ogni autore, vengono mostrati tre valori:
Percentuale di ripetizione globale (in viola).
Percentuale di parole ripetute (in verde).
Coefficiente di ripetizione (in giallo.
Una linea di riferimento rossa che indica la media globale. Tre box riassuntivi mostrano le medie generali dei tre parametri principali.
Alcuni aspetti interessanti che emergono: Tolstoj ha il più alto tasso di ripetizione globale (93.13%) Omero ha la più alta percentuale di parole ripetute (43.56%).
Tutti gli autori mostrati sono significativamente sopra la media generale C’è una correlazione visibile tra i tre parametri

Indice di Guiraud

Cos’è: È un indice di varietà lessicale che si calcola come il rapporto tra il numero di tipi (parole uniche) e la radice quadrata del numero totale di token (parole totali).
Cosa indica: Misura quanto sia vario il vocabolario usato, normalizzando la lunghezza del testo (che influenza il TTR).
Utilità: È utilizzato per valutare la complessità del vocabolario in un testo, correggendo il bias dovuto alla lunghezza.

Autore Indice Guiraud
Bellow39,61
Marinetti36,88
Melville36,25
Mann35,67
Eco33,86
Flaubert33,24
D’Annunzio32,45
Cervantes31,55
Calvino30,92
Manzoni28,67
Balzac28,35
Pirandello28,25
Kafka28,22
Sartre27,98
Wilde27,79
Dumas27,25
Woolf27,10
Joyce26,98
Conrad26,87
Camilleri26,55
Brown26,46
Fitzgerald26,39
Dostoevskij26,36
Voltaire26,31
Murakami25,95
James25,60
Moravia25,40
London25,10
Tolstoj25,07
Proust25,03
De Amicis24,76
Lee24,72
Pasolini24,48
Salgari24,19
Baricco23,82
Goethe23,76
Pavese23,50
Buzzati23,26
Dickens23,18
Hemingway 123,16
Omero22,30
Arpino22,18
Marquez21,52
Austen21,39
Poe20,18
Hesse20,06
Salinger19,22
Puskin18,62
Camus18,11
Eliot17,37
Verga17,33
Hemingway 216,82
Medie25,88

Analisi delle metriche rilevate

I valori dell’indice di Guiraud variano da un massimo di 39,61 (Saul Bellow) a un minimo di 16,82 (Hemingway di “Il vecchio e il mare”). Questo intervallo riflette un’ampia gamma di ricchezza lessicale e complessità stilistica.

  • Autori con indice alto (es. Bellow, Marinetti, Melville)
    Bellow (39,61): Lo stile di Saul Bellow è ricco e denso, caratterizzato da un vocabolario sofisticato e da profonde esplorazioni psicologiche. Questo è coerente con l’indice di Guiraud elevato, che segnala una ricchezza lessicale significativa.
    Marinetti (36,88): Il fondatore del futurismo italiano si distingue per un lessico innovativo e dinamico, ricco di neologismi e sperimentazioni linguistiche che riflettono un’elevata diversità lessicale.
    Melville (36,25): Autore di opere epiche come Moby Dick, la sua prosa è intrisa di termini nautici e riferimenti culturali, che contribuiscono a un vocabolario ampio e variegato.
  • Autori con indice medio (es. Eco, Flaubert, Calvino)
    Eco (33,86): sebbene utilizzi un vocabolario ricco, la struttura erudita dei suoi testi potrebbe presentare ripetizioni e tecnicismi che abbassano leggermente l’indice.
    Calvino (30,92): combina una semplicità apparente con una profonda riflessione concettuale. L’indice medio riflette la sua capacità di bilanciare accessibilità e complessità.
  • Autori con indice basso (es. Verga, Eliot, Camus)
    Verga (17,33): Lo stile verista mira a riprodurre il linguaggio quotidiano delle classi popolari, il che comporta un lessico più limitato ma funzionale al contesto.
    Eliot (17,37): Nonostante la profondità tematica, l’indice basso può derivare dall’uso frequente di simbolismi e allusioni ripetitive.
    Camus (18,11): Lo stile asciutto e diretto di Camus, caratteristico del suo approccio esistenzialista, predilige un vocabolario essenziale ma pregnante.

Considerazioni critiche

  • Impatto del genere letterario
    Romanzi epici e sperimentali: Autori come Melville e Marinetti ottengono punteggi più alti grazie all’esplorazione linguistica e tematica.
    Realismo e verismo: Scrittori come Verga e De Amicis hanno punteggi più bassi, coerenti con uno stile che privilegia la fedeltà alla realtà rispetto alla ricchezza lessicale.
  • Periodo storico e contesto culturale
    Autori modernisti e postmodernisti (Joyce, Woolf, Kafka) tendono a valori intermedi, indicando una complessità narrativa che bilancia innovazione stilistica e comprensibilità.
    Autori ottocenteschi come Dickens e Austen si situano più in basso, forse a causa di un vocabolario più standardizzato, sebbene ricco.
  • Stile personale
    Scrittori con un linguaggio simbolico o evocativo (Poe, Hesse) ottengono indici bassi, perché il loro approccio enfatizza la risonanza emotiva piuttosto che la varietà lessicale.
    Variabilità stilistica: Alcuni autori possono deliberatamente utilizzare uno stile semplice (ad esempio Hemingway).

Conclusione
L’indice di Guiraud offre un’interessante finestra sulla ricchezza lessicale degli scrittori e consente confronti quantitativi, ma per comprendere appieno le differenze stilistiche e culturali, è necessario abbinarlo a un’analisi qualitativa. In questo contesto, autori come Marinetti e Melville dimostrano una ricchezza lessicale funzionale alla loro innovazione stilistica, mentre scrittori come Verga e Camus scelgono un lessico più contenuto per scopi narrativi specifici.

Indici di Leggibilità per Paese

“Distribuzione dell’Indice di Guiraud per Periodo Letterario”
Questo grafico a dispersione mostra la relazione tra i periodi letterari e l’indice di Guiraud degli autori, dove:
- L’asse X rappresenta i quattro periodi principali: Contemporaneo, Moderno, Romantico e Realista
- L’asse Y mostra i valori dell’indice di Guiraud (da 15 a 45)
- Ogni punto rappresenta un autore, con colori diversi per periodo:
* Blu per gli autori contemporanei (Bellow, Eco, Calvino)
* Viola per i moderni (Marinetti, Eliot, Camus)
* Rosso per i romantici (Melville)
* Verde per i realisti (Verga).


Si può notare una chiara stratificazione:
- Gli autori contemporanei tendono ad avere indici più alti (30-40)
- Gli autori moderni mostrano una grande variabilità (17-37)
- Il periodo realista si colloca nella fascia più bassa (intorno a 17).


Indici di Leggibilità per Paese

“Caratteristiche Stilistiche per Genere Letterario. 
Questo grafico mostra tre dimensioni chiave dello stile letterario per ogni genere, utilizzando barre di progresso colorate:
- Ricchezza Lessicale (blu): rappresenta l’ampiezza del vocabolario
- Innovazione (viola): indica il grado di sperimentazione linguistica
- Complessità (rosso): misura la sofisticazione struttura.

Per ogni genere letterario:

1. Epico/Sperimentale: - Altissima ricchezza lessicale (90%) - Alta innovazione (80%) - Massima complessità (90%)
2. Postmoderno: - Buona ricchezza lessicale (70%) - Alta innovazione (80%) - Alta complessità (80%)
3. Realista/Verismo: - Media ricchezza lessicale (40%) - Bassa innovazione (30%) - Media complessità (50%)
4. Simbolista: - Media ricchezza lessicale (50%) - Alta innovazione (70%) - Alta complessità (80%)
5. Esistenzialista: - Media ricchezza lessicale (40%) - Media-alta innovazione (60%) - Alta complessità (70%)

La combinazione dei due grafici permette di:
- Visualizzare le tendenze storiche nella complessità linguistica
- Comprendere come diversi generi letterari si caratterizzino per diverse combinazioni di caratteristiche stilistiche
- Identificare patterns nella relazione tra periodo storico e scelte stilistiche
- Evidenziare come autori dello stesso periodo possano adottare approcci diversi alla ricchezza lessicale.Questo sistema di visualizzazione offre quindi una prospettiva sia diacronica (evoluzione nel tempo) che sincronica (varietà di stili in uno stesso periodo) della letteratura analizzata.

📊 Visualizzazione Interattiva dei Dati

Valore Massimo

-
-

Valore Minimo

-
-

Media

-
Su - autori

Deviazione Standard

-
Variabilità

🔍 Confronta Autori

VS

💡 Guida all'Uso della Visualizzazione Interattiva

🔍 Filtri e Controlli

  • Seleziona diverse metriche dal menu a tendina
  • Cambia il tipo di visualizzazione (barre o linea)
  • Filtra gli autori digitando parte del nome
  • Le statistiche si aggiornano automaticamente
  • Vengono mostrati i primi 20 autori per leggibilità

⚖️ Confronto Autori

  • Seleziona due autori diversi dai menu a tendina
  • Clicca "Confronta" per vedere una tabella dettagliata
  • Il migliore è determinato automaticamente per ogni metrica
  • Per l'Indice di Guiraud, valori più alti sono migliori
  • Per le altre metriche, valori più bassi indicano meno ripetizioni

📊 Interpretazione

  • Le barre colorate mostrano l'intensità dei valori
  • Le statistiche mostrano max, min, media e deviazione
  • Il filtro cerca in tutto il nome dell'autore
  • Esporta i dati per analisi ulteriori
  • I grafici si aggiornano automaticamente