% Parole ripetute
Indica la percentuale di parole che compaiono più di una volta rispetto al totale delle parole usate in un testo.
Utilità: valuta la varietà lessicale e individua ridondanze o povertà di vocabolario.
% Ripetizione globale
Percentuale di tutte le occorrenze di parole ripetute sul totale delle parole presenti nel testo.
Utilità: misura quanto il testo sia dominato da ripetizioni.
% Ripetizione lessicale
Percentuale di ripetizione riferita solo alle parole “di contenuto” (nomi, verbi, aggettivi).
Utilità: evidenzia se la ripetizione riguarda termini chiave e concetti importanti.
Coefficiente di ripetizione
Indice che misura la tendenza di un testo a ripetere le stesse parole (token/type).
Utilità: quantifica la ricchezza o la povertà lessicale.
Frequenza media delle parole
Valore medio di quante volte ciascuna parola viene utilizzata nel testo.
Utilità: misura sintetica della ripetitività.
Questi indicatori sono fondamentali per valutare la qualità, la leggibilità e la varietà di un testo, sia in ambito letterario che scientifico. Aiutano a individuare stili ridondanti, a migliorare la scrittura e a confrontare testi diversi in modo oggettivo.
| Autore | % parole ripetute | % ripetizione globale | % ripetizione lessicale | Coefficiente di ripetizione | Frequenza media delle parole |
|---|---|---|---|---|---|
| Omero | 43,56 | 92,31 | 43,56 | 7,34 | 7,34 |
| Verga | 42,44 | 91,81 | 42,44 | 7,03 | 7,03 |
| Tolstoj | 41,31 | 93,13 | 41,31 | 8,55 | 8,55 |
| Salinger | 40,61 | 90,45 | 40,61 | 6,22 | 6,22 |
| Austen | 40,49 | 91,29 | 40,49 | 6,83 | 6,83 |
| Dumas | 40,31 | 92,52 | 40,31 | 7,97 | 7,97 |
| Cervantes | 39,24 | 92,23 | 39,24 | 7,82 | 7,82 |
| Dostoevskij | 39,20 | 92,13 | 39,20 | 7,73 | 7,73 |
| Manzoni | 39,14 | 90,08 | 39,14 | 6,13 | 6,13 |
| Hemingway 1 | 38,35 | 88,93 | 38,35 | 5,57 | 5,57 |
| Brown | 37,95 | 88,67 | 37,95 | 5,48 | 5,48 |
| Salgari | 37,90 | 87,87 | 37,90 | 5,12 | 5,12 |
| Murakami | 37,37 | 88,11 | 37,37 | 5,27 | 5,27 |
| Woolf | 37,30 | 89,57 | 37,30 | 6,01 | 6,01 |
| Mann | 36,51 | 89,47 | 36,51 | 6,03 | 6,03 |
| Buzzati | 36,35 | 85,67 | 36,35 | 4,44 | 4,44 |
| De Amicis | 36,06 | 87,52 | 36,06 | 5,12 | 5,12 |
| Moravia | 35,72 | 88,30 | 35,72 | 5,50 | 5,50 |
| Hemingway 2 | 35,52 | 85,52 | 35,52 | 4,45 | 4,45 |
| Camus | 34,83 | 85,71 | 34,83 | 4,56 | 4,56 |
| Eco | 34,82 | 87,69 | 34,82 | 5,29 | 5,29 |
| Melville | 34,69 | 87,62 | 34,69 | 5,27 | 5,27 |
| D’Annunzio | 34,57 | 84,96 | 34,57 | 4,35 | 4,35 |
| Baricco | 34,02 | 85,00 | 34,02 | 4,40 | 4,40 |
| London | 33,75 | 84,64 | 33,75 | 4,31 | 4,31 |
| Hesse | 32,89 | 83,33 | 32,89 | 4,02 | 4,02 |
| Joyce | 32,85 | 84,02 | 32,85 | 4,20 | 4,20 |
| Flaubert | 32,81 | 84,73 | 32,81 | 4,40 | 4,40 |
| Wilde | 32,37 | 85,29 | 32,37 | 4,60 | 4,60 |
| Marquez | 32,14 | 82,30 | 32,14 | 3,83 | 3,83 |
| Bellow | 32,06 | 84,80 | 32,06 | 4,47 | 4,47 |
| Marinetti | 31,93 | 80,54 | 31,93 | 3,50 | 3,50 |
| Pavese | 31,92 | 82,61 | 31,92 | 3,91 | 3,91 |
| Lee | 31,86 | 84,23 | 31,86 | 4,32 | 4,32 |
| James | 31,78 | 83,70 | 31,78 | 4,18 | 4,18 |
| Pirandello | 31,74 | 83,71 | 31,74 | 4,19 | 4,19 |
| Sartre | 31,71 | 83,87 | 31,71 | 4,23 | 4,23 |
| Balzac | 31,70 | 83,39 | 31,70 | 4,11 | 4,11 |
| Goethe | 31,02 | 82,61 | 31,02 | 3,97 | 3,97 |
| Calvino | 30,91 | 83,01 | 30,91 | 4,07 | 4,07 |
| Fitzgerald | 30,85 | 81,57 | 30,85 | 3,75 | 3,75 |
| Pasolini | 30,15 | 81,45 | 30,15 | 3,77 | 3,77 |
| Camilleri | 29,66 | 79,30 | 29,66 | 3,40 | 3,40 |
| Voltaire | 29,60 | 81,34 | 29,60 | 3,77 | 3,77 |
| Conrad | 29,00 | 79,04 | 29,00 | 3,39 | 3,39 |
| Proust | 28,93 | 81,21 | 28,93 | 3,78 | 3,78 |
| Kafka | 28,60 | 80,63 | 28,60 | 3,69 | 3,69 |
| Dickens | 28,17 | 79,22 | 28,17 | 3,46 | 3,46 |
| Poe | 27,91 | 76,04 | 27,91 | 3,01 | 3,01 |
| Puskin | 26,63 | 71,65 | 26,63 | 2,59 | 2,59 |
| Arpino | 21,32 | 64,70 | 21,32 | 2,23 | 2,23 |
| Eliot | 20,92 | 57,55 | 20,92 | 1,86 | 1,86 |
La tabella evidenzia alcuni aspetti interessanti riguardanti l’uso della ripetizione lessicale nei testi di diversi autori. Ecco un’analisi stilistica basata sui dati forniti:
Il grafico a barre mostra i 10 autori con la più alta percentuale di ripetizione globale.
Per ogni autore, vengono mostrati tre valori:
Percentuale di ripetizione globale (in viola).
Percentuale di parole ripetute (in verde).
Coefficiente di ripetizione (in giallo.
Una linea di riferimento rossa che indica la media globale. Tre box riassuntivi mostrano le medie generali dei tre parametri principali.
Alcuni aspetti interessanti che emergono:
Tolstoj ha il più alto tasso di ripetizione globale (93.13%)
Omero ha la più alta percentuale di parole ripetute (43.56%).
Tutti gli autori mostrati sono significativamente sopra la media generale
C’è una correlazione visibile tra i tre parametri
Cos’è: È un indice di varietà lessicale che si calcola come il rapporto tra il numero di tipi (parole uniche) e la radice quadrata del numero totale di token (parole totali).
Cosa indica: Misura quanto sia vario il vocabolario usato, normalizzando la lunghezza del testo (che influenza il TTR).
Utilità: È utilizzato per valutare la complessità del vocabolario in un testo, correggendo il bias dovuto alla lunghezza.
| Autore | Indice Guiraud |
|---|---|
| Bellow | 39,61 |
| Marinetti | 36,88 |
| Melville | 36,25 |
| Mann | 35,67 |
| Eco | 33,86 |
| Flaubert | 33,24 |
| D’Annunzio | 32,45 |
| Cervantes | 31,55 |
| Calvino | 30,92 |
| Manzoni | 28,67 |
| Balzac | 28,35 |
| Pirandello | 28,25 |
| Kafka | 28,22 |
| Sartre | 27,98 |
| Wilde | 27,79 |
| Dumas | 27,25 |
| Woolf | 27,10 |
| Joyce | 26,98 |
| Conrad | 26,87 |
| Camilleri | 26,55 |
| Brown | 26,46 |
| Fitzgerald | 26,39 |
| Dostoevskij | 26,36 |
| Voltaire | 26,31 |
| Murakami | 25,95 |
| James | 25,60 |
| Moravia | 25,40 |
| London | 25,10 |
| Tolstoj | 25,07 |
| Proust | 25,03 |
| De Amicis | 24,76 |
| Lee | 24,72 |
| Pasolini | 24,48 |
| Salgari | 24,19 |
| Baricco | 23,82 |
| Goethe | 23,76 |
| Pavese | 23,50 |
| Buzzati | 23,26 |
| Dickens | 23,18 |
| Hemingway 1 | 23,16 |
| Omero | 22,30 |
| Arpino | 22,18 |
| Marquez | 21,52 |
| Austen | 21,39 |
| Poe | 20,18 |
| Hesse | 20,06 |
| Salinger | 19,22 |
| Puskin | 18,62 |
| Camus | 18,11 |
| Eliot | 17,37 |
| Verga | 17,33 |
| Hemingway 2 | 16,82 |
| Medie | 25,88 |
I valori dell’indice di Guiraud variano da un massimo di 39,61 (Saul Bellow) a un minimo di 16,82 (Hemingway di “Il vecchio e il mare”). Questo intervallo riflette un’ampia gamma di ricchezza lessicale e complessità stilistica.
Conclusione
L’indice di Guiraud offre un’interessante finestra sulla ricchezza lessicale degli scrittori e consente confronti quantitativi, ma per comprendere appieno le differenze stilistiche e culturali, è necessario abbinarlo a un’analisi qualitativa. In questo contesto, autori come Marinetti e Melville dimostrano una ricchezza lessicale funzionale alla loro innovazione stilistica, mentre scrittori come Verga e Camus scelgono un lessico più contenuto per scopi narrativi specifici.
“Distribuzione dell’Indice di Guiraud per Periodo Letterario”
Questo grafico a dispersione mostra la relazione tra i periodi letterari e l’indice di Guiraud degli autori, dove:
- L’asse X rappresenta i quattro periodi principali: Contemporaneo, Moderno, Romantico e Realista
- L’asse Y mostra i valori dell’indice di Guiraud (da 15 a 45)
- Ogni punto rappresenta un autore, con colori diversi per periodo:
* Blu per gli autori contemporanei (Bellow, Eco, Calvino)
* Viola per i moderni (Marinetti, Eliot, Camus)
* Rosso per i romantici (Melville)
* Verde per i realisti (Verga).
Si può notare una chiara stratificazione:
- Gli autori contemporanei tendono ad avere indici più alti (30-40)
- Gli autori moderni mostrano una grande variabilità (17-37)
- Il periodo realista si colloca nella fascia più bassa (intorno a 17).
“Caratteristiche Stilistiche per Genere Letterario.
Questo grafico mostra tre dimensioni chiave dello stile letterario per ogni genere, utilizzando barre di
progresso colorate:
- Ricchezza Lessicale (blu): rappresenta l’ampiezza del vocabolario
- Innovazione (viola): indica il grado di sperimentazione linguistica
- Complessità (rosso): misura la sofisticazione struttura.