Clavier Dvorak pour la langue française
Ergonomie du poste de travail informatique

Fréquence des caractères,
digrammes et trigrammes
dans un texte en langue française

Les données de ces tables de fréquence ont été produites à l'aide d'un programme écrit en Common Lisp, en analysant un texte d'environ 200.000 caractères (Cahier des exigences pour le collégien, un document du ministère de l'éducation nationale, France). Un corpus de textes français plus important, comportant par exemple plusieurs millions de caractères, ne donne pas de différences significatives dans les résultats, au moins dans le contexte de la conception d'un clavier Dvorak pour la langue française.

Fréquence des caractères et signes de ponctuationretour au sommaire


%

A

6.03

À

0.45

Â

0.03

B

0.54

C

3.58

Ç

0.06

D

3.73

E

14.49

È

0.50

É

2.47

Ê

0.10

F

1.01

G

1.19

H

0.73

I

7.18

Î

0.07

Ï

0.00

J

0.20

K

0.00

L

5.58

M

2.55

N

7.02

O

5.21

Ô

0.03

P

2.90

Q

1.06

R

6.49

S

8.38

T

7.12

U

5.07

Ù

0.01

Û

0.02

V

1.34

W

0.00

X

0.55

Y

0.22

Z

0.02



virg

1.29

apos

1.18

pt

0.69

-

0.23

:

0.14

(

0.14

)

0.14

pt-v

0.13

guil

0.10

?

0.03

/

0.01

%

0.00

=

0.00

!

0.00

Note : le texte contient aussi quelques œ (0.04%) mais aucun æ.

Fréquence des caractèresretour au sommaire

E

14.49

S

8.38

I

7.18

T

7.12

N

7.02

R

6.49

A

6.03

L

5.58

O

5.21

U

5.07

D

3.73

C

3.58

P

2.90

M

2.55

É

2.47

V

1.34

G

1.19

Q

1.06

F

1.01

H

0.73

X

0.55

B

0.54

È

0.50

À

0.45

Y

0.22

J

0.20

Ê

0.10

Î

0.07

Ç

0.06

Â

0.03

Ô

0.03

Z

0.02

Û

0.02

Ù

0.01

K

0.00

Ï

0.00

W

0.00

 

Fréquence des digrammesretour au sommaire

ES

3.97

EN

2.59

LE

2.21

DE

2.16

ON

2.15

RE

2.12

NT

2.12

TI

1.72

QU

1.28

ER

1.21

CO

1.13

AN

1.12

TE

1.12

LA

1.11

UE

1.11

ET

1.10

ME

1.10

NS

1.04

UR

1.03

IS

1.02

IO

0.99

IT

0.93

SE

0.93

NE

0.88

AT

0.88

PR

0.87

RA

0.86

OU

0.84

IN

0.83

CE

0.79

TR

0.77

AI

0.76

VE

0.74

UN

0.71

IE

0.71

IR

0.70

L'

0.69

RI

0.67

SI

0.66

ST

0.64

AU

0.62

OR

0.62

EU

0.62

LI

0.61

AR

0.60

PA

0.56

IQ

0.56

RO

0.56

E,

0.53

EL

0.53

IL

0.52

EM

0.51

MA

0.51

OI

0.50

SS

0.50

OM

0.50

NC

0.49

AL

0.49

S,

0.48

0.48

PO

0.47

D'

0.46

RT

0.45

DI

0.45

LL

0.45

0.44

PE

0.43

UT

0.43

CI

0.42

SA

0.42

EC

0.41

TA

0.41

PL

0.41

RS

0.40

CH

0.40

UI

0.39

US

0.39

NI

0.38

DU

0.38

CT

0.38

SO

0.38

IV

0.38

TS

0.38

OL

0.37

ND

0.36

GE

0.35

TU

0.35

ÉR

0.34

MP

0.33

CA

0.33

VI

0.32

ÉS

0.32

E

0.32

NN

0.31

EX

0.31

UL

0.31

AC

0.30

0.30

A

0.30

TO

0.30

0.29

AP

0.29

FO

0.29

UX

0.29

DA

0.29

MM

0.28

NA

0.28

NO

0.28

GR

0.28

ÉC

0.28

ÉL

0.27

IC

0.27

AV

0.26

AS

0.26

IM

0.26

LO

0.26

RM

0.26

IF

0.26

SU

0.25

LU

0.25

OG

0.25

CU

0.25

ÉT

0.25

FI

0.25

MO

0.24

ÉE

0.24

E.

0.23

S.

0.23

DO

0.23

SC

0.23

É

0.23

MI

0.22

PP

0.22

VO

0.22

AM

0.21

AG

0.21

VA

0.21

UV

0.20

FA

0.20

IG

0.20


Fréquence des digrammes à 2 voyellesretour au sommaire


occurences

%

UE

1620

1.11

IO

1450

0.99

OU

1235

0.84

AI

1115

0.76

IE

1039

0.71

AU

914

0.62

EU

902

0.62

OI

732

0.5

UI

576

0.39

ÉE

347

0.24

EI

197

0.13

163

0.11

IA

163

0.11

122

0.08

ÉA

119

0.08

115

0.08

UA

101

0.07

ÉO

91

0.06

EA

88

0.06

OE

68

0.05

60

0.04

UO

26

0.02

21

0.01

19

0.01

ÉÂ

19

0.01

ÉI

15

0.01

OO

13

0.01

ÉU

8

0.01

7

0

II

7

0

7

0

3

0

ÉÉ

3

0

3

0

IU

3

0

ÏE

1

0

1

0

AO

1

0

1

0

1

0

EO

1

0

Total de tous les digrammes: 146452 occurences

 

Fréquence des trigrammesretour au sommaire

ENT

1.66

LES

1.24

ION

1.2

QUE

1.12

TIO

1.01

DES

0.86

ATI

0.84

MEN

0.73

IQU

0.7

RES

0.53

IRE

0.51

CON

0.48

ONS

0.48

EME

0.45

PAR

0.44

ANT

0.42

EUR

0.42

PRO

0.42

COM

0.41

UES

0.4

TRE

0.4

ONT

0.38

REN

0.38

OUR

0.38

NCE

0.36

LLE

0.36

UNE

0.36

ES,

0.36

EST

0.35

ANS

0.35

ITÉ

0.34

AIR

0.32

NTE

0.32

ELL

0.32

ENS

0.32

URE

0.32

IEN

0.31

CES

0.31

ENC

0.28

ART

0.27

DAN

0.27

ONN

0.27

PRE

0.27

GRA

0.27

CTI

0.26

NTS

0.26

ESS

0.26

TRA

0.26

IVE

0.26

QUI

0.26

COL

0.26

SON

0.25

TIQ

0.25

ALE

0.25

TUR

0.25

NNE

0.24

TES

0.24

ÈVE

0.24

MME

0.24

LÈV

0.23

AUX

0.23

RAN

0.23

OIR

0.23

SSE

0.23

OMP

0.23

ÉLÈ

0.23

SSI

0.23

TER

0.23

ECT

0.23

URS

0.23

SEN

0.22

L'É

0.22

AIS

0.22

ISE

0.22

POU

0.22

CUL

0.22

LEU

0.22

FOR

0.22

RTI

0.22

PER

0.21

APP

0.21

VER

0.21

IST

0.21

OMM

0.2

MAT

0.2

ERS

0.2