Epineuse enquête - Recherche 6

Recherche 6

 

Résumé

On cherche à élaborer un déchiffrement par analyse de fréquences

Discipline(s)

Mathématiques

Notions disciplinaires

Calcul de fréquences

Capacités, Attitudes travaillées

Utilisation de l’outil informatique

Production

Message déchiffré

Matériel nécessaire/utile

Documents, ordinateurs ou tablettes

Durée, modalités

1 séance

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dans cette séance on propose aux élèves d’élaborer une méthode de déchiffrement qui pourra permettre d’obtenir le message 2 en clair. La mise en place de cette méthode permet de travailler des notions autour des fréquences et de leurs représentations graphiques (éventuellement à l’aide d’un tableur) et éventuellement de travailler sur de la programmation (voir activité facultative). En repartant du message chiffré, on peut demander aux élèves de proposer des pistes de déchiffrement. Parmi ces pistes :

- retrouver les lettres possibles autour d’un apostrophe ;

- retrouver les doubles lettres ;

- tenir compte des fréquences d’apparition de chaque lettre.

 

Pour cette dernière piste, les élèves proposeront que le « E » est la lettre la plus fréquente dans la langue française, mais comment s'en assurer et comment connaître les fréquences d’apparition de chaque lettre ? On pourra proposer aux élèves de réaliser, à partir d’un texte, un travail collaboratif  pour obtenir cette information. Cette partie de l’activité peut être raccourcie en distribuant un tableau déjà fait, que l’on trouvera facilement sur internet.

Dans le cas contraire, chaque groupe d’élèves calcule la fréquence d’une lettre.

 

Exemple avec le texte donné dans l’activité (version à l’aide du traitement de texte Word).

 

Après partage des résultats, on peut obtenir le tableau de répartition des fréquences. Pour rendre ce tableau plus lisible, on va chercher à en obtenir une représentation graphique. Après réflexion, on cherchera à représenter les données brutes sous la forme d’un histogramme construit à la main ou sur excel. Il serait intéressant ici de discuter des différents types de représentations possibles de données brutes et de voir que l’histogramme ici est plus approprié que le diagramme circulaire…). Si on a fait travailler les élèves sur des textes différents, on peut faire superposer les histogrammes pour vérifier que la conclusion est généralisable.

 

Notes pédagogiques :

On peut réaliser le calcul des fréquences à la main ou à l’aide d’un outil informatique comme un traitement de texte. Dans ce cas, on peut procéder ainsi :

  • Pour avoir le nombre d’occurrences : Sous Word cliquer sur : Accueil/Modification/Remplacer (ex : a par a => nombre d’occurrence).
  • Pour avoir le nombre total de caractères  et la fréquence de chaque caractère, il est plus simple d’utiliser un tableur Excel.

 

Voici les fréquences moyennes (en %) de chaque lettre dans la langue française  :

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Y

Z

9,42

1,02

2,64

3,39

15,87

0,95

1,04

0,77

8,41

0,89

0

5,34

3,24

7,15

5,14

2,86

1,06

6,46

7,9

7,26

6,24

2,15

0

0,3

0,24

0,07

 

Les élèves doivent ensuite appliquer ces informations à la résolution de leur problème. Il faut en effet rechercher la lettre la plus fréquente dans le message crypté et faire l’hypothèse qu’il s’agisse du « e ». Après avoir changé cette lettre en « e », le travail se poursuit avec d’autres lettres, ou avec les deux autres pistes trouvées en début d’activité. Parfois, plusieurs hypothèses pourront apparaître équiprobables et les élèves pourront se répartir les tests de chacune d’entre elles. Comme tout à l’heure, on peut substituer le travail à la main par un travail à l’aide d’un traitement de texte. Cette fois, on remplacera chaque lettre du message chiffré par la lettre à laquelle elle correspond (que l’on pourra écrire en minuscule pour différencier les parties en clair et chiffrées).

L’activité pourrait même aboutir à l’élaboration d’un algorithme en informatique qui automatise le déchiffrement.

Ce site vous sera précieux dans vos chiffrements et déchiffrements, et il peut même être utilisé par les élèves à la place d'un traitement de texte : http://www.dcode.fr/                                                                                                                                                           Attention cependant car les élèves pourraient rapidement l'utiliser pour d'autres éléments que la simple analyse de fréquences (que l'on trouvera ici : http://www.dcode.fr/analyse-frequences).

Bilan : On complète les notions de chiffrement (clé, code Cesar par substitution) et son déchiffrement par analyse de fréquences.

 

Résultats du déchiffrement

Je suis désormais en possession de votre photographie. Elle pourrait vous être amenée dès demain par mon valet. Comme vous le souhaitiez, PM et PB sont suffisamment visibles. Il y a seulement un souci. Je voudrais qu’on reparle de l’accord. Vous conviendrez que tout travail mérite salaire. AC

Le dernier message est plus compliqué puisqu’il n’y a pas de ponctuation et l'apostrophe a été enlevée. La clé a également changé mais le principe reste le même. . Il n’est pas indispensable pour l’enquête et ne représente qu’une activité pour les élèves plus rapides ou plus motivés. L’intérêt de ce dernier message est que, en l’absence d’autres types d’informations, tout le déchiffrement repose sur une analyse par fréquences. Volontairement nous avons choisi un message court mais dont les fréquences des lettres les plus courantes correspondent globalement à celles de l'alphabet français (Sur 103 lettres : 16 E, 12 A, 10 S et 9 I). Après avoir placé les 4 lettres principales, des hypothèses doivent être faites. Les suivantes peuvent être des N, des R ou des T (en fait les O sont sur représentés dans ce message). Pour chaque hypothèse, les élèves tentent de modifier le message et ne conservent l'hypothèse que si elle semble apporter des modifications cohérentes.

Une dernière fois mademoiselle Adler. Si vous venez à la soirée sans la moitié de sa rançon, il n'y aura pas de cliché pour vous. AC

 

 

 

Proposition d'activité

On cherche maintenant à trouver une procédure pour casser le code.

 

Défi b : Vous allez devoir trouver un système pour déchiffrer les messages chiffrés retrouvés sur la victime !

 

  • Consigne : Pour vous mettre sur la piste d’une méthode de déchiffrement, étudiez ce texte et repérez une anomalie !

Texte de « La disparition » de Georges Perec

« Sur l'abattant du vasistas, un animal au thorax indigo, à l'aiguillon safran, ni un cafard, ni un charançon, mais plutôt un artison, s'avançait, traînant un brin d'alfa. Il s'approcha, voulant l'aplatir d'un coup vif, mais l'animal prit son vol, disparaissant dans la nuit avant qu'il ait pu l'assaillir. »

 

  • Consigne : Utilisez le texte suivant pour proposer une méthode de déchiffrement possible.

Texte issu d’un roman

« C’était de nouveau la nuit. L’auberge de la Pierre levée était envahie par le silence, un silence en trois parts. Le premier était un calme en creux, l’écho de choses absentes. S’il y avait eu du vent, il aurait soupiré en passant entre les arbres, fait grincer la chaîne de l’enseigne et chassé le silence sur la route comme un tas de feuilles mortes. S’il y avait eu une foule de clients, même une poignée seulement, attablés dans la salle de l’auberge, ils auraient rempli le silence de leurs conversations et de leurs rires, du vacarme et des clameurs que l’on s’attend à trouver dans un débit de boissons à une heure avancée de la nuit. S’il y avait eu de la musique... mais non, bien sûr, il n’y avait pas de musique. En fait, il n’y avait rien de tout cela et seul le silence demeurait ».

 

 

  • Consigne : Utilisez la méthode de déchiffrement découverte pour tenter de déchiffrer les messages 2 et 3 !

 

 

Partenaires du projet

Fondation La main à la pâte