
La stéganographie est l'art ou la science de la dissimulation des communications. Elle fait partie des méthodes d'espionnage et des stratégies militaires depuis plus des millénaires. Dans les Histoires d'Hérodote, écrites en 440 avant Jésus-Christ, l'auteur raconte l'histoire d'Histiaeus qui a rasé la tête de son esclave le plus fidèle afin d'y tatouer un message avant de l'envoyer, une fois sa chevelure repoussée, à travers les lignes ennemies pour livrer ce message. Contrairement à la cryptographie, pour laquelle le message est évident, mais la signification demeure obscure, le but de la stéganographie consiste à cacher complètement le message pour que seuls l'expéditeur et le destinataire en connaissent l'existence, une méthode que Ken Sala du Centre de recherches sur les communications (CRC) appelle la « dissimulation en plein jour ». Et comme chaque chose du monde moderne, la stéganographie est passée à l'ère numérique.
« La plupart des gens l'ignorent, mais chaque fois qu'ils visitent un site Web, ils téléchargent les photographies de ce site dans leur ordinateur », explique Ken Sala.
Cette situation et la récente prolifération de logiciels stéganographiques peu coûteux et faciles à utiliser signifient que ces personnes possèdent peut-être déjà, à leur insu, des fichiers modifiés ou « sales » dans leur ordinateur. Une telle situation inquiète beaucoup d'entreprises et de ministères. La majorité des logiciels stéganographiques servent à des fins légitimes, mais on craint que ces puissants programmes soient utilisés pour dissimuler des activités illégales, comme le vol de secrets commerciaux ou l'échange de pornographie juvénile. Les entreprises privées et les ministères cherchent comment protéger leurs ordinateurs et leurs sites Web contre les fichiers corrompus.
« Quand on apprend que le nombre d'images échangées quotidiennement sur Internet dépasse les 2,5 billions », souligne Ken Sala, « on saisit instantanément l'ampleur éventuelle du problème. »
La plupart des logiciels stéganographiques sont utilisés de façon légitime pour protéger des fichiers d'ordinateur. À l'ère de l'ordinateur portatif, chaque disque dur peut contenir des fichiers commerciaux secrets, des mots de passe bancaires ou des renseignements personnels. De tels logiciels peuvent servir à cacher l'information sensible et, ainsi, à la protéger en cas de perte ou de vol d'un ordinateur portatif. De nombreuses entreprises souhaitent également protéger leurs ordinateurs de bureau en milieu de travail, et surtout ceux utilisés par des personnes travaillant sur des projets classifiés.
Ken Sala s'intéresse à un autre aspect de la stéganographie, soit la science de la stéganalyse. Le but de la stéganographie consiste à dissimuler le message, mais les recherches de Ken Sala portent plutôt sur les façons de détecter les fichiers modifiés. La stéganographie numérique nécessite un ou plusieurs fichiers de transport (souvent des fichiers images) et l'image ou le message que l'expéditeur souhaite caché. Ce qu'il faut comprendre, explique Ken Sala, c'est que les logiciels stéganographiques intègrent l'image cachée dans le code binaire du fichier de transport. Il n'y a aucune « image dans l'image ». Même si vous observiez sans arrêt, vous ne verriez jamais le fin contour de l'image cachée. En fait, explique Ken Sala, la stéganographie numérique utilise le code binaire pour exploiter une faiblesse de l'œil humain.
Chaque pixel d'une image numérique est composé de 24 bits d'information, c'est-à-dire d'une série de « 0 » et de « 1 » qui détermine la couleur du pixel. Avec ces 24 bits, un ordinateur peut générer plus de 16 millions de couleurs, soit bien plus que l'œil peut en distinguer. Ainsi, pour dissimuler un message, les logiciels stéganographiques « volent » des bits à chaque pixel et les remplacent par le code binaire du fichier numérique secret. En volant seulement les bits les moins importants de chaque pixel, l'œil humain ne peut pas détecter la très légère altération des teintes. Ainsi donc, quelle quantité d'information peut-on cacher dans un cliché?
« Songeons seulement à une caméra numérique ordinaire », explique Ken Sala. « Chaque image contient 3 600 pixels sur 2 400 pixels, et chaque pixel compte 24 bits. Je peux facilement voler six bits à chaque pixel sans altérer de façon visible les couleurs. Cela signifie donc que je peux cacher un message de plus de 50 mégabits dans chaque image. Le texte complet de la Bible compte moins de 50 mégabits. »
Pour extraire l'image ou le message caché, le destinataire doit utiliser un logiciel pour dépouiller le code du fichier de transport et obtenir ainsi le code du message secret. Il réassemble ensuite les bits pour former un fichier JPG, GIF ou autre. La simple substitution du code du message caché aux bits les moins significatifs est relativement facile à détecter, précise Ken Sala, mais les nouveaux outils stéganographiques de pointe permettent aux utilisateurs de chiffrer leur code avant de l'intégrer dans le fichier de transport ou de le répartir dans plusieurs fichiers. Chaque image de l'« album de famille » peut donc contenir une partie chiffrée du code de l'image ou du message caché. Voilà ce qui rend extrêmement difficile la détection de ces fichiers modifiés, s'exclame Ken Sala.
Les recherches de Ken Sala se concentrent sur l'utilisation des réseaux neuronaux pour détecter les fichiers cachés. Les réseaux neuronaux, explique-t-il, sont des réseaux d'ordinateurs composés de simples « neurones artificiels » qui traitent de l'information. Ensemble, ces « neurones artificiels » fonctionnent beaucoup comme le cerveau humain, c'est-à-dire qu'ils tirent des leçons de leurs expériences passées et qu'ils trouvent de nouvelles façons de résoudre des problèmes. Selon Ken Sala, l'utilisation d'un réseau neuronal pour la recherche de fichiers modifiés comporte un double avantage. Premièrement, les réseaux neuronaux peuvent traiter de grandes quantités d'information.
« Vous pouvez présenter des dizaines de milliers d'images par seconde à ces réseaux neuronaux pour obtenir une réponse instantanée : correct ou suspect. »
Deuxièmement, ils sont capables d'apprendre à mesure que les stéganographes complexifient leurs convolutions pour dissimuler de l'information et, conséquemment, d'évoluer et de s'y adapter. Mais avant d'effectuer une tâche complexe comme la détection de fichiers cachés, indique Ken Sala, il faut entraîner chaque réseau neuronal en lui présentant le plus grand nombre possible de variétés de fichiers propres ou modifiés.
« Cet apprentissage ressemble à celui d'un enfant. On commence par des choses simples, puis on passe à des éléments plus difficiles tout en formulant continuellement des commentaires. »
Ken Sala construit actuellement une base de données de fichiers propres et sales et il essaie de trouver les façons les plus abjectes d'intégrer des messages cachés. Ces fichiers serviront ensuite à entraîner chaque réseau neuronal à détecter les anomalies structurelles d'un fichier dissimulant un message caché. S'il réussit, s'il devient capable d'entraîner un réseau neuronal à signaler des fichiers suspects, alors il obtiendra l'équivalent d'un chien-pisteur. Grâce à un outil aussi puissant et à sa grande capacité de traitement de fichiers en peu de temps, on pourra consacrer les ressources au craquage de fichiers suspects seulement.
« Pour accomplir une tâche semblable », affirme Ken Sala, « nous avons besoin d'un dispositif rapide, capable d'évoluer et d'apprendre, mais nous avons aussi besoin d'un outil conçu en interne, qui n'appartient pas au domaine public. Chaque fois qu'un nouveau type de logiciel stéganographique est mis sur le marché, les personnes qui utilisent cette technologie à des fins illicites savent déjà comment le contourner. Les réseaux neuronaux rendront un tel contournement presque impossible. »
Pour de plus amples renseignements, veuillez communiquer avec Ken Sala, chercheur scientifique, Électroniques intégrées, à info@crc.gc.ca ou au 613-998-2823.