Article mis en ligne le 24 mai 2011
Dans les entreprises et organismes publics, des quantités phénoménales d’informations sont créées ou transitent par le biais de la messagerie électronique. L’archivage électronique des emails, motivé par des raisons financières, patrimoniales et juridiques, s’avère en pratique particulièrement complexe. Diverses approches sont envisageables avec pour chacune des avantages et des limites.
***
Eric Schmidt, le PDG de Google, indiquait en novembre 2010, qu’il se produisait désormais en deux jours l’équivalent de tout ce que l’humanité avait créée depuis les origines de l’écriture jusqu’en 2003 ; soit 5 exoctets de données (ou 5 millions de Giga-octet).
Ce déluge d’information s’explique en partie par la généralisation de l’usage de la messagerie électronique dans les organisations. En 2010, 294 milliards d’emails étaient diffusés chaque jour dans le monde. Certes, près de 90 % correspondent à du spam mais les 10% restant représentent tout de même un volume d’information considérable. Comment conserver ou gérer la suppression de ces emails qui prolifèrent de façon plus ou moins anarchique ?
Archivage économique, archivage patrimonial et archivage « légal »
L’archivage électronique des mails répond à un triple objectif. En premier lieu, il y a une dimension financière qui motive particulièrement les DSI cherchant à éviter l’engorgement des serveurs de messagerie. Ensuite, dans le flot ininterrompu des emails se nichent certainement des informations importantes, relative au savoir-faire ou à l’expertise de l’organisation, auxquelles les utilisateurs se doivent d’avoir accès. Enfin, classiquement, il est nécessaire de préserver dans la durée les écrits qui engagent l’entreprise. Il convient ainsi de distinguer l’archivage économique, l’archivage patrimonial et l’archivage dit « légal ».
Pratiquement, l’archivage des emails se heurte à des difficultés qui tiennent à la fois au volume de l’information et à la nature particulière du courrier électronique. Comme l’indique la Fédération Nationale des Tiers de Confiance (FNTC) dans son « Guide de l’archivage électronique et du coffre-fort électronique » : « au vu de la multitude de courriers envoyés par chaque salarié chaque jour, on comprend bien que leur archivage total serait d’un coût prohibitif et de surcroit inutile ». Se pose ainsi la question de la sélection des mails qu’il convient de conserver.
Plus fondamentalement, le mail est un objet protéiforme qui complique singulièrement toutes les politiques d’archivage. Le courrier électronique peut-être à la fois un contenant, c’est-à-dire l’équivalent d’une enveloppe, ou un contenu. Il peut aussi revêtir le caractère d’une correspondance professionnelle ou d’une correspondance privée. Certains emails reprennent un historique d’échanges, avec des réponses qui sont insérées dans le texte initial. L’objet du message peut demeurer inchangé alors que les contenus les plus récents évoluent vers des sujets qui n’ont plus rien à voir avec l’objet initial. Difficile dans ces conditions, pour ne pas dire impossible, de procéder à un classement de l’information.
La complexité des cas de figure relatifs aux des pièces attachées peut rapidement conduire à des casse-têtes pratiquement insolubles. Les emails « gigogne » comportent des emails comme pièces attachées qui eux-mêmes peuvent contenir des emails et ainsi de suite. Les pièces attachées aux mails qui sont susceptibles de faire l’objet d’un archivage peuvent être des fichiers compressés comportant plusieurs fichiers, des documents chiffrés, des documents signés électroniquement … ou un peu de tout cela à la fois.
Trois types de solutions
Pour régler le problème de l’archivage des emails, à la fois indispensable et difficile à résoudre, trois grands types de solutions peuvent être envisagés. Le premier consiste à régler radicalement le problème en œuvrant pour la suppression des emails. C’est la stratégie annoncée en février 2011 par Thierry Breton, le PDG d’Atos, qui se donne trois ans pour atteindre cet objectif de migration vers d’autres outils de gestion des contenus. Cette démarche, marginale à ce jour, pourrait à terme être facilitée par le fait que les jeunes générations (de 11 à 19 ans), contrairement à leurs ainés, tendent à faire un usage limité de la messagerie électronique.
La deuxième approche correspond à un archivage à l’initiative des utilisateurs, qu’ils soient émetteurs ou destinataires. Cette démarche d’auto-archivage présente l’avantage de permettre une sélection des emails jugés importants tout en réduisant le risque d’archiver des correspondances privées, couvertes par le secret de la correspondance. Elle repose sur la sensibilisation des utilisateurs et sur la modification de leurs pratiques pour qu’ils deviennent plus disciplinés. Idéale en théorie, la solution apparaît en pratique risquée. Comment peut-on lutter contre une situation d’anarchie dans la production et la diffusion de l’information, issue des pratiques quotidiennes des utilisateurs, et demander à ces mêmes utilisateurs d’adopter des procédures rigoureuses et contraignantes qui vont à l’encontre de la souplesse procurée par la messagerie électronique ?
Enfin, la troisième approche repose sur une automatisation de la collecte des courriers électroniques à des fins d’archivage et ce, sans intervention des utilisateurs. On est plutôt ici dans une logique de stockage car la dimension « sélection » inhérente à l’archivage tend à disparaître. Le principal intérêt réside dans le fait que le risque d’égarer définitivement des informations vitales se réduit. Inversement, l’organisation se trouve dans une situation où elle risque d’archiver des mails au mieux inutiles et au pire dont la conservation est préjudiciable pour ses intérêts.
Complémentarité de l’archivage automatique et de l’archivage sélectif
Un bon compromis consiste en pratique à associer un archivage automatique en premier niveau et un archivage sélectif de deuxième niveau. Le premier type d’archivage, ou plus exactement de stockage, repose sur une collecte quasi-exhaustive des flux à l’exception de certains cas de figure comme les courriers électroniques comportant les mentions « personnel » ou « privé » dans l’objet. Il s’agit de préserver l’information pour la mettre à disposition des utilisateurs dans l’environnement de leur logiciel de messagerie habituel. Cet archivage économique et patrimonial autorise une réduction des coûts via la mise en œuvre de techniques de dédoublonnage. Il n’est pas utile de conserver en 15 exemplaires un mail et les pièces jointes associées. La durée de conservation de cet archivage a vocation à être relativement courte avec des procédures automatique de suppression.
En complément de ce premier niveau d’archivage, doit être mis également en œuvre un archivage à vocation probatoire, reposant sur des technologies de type coffre-fort électronique. Il s’agit ici d’assurer la conservation des emails qui sont susceptibles d’engager l’entreprise. Cet archivage « légal » de deuxième niveau peut être alimenté à l’initiative des utilisateurs mais aussi, de façon plus automatisée, en provenance du système d’archivage de premier niveau sur la base de critères prédéfinis (émetteurs, destinataires, mots-clés, …). L’objectif sera de conserver des preuves pour les mettre à disposition d’un public d’auditeurs ou de contrôleurs. Les durées de conservation peuvent être plus importantes et les suppressions ne doivent se faire qu’avec l’accord des services habilités.
Notons pour conclure que la procédure d’e-discovery, qui consiste à mettre à disposition de la partie adverse, dans un délai restreint, toutes les pièces existantes correspond à une disposition du droit américain à laquelle bien peu d’entreprises françaises sont en pratique soumises. Le choix d’un produit d’archivage « légal » des courriers électroniques ne doit donc pas, dans la plupart des cas, se fonder sur des questions de conformité aux exigences du droit américain en général et du e-discovery en particulier.
Toutes les solutions d’archivage des emails comportent des limites et des inconvénients mais une approche mixte permet de bénéficier du meilleur des deux mondes. De toute façon, la solution la plus risquée reste certainement celle qui consiste à ne rien faire.
Arnaud Belleil
A lire aussi