Le CLESSN de l’Université Laval et Unicorne partagent en toute sécurité leurs recherches sur AWS Université Laval

Industrie

Éducation

Service

Développement infonuagique

Technologies

Amazon Elastic Container Service (Amazon ECS), Amazon Athena, Amazon CloudFront, AWS CDK, AWS Glue, Amazon GuardDuty, AWS Lake Formation, Amazon Elastic Container Registry (Amazon ECR), Amazon Relational Database Service (Amazon RDS), Amazon Simple Storage Service (Amazon S3)

Contexte

Le CLESSN de l’Université Laval et Unicorne partagent en toute sécurité leurs recherches sur AWS

La chaire de leadership en enseignement des sciences sociales numériques (CLESSN) de l’Université Laval a recueilli des centaines de gigaoctets de données pour éclairer le public et la recherche sociale en analysant les niveaux d’humeur des répondants au sondage, les manchettes des principaux médias canadiens et la prise de décision politique. Cependant, il lui manquait un moyen de partager ces données de manière sécurisée et conforme entre ses nombreux instituts de recherche.

 

Le CLESSN a migré une partie de son infrastructure informatique vers Amazon Web Services (AWS) en travaillant aux côtés d’AWS Select Public Sector Partner, Unicorne. Les deux organisations ont également travaillé ensemble pour développer une application Web qui permet au public, aux médias, aux chercheurs et aux décideurs politiques d’analyser l’opinion du public et d’éclairer leur prise de décision tout en anonymisant les informations personnelles identifiables afin de protéger la vie privée des individus dans leurs recherches sociales.

Résultats

Surmonter les obstacles à la collaboration en matière de recherche sur AWS

Lors de la pandémie de COVID-19, Yannick Dufresne, titulaire de la chaire de recherche du CLESSN de l’Université Laval, a lancé une initiative financée par le gouvernement du Québec et divers groupes de recherche, le Projet Quorum. L’initiative utilise une application Web qui regroupe des données pour évaluer le sentiment de l’opinion publique, des médias canadiens et des décideurs du pays en temps quasi réel.

 

En juillet, le projet avait collecté 5 To de données, avec un taux de croissance de 500 Go par mois. Auparavant, l’équipe de M. Dufresne collectait des données à partir d’un ordinateur et les téléchargeait manuellement sur un serveur. Cependant, comme l’université dispose d’un système décentralisé composé de nombreux serveurs sur site et d’équipes informatiques disparates, il était difficile de transférer les données d’un serveur à l’autre afin que d’autres équipes de recherche puissent y accéder. Beaucoup de temps a été consacré à la gestion du système et à la mise en œuvre du nouveau matériel pour générer la puissance de calcul nécessaire pour faire face aux pics de trafic. En outre, la préparation des grands ensembles de données pour l’analyse prenait beaucoup de temps. Les chercheurs ont passé 80 % de leur temps à nettoyer, marquer et anonymiser les données et seulement 5 % de leur temps à les analyser.

 

Le CLESSN a choisi de travailler avec Unicorne en raison des recommandations d’autres institutions internes du fournisseur de services cloud. « Nous avons beaucoup de données et de connaissances scientifiques mais peu de compétences techniques », explique M. Dufresne. « C’est pourquoi nous avons commencé à travailler avec Unicorne. » Unicorne et le CLESSN ont décidé de créer une solution qui évoluerait automatiquement pour répondre au trafic et permettre l’analyse des données, anonymiser les informations personnelles identifiables et servir de pont entre le lac de données de l’université et les différents groupes interrogés.

Solution

Créer une application sécurisée et conforme pour la recherche

Le CLESSN et Unicorne ont commencé à développer le Projet Quorum en juillet. En septembre, la première version du Projet Quorum était prête et Unicorne avait terminé la migration des données vers AWS. En octobre, Unicorne a présenté la preuve de concept à l’ensemble des 42 parties prenantes de l’Université Laval. Elle a complété la version alpha du Projet Quorum en novembre et l’a présentée au doyen de la faculté de l’université en décembre. Le projet s’est achevé en février, soit seulement 7 mois après son démarrage.

Pour son infrastructure informatique, l’Université Laval et Unicorne ont profité d’AWS Fargate, un moteur de calcul sans serveur pour conteneurs qui élimine le besoin de provisionner et de gérer des serveurs. En migrant vers le cloud, le CLESSN a pu faire évoluer automatiquement son application et économiser sur les coûts informatiques. Pour analyser et répondre à sa demande de trafic aux heures de pointe, l’entreprise a également utilisé Amazon Relational Database Service (Amazon RDS) et Amazon S3, qui offre une capacité rentable et redimensionnable tout en automatisant les tâches d’administration chronophages telles que l’approvisionnement en matériel, la configuration de la base de données, l’application de correctifs et les sauvegardes. « Il était primordial d’impliquer des professionnels chez AWS au lieu de penser que nous pouvions le faire nous-mêmes », explique M. Dufresne. « AWS est l’endroit où investir si vous voulez une infrastructure qui sera toujours là dans 10 ans. »

Pour stocker de grandes quantités de données, le CLESSN a utilisé Amazon RDS aux côtés d’Amazon Aurora, une base de données relationnelle compatible MySQL et PostgreSQL conçue pour le cloud. L’utilisation de ces solutions permet au CLESSN de stocker et de chiffrer en toute sécurité les résultats de ses enquêtes sans subir de plantages ou de pannes dans sa base de données. À la fin du projet, il avait collecté et stocké plus de 18 To de données dans Amazon S3. Pour accélérer la livraison de son site Web statique, l’entreprise a commencé à utiliser Amazon CloudFront, un service de réseau de diffusion de contenu rapide qui fournit en toute sécurité des données, des vidéos, des applications et des API aux clients du monde entier avec une faible latence et des vitesses de transfert élevées. Elle a également utilisé Amazon CloudFront pour héberger son application.

Pour maintenir la confidentialité des informations personnelles identifiables de ses participants, l’université a également utilisé AWS Shield, un service distribué de protection contre le déni de service qui protège les applications exécutées sur AWS. « En utilisant les solutions de sécurité AWS, nous pouvons garantir une sécurité et une confidentialité renforcées », explique Eric Pinet.