Accueil » Logiciels de recherche » Colloque canadien sur les logiciels de recherche » Détails du programme

Détails du programme

1re journée | Le 28 mai 2019

8:00 – 9:15 | Inscription et petit-déjeuner


9:15 – 9:30 | Allocution d’ouverture

  • Jim Ghadbane, Président et chef de direction | CANARIE
  • Scott Henwood, Directeur, Logiciels de recherche | CANARIE

9:30 – 10:30 | Conférencier d’honneur : L’apprentissage par renforcement profond en recherche

  • Pablo Castro (Ph.D.), Développeur de logiciels scientifiques | Google AI

L’apprentissage par renforcement (AR) profond est un domaine de l’apprentissage machine qui a pris passablement d’expansion ces dernières années. L’objectif consiste à mettre au point des agents autonomes, capables de prendre les meilleures décisions qui soient pour accomplir une tâche donnée. Bien que certains logiciels, disponibles sur le marché, appliquent déjà de façon stable diverses méthodes d’AR, les recherches récentes sur l’AR profond ont diversifié les objectifs initiaux. Google AI, par exemple, a créé Dopamine, un nouveau cadre de recherche en AR profond qui insiste sur un aspect important de cette discipline. Le but était de créer un cadre compact et facile à saisir permettant de mettre de nouvelles idées à l’épreuve. Dopamine est un logiciel ouvert, s’appuyant sur TensorFlow, qui autorise une implantation compacte et fiable de certains agents d’AR profond à la fine pointe de la technologie.


10:30 – 11:00 | Pause et réseautage


11:00 – 11:20 | Exposé : Mise en place d’une équipe de développement de logiciels scientifiques à l’Université McMaster : quelques leçons à retenir

  • Ranil Sonnadara, Professeur agrégé et conseiller spécial auprès du vice-président de la recherche | Université McMaster

11:20 – 11:40 | Exposé : Dans le monde scientifique, les unités de traitement graphique (GUI) sont des articles de luxe

  • David Huard, Spécialiste, Scénarios et services climatiques | Ouranos

La petite histoire laisse croire que les hommes de science font souvent fi des GUI. Ils préfèrent accéder directement au programme plutôt que passer par un service en plateforme. De fait, la rédaction d’un script exige un degré de transparence et de reproductibilité que proposent peu de GUI. Si tel est bien le cas, pourquoi se croire obligé de concevoir une GUI pour une plateforme de recherche alors que pareille activité peut engloutir trente à cinquante pour cent du budget? La véritable utilité des GUI réside-elle dans l’éblouissement des bailleurs de fonds et des cadres supérieurs? Leur développement est-il un coût d’option justifiable en recherche?


11:40 AM – 12:00 | Exposé : De Docker à Swarm : mythes et réalités du déploiement d’un environnement complexe pour les logiciels de recherche

  • Anton Zakharov, Développeur de logiciels scientifiques | CRIM

Quand vient le temps, pour un projet, de passer à la production, se fier uniquement aux outils de Docker ou de Docker-Compose nécessite du temps et ouvre la porte à une multitude d’erreurs. Imaginez que vous deviez donner une expansion horizontale à certains services dans une pile qui en contient des dizaines, tout en vous assurant de ne rien déconnecter. L’exposé portera sur l’approche du CRIM et les obstacles rencontrés lors de la migration d’un logiciel de Docker-Compose à Swarm : gestion des données persistantes, problèmes de réseau, réservation de ressources.


12:00 – 13:00 | Repas et réseautage


13:00 – 13:20 | Exposé : L’exploitation des bases de données en génomique fonctionnelle à haut débit

  • Dr. Emma Bell, Princess Margaret Cancer Centre | UHN

Les expériences de génomique à haut débit coûtent du temps, de l’argent et des efforts. Les dépôts publics qui gardent, structurent et diffusent ces données forment un trésor d’informations qui ne cesse s’enrichir. Malheureusement, leur envergure signifie aussi que ces dépôts sont incomplets et fourmillent de jeux de données mal annotés ou annotés de façon incohérente. L’exposé fera office de catharsis à ceux qui exploitent de tels dépôts et leur donnera des conseils pratiques sur la manière d’éviter les embûches les plus fréquentes. Les chercheurs d’autres domaines que la génomique y pêcheront les quelques mots de prudence d’une discipline encore jeune.


13:20 – 13:40 | Exposé : Saisir des données : la croix et la bannière

  • Morgan Taschuk, Gestionnaire principal | Ontario Institute for Cancer Research

Que vous soyez un utilisateur ou un développeur, l’idée de saisir des données vous fera sans doute frémir. Pourtant, cette étape est absolument cruciale dans les systèmes contemporains. Peu de logiciels sont conçus pour rendre l’expérience vécue par l’utilisateur plus facile. Notre idée, en créant MISO LIMS, était de faire de la saisie des données une sinécure. L’exposé décrira notre point de vue et les leçons que nous avons tirées de l’expérience.


13:40 – 14:00 | Exposé : iReceptorPlus – du projet modeste au logiciel de recherche international – 2e partie

  • Brian Corrie, Directeur technique, iReceptor | Université Simon Fraser

L’an dernier, j’avais parlé de la plateforme iRecptor et de la façon dont ce petit projet du programme des plateformes habilitées par réseau de CANARIE avait fini par faire partie d’un projet coopératif beaucoup plus ambitieux sur des normes internationales. Depuis, l’équipe d’iReceptor et bon nombre de ses collaborateurs ont obtenu une subvention de EU Horizon 2020 et des IRSC pour un projet prenant la plateforme iReceptor comme point de départ. Ce nouveau projet rassemble 20 partenaires de neuf pays. L’exposé explique comment on prévoit le gérer pour aboutir à la conception d’un logiciel scientifique.


14:00 – 14:05 | Exposé éclair : Le module d’extension Jenkins Configuration en tant que code

  • Long Vu, Développeur | Ouranos

Configurer un serveur de création/intégration continue Jenkins se résume depuis toujours à une série de clics sur l’interface Web, raison pour laquelle il est difficile de synchroniser la configuration de plusieurs instances (production/étapes) Jenkins. Lancer une nouvelle instance Jenkins totalement configurée à partir de rien est tout aussi délicat. L’exposé illustrera le nouveau module Jenkins Configuration, qui autorise le démarrage d’une instance Jenkins entièrement configurée. Référence : https://github.com/Ouranosinc/jenkins-config


14:05 – 14:10 | Exposé éclair : vtree : un logiciel en langage R pour calculer et tracer les arborescences de variables

  • Nick Barrowman, Statisticien | Children’s Hospital of Eastern Ontario Research Insitute

Les sous-ensembles emboîtés soulèvent de nombreuses questions dans les jeux de données scientifiques, mais calculer puis visualiser ces sous-ensembles demande du temps et est source d’erreurs. À mesure que les emboîtements se multiplient, l’ampleur de la tâche augmente rapidement. En outre, si certaines valeurs manquent, le travail devient titanesque. L’arborescence est une façon naturelle d’illustrer les sous-ensembles d’un jeu de données. Le logiciel vtree en langage R est un outil polyvalent qui permet de calculer et de tracer des arborescences de variables.


14:10 – 14:15 | Exposé éclair : Passer d’Unetelle à Untel

  • Karim Bouayad-Gervais, Pillar Science

Les logiciels scientifiques permettent aux chercheurs d’atteindre de nouveaux sommets. Cependant, les innovations logicielles demeurent imperméables à ceux dont les connaissances techniques laissent à désirer. Ces scientifiques sont contraints d’employer des techniques plus simples, qui pèchent par leur inefficacité et sont source d’erreurs. La situation devient encore plus dramatique quand le chercheur subit des pressions de l’université pour rester compétitif. L’exposé parle de l’importance de la convivialité dans les logiciels de recherche en prenant pour exemple une équipe de recherche en sciences de la vie.


14:15 – 14:20 | Exposé éclair : IRIDA : une plateforme d’analyse rapide intégrée pour les maladies infectieuses

  • Dan Fornika, Spécialiste en génomique | BC Centre for Disease Control Public Health Lab

La plateforme IRIDA facilite les enquêtes en santé publique faisant appel à la génomique. Cette plateforme autorise la gestion de projets, l’analyse des flux de production et le partage des données. Elle est dotée d’une interface Web intuitive. Avec IRIDA, il est possible de procéder à une analyse de routine à haut débit à partir d’un jeu structuré et optimisé de flux de production. Un système de pipeline sous forme de module d’extension permet en outre au développeur d’ajouter les pipelines particuliers dont il a besoin.


14:20 – 14:25 | Exposé éclair : Logiciels pour visualiser et analyser les réseaux

  • Max Franz, Ingénieur en logiciels principal | Université de Toronto

Pour comprendre une maladie, il faut souvent analyser des jeux volumineux de données sous forme de réseaux. Et pour exploiter de telles données, on a besoin de logiciels capables de les stocker et de les analyser efficacement, ainsi que d’outils intuitifs pour l’utilisateur. Nous avons mis au point une série de technologies de base permettant de structurer, de stocker et de récupérer des groupes sémantiques de même que des interfaces interactives sur réseau pour faciliter l’intégration et le partage des données. De là, nous avons entrepris d’élargir la gamme d’applications réseau et conçu une plateforme Web centrale qui améliore la portée et l’accessibilité de l’ensemble.


14:25 – 14:30 | Exposé éclair : naturecounts : un nouveau logiciel en langage R permettant d’accéder aux données normalisées sur les populations d’oiseaux

  • Dr. Stefanie LaZerte, Études d’oiseaux Canada

naturecounts est un dépôt en ligne de données sur les populations de plantes et d’animaux géré par Études d’oiseaux Canada. On y trouve au-delà de 128 millions d’entrées de 400 sources découlant d’enquêtes effectuées par des bénévoles ou de projets de recherche du Canada entier. Nous avons récemment mis au point un logiciel ouvert en langage R baptisé « naturecounts » qui facilite l’accès au dépôt de données du même nom par le biais d’une nouvelle API publique. Ce logiciel aidera Études d’oiseaux Canada à atteindre son but, qui est de donner accès aux données aux fins de recherche, de conservation et d’éducation.


14:30 – 14:00 | Pause et réseautage


15:00 – 15:05 | Exposé éclair : Les paradigmes expérimentaux dans la science du mouvement humain : contrôle d’une dynamique complexe par sonification et visualisation

  • Dobromir Dotov, Research and High-Performance Computing Services (RHPCS) | Université McMaster

La meilleure façon de décrire les habiletés motrices consiste à parler d’intelligence dynamique ou physique, pas d’intelligence computationnelle. En ce sens, les paradigmes expérimentaux dans les disciplines comme la réadaptation ou l’acquisition de fonctions motrices mettent en relief la fidélité des rétroactions en temps réel ainsi que la pertinence de l’espace artificiel qui sert de siège aux tâches dynamiques et permet de tester les capacités d’une personne. Ces paradigmes doivent reposer sur du matériel peu coûteux pour qu’on obtienne la fidélité voulue et puisse effectuer le transfert dans la réalité. Du côté de la pertinence, le matériel doit pouvoir contrôler des objets à la dynamique complexe, presque adaptative. Nous présentons des cas tirés de notre travail sur du matériel extrêmement bon marché et où l’on a recouru à la sonification ou à la visualisation du mouvement pour interagir avec la simulation d’une dynamique complexe. Il restera à augmenter les dimensions et la complexité des tâches dans l’espace de travail afin d’offrir plus de choix aux chercheurs. D’autre part, les progrès réalisés par les méthodes computationnelles et statistiques pourraient concourir à identifier des invariants dynamiques dans les données sur le mouvement déjà enregistrées.


15:05 – 15:10 | Exposé éclair : La plateforme BESOS

  • Paul Kovacs, Programmeur analyste | Université de Victoria

Les bâtiments et les systèmes énergétiques jouent un rôle crucial dans la lutte contre le changement climatique, une des pires menaces qui plane sur l’humanité. En effet, ces systèmes peuvent réduire ou changer la demande d’énergie de telle sorte qu’elle sera distribuée plus efficacement. La plateforme BESOS (Building and Energy Simulation, Optimization and Surrogate Modeling) propose une série de modules qui simulent et optimisent les bâtiments et les systèmes énergétiques urbains.


15:10 – 15:20 | Exposé éclair : Intégration de logiciels à Digital Humanities

  • Susan Brown, Professeure/Directrice de projet | Université de Guelph – Canadian Writing Research Collaboratory
  • Mihaela Ilovan, Gestionnaire de projet | Université de Guelph – Canadian Writing Research Collaboratory

La plateforme en ligne Digital Humanities du Canadian Writing Research Collaboratory (CWRC) intègre le stockage des données de recherche à des outils permettant d’effectuer des recherches, de découvrir les données et de les diffuser, car un grand nombre de ces dernières émanent de partenaires externes. Le CWRC présentera trois brèves études de cas sur l’intégration de logiciels (NERVE, un outil de reconnaissance des entités, DToC, un lecteur numérique, et HuViz, un visualisateur de données ouvertes liées). Parallèlement, on décrira l’approche des données ouvertes liées, retenue pour faciliter la collaboration et l’interopérabilité des données de recherche structurées.


15:20 – 15:25 | Exposé éclair : Intégration des pipelines EEG à la plateforme CBRAIN grâce au système de lignes de commande Boutiques

  • Dr. Sergiy Boroday, McGill Centre for Integrative Neuroscience, Université McGill
  • Dr. Obaï Bin Ka’b Ali | Université Concordia

CBRAIN est un portail Web sur réseau autorisant une collaboration à grande échelle au niveau du traitement des données. Il avait été conçu au départ pour la neuro-imagerie. Afin de faciliter la recherche recourant aux données des électro et magnéto-encéphalogrammes, nous y avons ajouté deux pipelines : une trousse d’outils pour la localisation des sources baptisée Best (Brain Entropy in Space and Time) et qEEG. Les développeurs peuvent se procurer les descripteurs Boutiques de ces pipelines en ligne et les appliquer à des plateformes de calcul. L’exposé portera sur la façon d’intégrer ces pipelines.


15:25 – 15:30 | Exposé éclair : L’augmentation de données – tirer le meilleur de l’analyse des jeux volumineux de données et de l’intelligence artificielle

  • Dominic Lam, Director, Directeur, Expansion commerciale et développement de solutions | Datadex Inc.

Les méthodes employées pour analyser les mégadonnées ou l’IA exigent que les données émanent d’échantillons statistiquement significatifs et possèdent assez de particularités pour qu’on puisse caractériser le système complexe à l’étude. L’augmentation de données permet d’identifier les données les plus pertinentes et de les amalgamer dans ce but. Datadex recherche les données, les indexe, modélise des API, établit des liens, procède à des échanges et à des fusions pour aboutir à l’augmentation de données recherchée. Datadex est mis gratuitement à la disposition des chercheurs.


15:30 – 15:35 | Exposé éclair : Inclure les expériences en informatique de manière uniforme dans les articles scientifiques

  • Sylvain Hallé, Professeur | Université du Québec à Chicoutimi

Quand vous effectuez une expérience sur un ordinateur, vous rédigez sans doute un script de lignes de commande qui exécutera diverses tâches : produire les données, les enregistrer dans des fichiers, les traiter puis les afficher sous forme de diagrammes ou de tableaux dans un article. Malheureusement, cette poignée de fichiers établis à la « va-vite » se transforme vite en amas de scripts mal étayés générant et déplaçant toutes sortes de fichiers temporaires nébuleux. LabPal est une bibliothèque qui organise les expérience en cours et en collige puis traite les résultats.


15:35 – 15:55 | Exposé : Difficultés et possibilités de l’ajout de données non normalisées à un dépôt : enfoncer une cheville carrée dans un trou rond

  • Doug Mulholland, Gestionnaire technique | Équipe des systèmes informatiques, Université de Waterloo

Beaucoup de données disparates voient le jour dans tous les domaines. Ces données sont conservées dans des dépôts faits sur mesure, qui se prêtent mal à l’addition de données formatées autrement. Par ailleurs, on découvre souvent plus tard des données « non conventionnelles » qu’il conviendrait d’ajouter au dépôt. Un des principaux aspects du projet iEnvironment consiste à élargir les systèmes existants pour qu’ils acceptent les données non standard. Durant l’exposé, on abordera aussi la question de la perte des données patrimoniales consécutivement au départ de scientifiques pour la retraite ou en raison des vues contradictoires qu’engendre la science comme c’est le cas avec le changement climatique.


15:55 – 15:15 | Exposé : Pratiques exemplaires en développement de logiciels

  • Henriette Koning, Directrice, IT PMO | Stemcell Technologies Inc.

Mme Koning présentera les meilleurs enseignements et pratiques tirés de l’expérience vécue par les petites équipes de développeurs qui introduisent de nouvelles technologies comme les algorithmes d’apprentissage machine pour illustrer comment structurer l’élaboration d’un logiciel, utiliser la méthode Agile pour surmonter les incertitudes et innover, et organiser son équipe afin que le projet aboutisse.


17:00 – 19:00 | Réception

 

Retour en haut de page

2ième journée | Le 29 mai 2019

8:15 – 9:15 | Inscription et petit-déjeuner


9:15 – 10:15 | Conférencier d’honneur : L’art de faire des outils utiles et efficaces pour le développement de logiciels

  • Gail Murphy (Ph. D.), Professeur (informatique) et vice-président de la recherche et de l’innovation | Université de la Colombie-Britannique

On dit souvent des systèmes logiciels qu’ils sont les artefacts les plus complexes jamais créés par l’être humain. Pour en faciliter le développement, les informaticiens recourent à maints outils, la plupart conçus en fonction des logiciels. Un compilateur, par exemple, prendra la représentation d’un programme pour en fabriquer une nouvelle représentation. L’exposé illustrera qu’il faut impérativement recourir à une approche centrée sur l’être humain pour bâtir plus rapidement des systèmes logiciels complexes qui possèdent les qualités souhaitées. Pareille approche signifie mettre l’accent sur les interactions de l’être humain avec les structures computationnelles et avec ses semblables. En adoptant une approche de ce genre, nous améliorerons notre capacité à fabriquer des outils de développement logiciel efficaces et utiles pour l’être humain. Il est temps de faire en sorte que les outils travaillent pour l’humanité et non l’inverse.


10:15 – 10:45 | Pause et réseautage


10:45 – 11:45 | Conférencier d’honneur : Pourquoi est-il si difficile de créer des logiciels de robotique robustes et fiables?

  • Jonathan Kelly (Ph. D.), Directeur, laboratoire Space & Terrestrial Autonomous Robotic Systems (STARS) et professeur, Institute for Aerospace Studies (UTIAS) | Université de Toronto

Créer des systèmes robotisés robustes, fiables et sécuritaires qui fonctionneront dans des conditions précises n’est pas aisé. Lorsqu’un robot quitte l’usine ou le laboratoire pour faire son entrée dans le monde humain, les difficultés ne font que grandir. Même si le rôle joué par la durabilité et la résilience des pièces mécaniques et électroniques ne peut être négligé, la principale difficulté réside dans l’élaboration de logiciels aux capacités suffisantes. En effet, les robots qui opèrent à proximité d’humains doivent être d’une sûreté et d’une fiabilité à toute épreuve sinon on ne les acceptera pas. Personne n’en achètera ou ne les utilisera. L’exposé donne un aperçu des difficultés associées à la conception d’un logiciel qui assurera l’autonomie du robot dans un milieu humain, notamment la nécessité de maîtriser des conditions très dynamiques, de gérer les réactions incertaines des humains et de prendre en compte des cas complexes anormaux. L’exposé se conclura par des suggestions sur la façon dont un développeur peut surmonter ces difficultés et contribuer à faire entrer les robots dans la vie quotidienne.


11:45 – 13:00 | Repas et réseautage


13:00 – 13:20 | Exposé : Normalisation du partage de données au moyen des ontologies

  • Damion Dooley, Programmeur scientifique | Université de la Colombie-Britannique

Le partage des données entre organismes ou plateformes exige souvent le crible de dictionnaires de données « maison » ou à demi-normalisés avec pour corollaire des solutions aussi boiteuses qu’onéreuses. Allant un pas au-delà de l’approche ISO, l’exposé présente les avantages de l’intégration de vocabulaires formels, logiques et cohérents aux bases de données et aux logiciels. La biomédecine et d’autres ontologies deviennent de plus en plus les normes de facto des sources ouvertes, nous rapprochant d’un avenir empli de données normalisées, prêtes à l’emploi.


13:20 – 13:40  | Exposé : Geodisy : élaboration d’une couche « découverte » pour les données en sciences géospatiales au Canada

  • Paul Dante, Ingénieur en logiciels | Université de la Colombie-Britannique
  • Mark Goodwin, Coordonnateur en métadonnées | Université de la Colombie-Britannique

Face à la demande croissante de composantes géographiques en recherche, les dépôts de données scientifiques ont la chance de proposer une solution de rechange à la recherche textuelle. Le projet Geodisy, financé par CANARIE, créera un logiciel de source ouverte extensible permettant de découvrir les données géospatiales canadiennes grâce à une interface qui évoque une carte. L’exposé présentera l’architecture du logiciel et les progrès réalisés en vue d’uniformiser diverses normes applicables aux métadonnées pour en faire des métadonnées géospatiales faciles à découvrir.


14:40 – 14:00 | Exposé : ORCID-CA et l’infrastructure de la science ouverte au Canada

  • Jeffrey Demaine, Gestionnaire du groupe ORCID-CA | Réseau canadien de documentation pour la recherche

ORCID procure aux chercheurs un identifiant unique qu’il peuvent associer à leurs contributions et affiliations scientifiques. L’utilité qu’il présente à titre personnel mise à part, les institutions de recherche recourent à l’identifiant ORCID au niveau systémique pour garantir la qualité des données et uniformiser les flux de tâches. Le consortium ORCID-CA permet aux universités et institutions de recherche canadiennes d’adhérer à ce réseau de confiance, et ainsi connecter leurs systèmes de gestion de la recherche aux résultats des chercheurs. La possibilité de se connecter à la base de données ORCID grâce à une API facilite considérablement la gestion de la recherche tant au niveau personnel qu’à celui de l’institution. Les identifiants comme ORCID jouent un rôle important dans l’habilitation de la Science ouverte, car les jeux de données et les publications deviennent interopérables dès que leurs métadonnées sont reliées.


14:00 – 14:10 | Pause


14:10 – 14:30 | Exposé : Radiam : aider les chercheurs à garder la trace de leurs données

  • Todd Trann, Développeur principal de logiciels | Université de la Saskatchewan

Où sont vos données? Comment sont-elles organisées? Comment trouver ce dont vous avez besoin quand tant de gens travaillent sur le même projet? Nous aidons les chercheurs à répondre à ces questions.

Grâce au financement de CANARIE, l’Université de la Saskatchewan et l’Université Simon Fraser collaborent pour mettre au point un jeu de modules informatiques évolutif baptisé Radiam qui comblera les lacunes relevées dans les outils et les services existants, utilisés pour gérer les données de recherche actives.


14:30 – 14:50 | Exposé : Analyse des dispositifs électrochimiques à l’échelle du pore

  • Jeff Gostick, Professeur | Université de Waterloo

Le stockage de l’énergie électrochimique (batteries à lithium-ion ou piles à oxydoréduction) jouera un rôle primordial dans l’avenir de l’énergie renouvelable en faisant le pont entre la production et la consommation d’électricité. Les dispositifs le permettant ont tous besoin d’électrodes poreuses très complexes pour que la réaction se produise. Les techniques d’imagerie 3D ont progressé au point d’ouvrir une nouvelle fenêtre sur ces matériaux : les simulations directes sur image à l’échelle du pore. L’exposé présentera ces progrès et les difficultés qui restent à surmonter.


14:50 – 14:55 | Sondage et prix de l’affiche

  • Dan Sellars, Gestionnaire, Développement de logiciels | CANARIE
  • Scott Henwood, Directeur, programme Logiciels de recherche | CANARIE

14:55 – 14:00 | Allocution de clôture

  • Mark Wolff, Directeur de la technologie | CANARIE

Retour en haut de page