Le Propulseur GAIT (Geospatial-AI lnformation Toolbox)

Une plateforme en nuage de renseignement géospatial avec apprentissage automatique

Fourni par: Ecosystem Informatics (ESI)

Prêt à décoller?

Le Plan de vol est divisé en deux : renseignement géospatial et apprentissage automatique. La Solution type explique en détail comment les deux technologies sont réunies dans le nuage de l’ATIR.

Partie 1
  • Aperçu du renseignement géospatial
  • Pratiques exemplaires
  • Trucs et hics
  • Ressources
Partie 2
  • Aperçu de l’apprentissage automatique
  • Pratiques exemplaires
  • Trucs et hics
  • Ressources

Aperçu du renseignement géospatial

De quoi s’agit-il?

Vaste domaine, le renseignement géospatial combine les données géospatiales à des données d’une autre nature émanant, par exemple, des sciences sociales, politiques et environnementales.

Les membres de cette profession définissent cette technologie comme suit :

“…l’usage et l’analyse des données géospatiales pour évaluer diverses activités sur la Terre, sous l’angle de la géographie. »

Souvent associé à la défense nationale, les organisations civiles et les entreprises privées des secteurs des télécommunications, des transports, de la santé et de la sécurité publique, de même que le monde de l’immobilier y recourent de plus en plus, car les données géospatiales les aident à offrir de meilleurs produits et services à leur clientèle.

Le principe fondamental consiste à organiser et à combiner toutes les données disponibles à un lieu donné, sur la planète, pour créer un produit dont se serviront les planificateurs, les services d’urgence et les décideurs.

Avec ce Propulseur, vous déploierez une application qui utilise les algorithmes de l’apprentissage automatique pour analyser les données géospatiales et leur lien avec une variable prévisionnelle (ce qu’on aimerait prévoir). Ensuite, ces données seront reproduites sur une carte qui fera ressortir les motifs et leurs liens avec un jeu de données géospatiales.

Quelle utilité pour mon entreprise?

Fusionner l’infonuagique à l’apprentissage automatique et à l’imagerie satellitaire nous aide à brosser un meilleur tableau mondial d’à peu n’importe quoi, des phénomènes météorologiques extrêmes à l’élévation du niveau de la mer ou à la pollution atmosphérique. On recueille et analyse l’information en maîtrisant les données géospatiales, puis on se sert des algorithmes d’apprentissage automatique pour déceler tendances, motifs et changements. Ce faisant, les données environnementales sont converties en information que comprendront aisément les clients potentiels dans des secteurs comme l’agriculture, la santé, l’assurance et l’administration publique.

Pourquoi le renseignement géospatial et pas une autre technologie?

Nous avons retenu le renseignement géospatial parce que l’usage de données reposant sur l’emplacement géographique a un profond impact sur les entreprises et l’industrie, sans oublier la population.

Pratiques exemplaires

Dans ce projet, les données doivent être structurées selon trois importantes dimensions :

Dans la plupart des cadres de données comportant ces trois dimensions, la dimension spatiale prend habituellement la forme d’une adresse qu’on doit convertir en coordonnées (longitude et latitude) pour pouvoir être reportée sur une carte. Plusieurs API facilitent cette tâche et fonctionnent avec les données sans longitude ni latitude. Pour savoir en quoi consiste les données spatiotemporelles et l’application du géocodage à l’analyse des données, consultez les ressources que voici :

Trucs et hics

L’analyse géospatiale (avec des données spatiotemporelles) devrait illustrer les changements qui surviennent dans l’espace et le temps. Il ne faut cependant pas la confondre avec l’analyse des données chronologiques ou analyse typologique. En effet, analyser plusieurs points dans une région de façon typologique pourrait introduire des erreurs si les données ne sont traitées que chronologiquement. La prévision des variables liées à d’autres variables explicatives deviendra imprécise, surtout si ces dernières sont très affectées par leurs attributs spatiaux.

Les coûts immobiliers, par exemple, dépendent lourdement de nombreux paramètres. Un graphique illustrant la fluctuation des prix dans le temps donnera une bonne idée unidimensionnelle de ce qui se produit au fil des ans. Toutefois, on ne saura rien des autres facteurs qui pourraient exercer une influence sur un tel changement. Des éléments spatiaux comme la proximité des transports en commun, des écoles ou des forces policières (trajet des patrouilles, postes de police, organismes de surveillance de quartier) feront varier le prix des habitations, comparativement à celles d’un autre quartier. Tout prendre en compte ou introduire certains paramètres (spatiaux et temporels) dans l’analyse permettra de prévoir avec beaucoup plus de précision la fluctuation du prix des habitations dans le temps.

Ressources

Tutoriels

Voici une liste partielle des tutoriels que l’auteur juge les plus utiles.


Aperçu de l’apprentissage automatique

De quoi s’agit-il?

L’apprentissage automatique est une branche de l’intelligence artificielle (IA) et de l’informatique qui recourt à des données et à des algorithmes pour imiter la manière dont l’être humain accroît peu à peu son efficacité par l’expérience. L’apprentissage automatique occupe une place cruciale dans le domaine grandissant de la science des données.

Quelle utilité pour mon entreprise?

Les algorithmes recourent à des méthodes statistiques pour effectuer des classifications ou des prévisions. Ils réalisent des constatations importantes en explorant les données. Ensuite, ces constatations guideront les décisions que prennent les applications ou les entreprises, ce qui, idéalement aura un impact sur les principaux paramètres de la croissance.

La convergence de l’infonuagique et de l’apprentissage automatique ainsi que de l’imagerie satellitaire signifie qu’on dispose désormais d’un meilleur moyen pour obtenir une perspective mondiale sur à peu près tout, des phénomènes météorologiques extrêmes à l’élévation du niveau de la mer ou à la pollution de l’air. Recueillir et analyser l’information en maîtrisant les données géospatiales puis utiliser les algorithmes de l’apprentissage machine pour déceler les tendances, les motifs et les changements aidera l’entreprise à transformer les données environnementales en information que ses clients potentiels pourront saisir facilement dans les secteurs comme l’agriculture, la santé, l’assurance et l’administration publique.

Pourquoi l’apprentissage automatique et pas une autre technologie?

Nous avons choisi l’apprentissage automatique pour profiter de la puissance des systèmes évolués de reconnaissance des motifs, qui débouchent sur des données très précises et permettent de prédire les tendances futures.

On peut bâtir un modèle d’apprentissage automatique pour qu’il soit très modulaire et adaptable, donc pour qu’on puisse le déployer à diverses échelles.

Pratiques exemplaires

L’infrastructure technologique joue de nombreux rôles dans les applications d’apprentissage automatique. Une de ses tâches principales consiste à définir la façon dont les nouvelles données sont rassemblées, traitées et obtenues. Ensuite, il faut déterminer comment le modèle sera entraîné et garder la trace des différentes versions. Enfin, on doit établir comment le

modèle sera déployé dans un milieu de production. L’infrastructure joue un rôle capital dans toutes ces tâches. Sans doute passerez-vous plus de temps sur l’infrastructure du système que sur le modèle d’apprentissage automatique proprement dit.

Une architecture de microservices vous aidera à obtenir la modularité et l’adaptabilité souhaitées. Les technologies comme Docker et Kubernetes permettent d’encapsuler différentes parties du système. Ainsi, vous pourrez les améliorer graduellement et remplacer chaque composant indépendamment en fonction de vos besoins. Avec Kubernetes, la mise à l’échelle est un jeu d’enfant.

Trucs et hics

Avant de choisir un algorithme, gardez en tête la précision, la durée de la formation requise et la convivialité. Beaucoup d’utilisateurs attachent plus d’importance à la précision, alors que les débutants privilégient les algorithmes qu’ils connaissent mieux.

Face à un jeu de données, déterminez d’abord comment sont obtenus les résultats, peu importe à quoi ils ressemblent. Le débutant aura tendance à choisir des algorithmes faciles à appliquer qui donneront des résultats rapidement, ce qui est bien quand le processus ne va pas plus loin. Une fois qu’on aura obtenu des résultats et qu’on connaîtra mieux les données, il se peut qu’on consacre plus de temps à des algorithmes plus complexes qui en diront davantage et permettront de préciser les résultats.

Les meilleurs algorithmes pourraient ne pas être considérés comme les plus précis. Le plus souvent, un algorithme doit être ajusté minutieusement et il faut du temps avant d’en tirer la meilleure performance.

Ressources

Tutoriels

Documentation

Le tableau qui suit dresse une liste de documents sur l’apprentissage automatique ainsi que la création et le déploiement d’une plateforme en nuage.

Ça y est? À présent, laissez-nous vous montrer comment nous avons déployé cela dans le nuage de l’ATIR…

Il existe un besoin réel pour une plateforme de source ouverte comprenant une base de données NoSQL avec son interface et des fonctions IA automatisées, capable de se déployer rapidement dans le nuage tout en restant compatible avec les données géospatiales. Plusieurs types d’entreprises et d’industries connaissent ce problème. Pareille plateforme permettrait à l’utilisateur d’enregistrer, de modifier, de parcourir et de trouver les données spatiotemporelles qui répondront aux questions qu’il se pose (où, quand, comment, quoi, qui) et ainsi de prendre des décisions éclairées.

La Solution type montre comment bâtir une plateforme en nuage modulaire et adaptable pour tirer parti du renseignement géospatial et de l’apprentissage automatique. Une fois déployée, l’infrastructure à sa base pourra servir de base sur laquelle développer et déployer des plateformes analogues, à plus grande échelle.