dimanche 9 octobre 2016

Réaliser des analyses géospatiales : les géo datasets publics maintenant disponibles sur le Google Cloud

C'est Peter Birch, Product Manager de Google Earth Engine qui vient de l'annoncer.

Avec des dizaines de satellites civils en orbite et bien plus encore à venir dans la prochaine décennie, la taille et la complexité de l'imagerie géospatiale ne cesse de croître. Il est devenu de plus en plus difficile de gérer ce flot de données et de l'utiliser pour acquérir de précieuses connaissances et des informations utiles. Voilà pourquoi les ingénieurs de Google ont été très heureux d'annoncer qu'ils mettent dorénavant à la disposition de tous, deux des plus importantes collections d'images satellites publiques, cela gratuitement et dans le Cloud de Google : les images des satellites Landsat (USGS-NASA) et de Sentinel-2 (ESA).

La mission Landsat, développée dans le cadre d'un programme conjoint entre l'USGS et la NASA, est la plus longue mission d'observation de la Terre de toute l'histoire, dont les débuts ont commencé en 1972 avec le satellite Landsat 1. l'imagerie Landsat a établit la norme en matière de données spatiales dans l'observation de la Terre en raison de la durée de la mission et des données très riches fournies par ses capteurs multi spectraux. Les données Landsat ont maintes fois démontré leur valeur inestimable notamment pour l'agriculture, la géologie, la sylviculture, l'aménagement du territoire, l'éducation, la cartographie, le suivi des changements climatiques et la réponse aux catastrophes naturelles. Cette collection d'images comprend les archives complètes de l'USGS pour l'imagerie des Landsat 4, 5, 7 et 8, et les données mises à jour lorsque de nouvelles images arrivent des Landsat 7 et 8. La collection est mise à jour quotidiennement et contient un total de 4 millions de scènes et de 1,3 péta octet de données allant de 1984 à aujourd'hui, soit plus de 35 ans d'images de notre planète prêtes pour des analyses immédiates.

Sentinel-2 fait partie de l'ambitieux programme d'observation de la Terre nommé Copernicus et décidé par l'Union européenne. Il a élevé le niveau des données d'observation de la Terre, avec un Instrument Multi-Spectral (le MSI) qui produit des images de la Terre avec une résolution allant jusqu'à 10 mètres par pixel, de loin bien meilleure que celle des Landsat. Les données de Sentinel-2 sont particulièrement utiles pour l'agriculture, la sylviculture et d'autres applications de gestion des espaces. Par exemple, elles peuvent être utilisées pour étudier la surface foliaire, la chlorophylle et la teneur en eau des espaces végétalisés, pour cartographier la couverture forestière, les sols, et surveiller les voies navigables et autres zones côtières. Les images de catastrophes naturelles comme les inondations ou les éruptions volcaniques peuvent également être utilisées pour la cartographie des impacts de ces catastrophes ou l'organisation des secours humanitaires. La collection contient actuellement 970.000 images satellites et plus de 430 téraoctets de données mises à jour quotidiennement.
Brisbane (Australie) vue par Sentinel-2 (ESA)
Les ingénieurs de Google cumulent des années d'expérience dans le traitement des images des satellites Landsat et Sentinel-2. Le produit Google Earth Engine, une plate-forme dans le Cloud pour faire de l'analyse géospatiale de péta pixel (géo bigdata appliqué à l'imagerie satellite), a été créé pour aider à faire l'analyse de ces ensembles de données de façon facile, rapide et automatique. Le vaste catalogue de données de Google Earth Engine (avec ses péta octets de données publiques), combiné à une interface facile à utiliser faite de scripts prêts à l'emploi et à la puissance unique au monde de l'infrastructure Google, ont contribué à révolutionner l'observation de la Terre.

En amenant aujourd'hui les deux ensembles de données les plus importants de Earth Engine dans le Google Cloud, le géant de Mountain View permet également à tous de créer de nouveaux workflows à l'aide de Google Compute Engine, Google Cloud Machine Learning et tout autre service du Google Cloud.

Descartes Labs est un client de Google qui a profité de la puissante combinaison du Google Cloud et de ces ensembles de données. Descartes Labs se concentre à combiner du Machine learning avec des données géospatiales de sorte à prévoir la production agricole mondiale. "Lors des débuts d'une startup, l'imagerie par satellite peut être incroyablement couteuse", a déclaré le PDG de Descartes Labs, Mark Johnson. "Pour faire des modèles de Machine learning précis concernant les principales cultures, nous avions besoin d'images satellites couvrant le monde entier sur des décennies. Grâce à Google Earth Engine hébergeant publiquement la totalité des archives Landsat sur le Google Cloud, nous pouvons nous concentrer sur les algorithmes au lieu de nous soucier de la collecte de péta octets de données. L'observation de la Terre continuera à s'améliorer à chaque nouveau lancement de satellite et nous serons capables de prévoir les productions de ressources alimentaires au niveau mondiale. Nous sommes ravis que Google voit tout le potentiel à héberger autant de données géospatiales de façon ouvertes sur le Google Cloud, car elles permettront aux entreprises comme la nôtre de mieux comprendre la planète sur laquelle nous vivons".
Humboldt (Iowa, Etats-Unis) vue par Landsat 8 (USGS-NASA)
Spaceknow est une autre entreprise utilisant le Google Cloud pour exploiter les données Landsat avec un rendu unique. Spaceknow apporte de la transparence à l'économie mondiale par le suivi des tendances économiques mondiales depuis l'espace. Spaceknow met en oeuvre un indice de croissance urbaine grâce à des analyses de données massives de l'imagerie multispectrale, en Chine et ailleurs. En utilisant TensorFlow et du "Deep learning" capables de prédictions sémantiques sur de l'imagerie satellite, Spaceknow détermine le pourcentage de terres classées comme urbaines pour une région géographique donnée. En outre, son Indice Manufacturier Chinois utilise des algorithmes propriétaires appliqués aux images Landsat 7 et 8 sur plus de 6.000 installations industrielles à travers la Chine et mesure les niveaux d'activité et de fabrication chinoise. Utilisant 2,2 milliards d'observations satellitaires, cet indice couvre plus de 500.000 kilomètres carrés, et peut être rapidement mis à jour lorsque de nouvelles images arrivent. Selon Pavel Machalek, le PDG de Spaceknow : «Google Cloud nous offre la capacité unique à développer, former et déployer des réseaux de neurones à une échelle sans précédent. Nos clients dépendent des informations critiques que nous leur fournissons, notamment pour leurs prises de décisions quotidiennes".
   Fuzhou, Chine en 2000 (Landsat 7, USGS)               Fuzhou, Chine en 2016 (Landsat 8, USGS)
Avec plus d'un péta octet d'images issues des principaux satellites civils, le tout disponible et à portée de main, vous pouvez désormais éviter les coûts de stockage et de chargement des données et ainsi vous concentrer sur ce qui importe le plus : les produits et les services à rendre à votre clients et utilisateurs. Que vous utilisiez des services de "Machine learning", des services de calculs issus du Google Cloud ou encore Google Earth Engine pour des analyses simples et puissantes, Google propose de vous aider à transformer les pixels en informations à forte valeur ajoutée pour aider votre organisation à prendre de meilleures décisions.


Pour en savoir plus sur ces nouvelles bases de données d'images satellites :
http://cloud.google.com/storage/docs/public-datasets/


et sur la gamme complète des jeux de données publiques :
http://cloud.google.com/public-datasets/.

Aucun commentaire:

Enregistrer un commentaire