Goldman Sachs a créé un nouveau langage de programmation pour les postes en data

eFC logo
Goldman Sachs a créé un nouveau langage de programmation pour les postes en data

Tout est question de data chez Goldman Sachs. La banque est en train de se construire un lac de données – autrement dit de procéder à un ‘repositionnement stratégique pour les données d’entreprise’ – et recrute une équipe d’architecture de données composée d’ingénieurs data lake, de technologues orientés data pour interagir avec le lac de données, et de développeurs eux aussi orientés data pour créer et gérer le logiciel, qui lui-même gère les données dans le lac…

Cela a tout l’air d’une entreprise d’envergure, et c’est bien le cas. Et si vous avez en tête de décrocher l’un de ces jobs en data chez GS – ou ailleurs dans la finance, il pourrait être utile de vous pencher sur Legend - le nouveau langage de programmation propriétaire de Goldman.

Jusqu’à ces derniers jours, Legend était connu sous le nom de PURE. PURE/Legend est un langage de description créé par Goldman pour décrire ses données. Elle l’utilise en association avec un système dénommé Alloy jusqu’à ces derniers jours. Alloy était la plateforme utilisée par PURE pour interroger les bases de données de Goldman et générer des modèles à partir de multiples langages, de SQL à Java et JSON. – C’est la face visible.

Alloy est maintenant désignée comme la Plateforme de Legend.

En collaboration avec Fintech Open Source Foundation (FINOS), Goldman a mis l’intégralité du projet Legend en accès libre sur GitHub.

Lors d’une intervention au Forum Open Source Strategy de FINOS en mars dernier, Neema Raphael, Global Head of Engineering et Chief Data Officer de Goldman Sachs, a expliqué le fonctionnement du système : « disons que vous voulez utilisez certaines données à des fins d’analyse ou pour en partager d’autres avec une audience élargie, … et tout cela provient de sources différentes, avec des attributs différents, et présente aussi des liens avec d’autres jeux de données ; Alloy vous permet de définir ces concepts simplement, et de manière cohérente, comme des concepts commerciaux et de les normaliser pour proposer aux utilisateurs une sorte de libre-service. »

En rendant Legend open source, l’idée est de créer des API qui permettront aux clients de Goldman de se servir eux-mêmes dans les données et de construire leurs propres outils en utilisant la plateforme de Goldman.

Autre intervenant du forum FINOS en mars, Pierre de Belen, qui dirige l’équipe data model engineering chez Goldman et n’est autre que le parrain du système Legend, a indiqué que la banque utilisait PURE/Legend pour construire un « graphe conceptuel de notre information. »

« Nous procédons ensuite au mappage des nombreuses bases de données qui stockent nos données, au moyen d’un schéma de documentation élaboré qui ajoute des contraintes de transformation et de dérivation, » a-t-il poursuivi, précisant que son équipe de 1 000 modélisateurs de données était en passe de modéliser « quasiment toutes les informations disponibles dans l’entreprise afin que les gens puissent les parcourir en toute simplicité. »

En d’autres termes, pour décrocher un poste en modélisation des données chez Goldman, il faudra sans doute apprendre Legend/PURE. Et si le projet Legend décolle à la mesure des espérances de Goldman, la plateforme et le langage pourraient bien devenir la norme dans le secteur bancaire.

Mais qu’est-ce donc que Legend ? FINOS le décrit comme « un langage fonctionnel immutable, basé sur le Langage de Modélisation Unifié (UML) et inspiré par Object Constraint Language (OCL), » le langage d’expression des contraintes utilisé par UML. Il présente l’avantage d’accélérer la modélisation des données de façon à les rendre utilisables en environnement de trading. Il simplifie aussi l’ajout de contraintes exécutables, de dérivations et de mappages de modèle à modèle. Le guide pour se familiariser avec le langage est disponible ici.

Bien évidemment, ce n’est pas la première fois que Goldman crée son propre langage. Elle a aussi Slang, à la base de la plateforme SecDB, et qui – suivant à qui vous posez la question – ouvre une voie royale pour une grande carrière dans le monde du logiciel chez Goldman, ou mène à un cul-de-sac. Alors que Slang date des années 80, Legend est un langage contemporain et a donc peu de risque de subir le même sort. Tous ceux travaillant actuellement sur les systèmes ETL (Extract Transform and Load) qui copient des données vers d’autres destinations (comme les lacs de données) pourraient être bien inspirés de se familiariser très rapidement avec Legend : s’il doit devenir la norme, bon nombre de ces postes pourraient être supprimés.

Crédit photo : Fabrizio Conti sur Unsplash

A lire aussi…

Secteurs les plus recherchés

Loading...

Recherche emploi

Rechercher articles

Close
Loading...