InstaDeep : L’IA Africaine Révolutionne la Biotech chez BioNTech

Il y a un peu plus d’un an, en janvier 2023, la biotech allemande BioNTech faisait l’acquisition de la startup africaine d’IA InstaDeep pour plus de 550 millions de dollars. Cette opération, finalisée en juillet de la même année, marquait la plus grosse sortie d’une entreprise tech africaine à ce jour. Quinze mois après son intégration, l’heure est au bilan pour InstaDeep, qui continue d’opérer de manière indépendante sous le giron de son nouvel actionnaire.

Fondée il y a une décennie à Tunis et désormais basée à Paris et Londres, InstaDeep développe des solutions d’IA de pointe pour les entreprises, allant des outils d’analyse de données boostés par GPU aux systèmes de prise de décision auto-apprenants. Avant son rachat, la pépite africaine avait levé plus de 108 millions de dollars auprès d’investisseurs de renom comme Google, Deutsche Bahn ou encore BioNTech, qui comptaient aussi parmi ses principaux clients et partenaires.

Une IA au service de la lutte contre le Covid-19 et les criquets

Durant la pandémie, InstaDeep avait notamment collaboré avec BioNTech pour mettre au point un système d’alerte précoce capable de détecter les variants à haut risque du Covid-19 plusieurs mois à l’avance. La startup avait aussi travaillé main dans la main avec Google DeepMind pour créer un outil de détection des invasions de criquets pèlerins en Afrique. Sans oublier un ambitieux projet visant à automatiser la planification ferroviaire pour Deutsche Bahn, le plus gros opérateur européen du rail.

Si ces partenariats illustrent la diversité des cas d’usage des solutions d’InstaDeep, c’est bien dans le domaine de la biotechnologie que BioNTech entend exploiter pleinement le potentiel de son IA maison. L’objectif : développer de nouveaux traitements et vaccins contre divers cancers et maladies infectieuses en s’appuyant sur l’intelligence artificielle, un axe sur lequel InstaDeep concentre désormais ses efforts sous la houlette de son acquéreur.

Déployer l’IA à chaque étape du pipeline de BioNTech

«Nous sommes stratégiquement alignés avec BioNTech sur les objectifs à poursuivre en matière de biologie et de capacités d’IA bio», affirme Karim Beguir, cofondateur et CEO d’InstaDeep, dans une interview accordée à TechCrunch. «Mais nous avons aussi une marge de manœuvre pour continuer à être une force de l’IA en Afrique et en général, tout en développant des technologies qui repoussent les frontières de l’innovation dans d’autres secteurs comme l’optimisation industrielle.»

Au cours des douze derniers mois, InstaDeep s’est attelé à déployer l’IA à chaque étape du pipeline de BioNTech afin d’améliorer les processus existants. En histologie par exemple, l’analyse de tissus et l’étiquetage visuel de différents types cellulaires (tumeurs, cellules saines…) étaient traditionnellement réalisés manuellement par des experts. Les technologies de vision par ordinateur et de segmentation d’InstaDeep ont permis d’accélérer ce workflow d’étiquetage par un facteur 5.

RiboMab, un projet prometteur d’immunothérapie à base d’ARNm

Autre avancée majeure : l’achèvement du projet RiboMab, qui porte sur des anticorps codés par ARNm. Initialement introduits sur la plateforme d’InstaDeep dédiée à la conception de protéines et à l’analyse de données biologiques (DeepChain) lors d’une première collaboration avec BioNTech en 2020, ces «RiboMabs» font désormais partie intégrante de l’arsenal thérapeutique anti-cancer et anti-infectieux de la biotech allemande.

Le domaine de la biotechnologie brasse une quantité considérable de données de santé sensibles. Les collecter et les analyser est une chose, les sécuriser en est une autre. BioNTech n’est pas à l’abri d’incidents comme celui qui a frappé 23andMe en 2023, exposant les informations de près de 7 millions de clients de l’entreprise de tests génétiques. En 2020 déjà, des pirates avaient accédé illégalement à des documents liés au vaccin anti-Covid de BioNTech et Pfizer en s’attaquant à l’Agence européenne des médicaments (EMA).

Confidentialité des données de santé : deux approches complémentaires

Face à ces risques, InstaDeep et BioNTech font preuve d’une extrême vigilance dans le traitement des données médicales, d’autant qu’ils utilisent actuellement l’IA pour enrichir leurs actifs data dans le but d’identifier de nouvelles cibles thérapeutiques contre le cancer et d’autres pathologies. Les deux entités ont néanmoins des approches distinctes et complémentaires: alors que BioNTech gère les données personnelles et cliniques des patients, InstaDeep développe et entraîne ses modèles d’IA sur des données publiques.

InstaDeep a développé et entraîné le modèle Nucleotide Transformer sur des données publiques. Mais lorsque nous voulons déployer le modèle sur des cas d’utilisation spécifiques et des données réelles de patients, nous le faisons au niveau de BioNTech, avec toutes les garanties de confidentialité liées à son statut de leader de la biopharma.

– Karim Beguir, CEO d’InstaDeep

Percée technologique avec les réseaux de flux bayésiens

Parmi les prochaines étapes clés pour InstaDeep au sein de BioNTech, Karim Beguir cite la «dernière percée» de sa société : les réseaux de flux bayésiens (BFN). Ce nouveau modèle génératif d’IA pour les protéines surpasse significativement les modèles autorégressifs et diffusifs selon l’entreprise. Une «technologie de pointe» pour Ugur Sahin, le CEO de BioNTech.

Concrètement, les BFN permettent de rechercher des propriétés spécifiques sur la chaîne lourde d’un anticorps (caractéristiques chimiques, hydrophobicité, longueur de séquence…) et produisent ainsi les protéines les plus naturelles et les mieux adaptées du marché. Des atouts cruciaux pour comprendre les fonctions complexes des protéines et concevoir de nouvelles protéines thérapeutiques.

Nous sommes enthousiastes quant au potentiel des innovations en IA comme la nôtre pour identifier des cas d’utilisation réels, collaborer étroitement avec BioNTech et construire des produits qui seront testés en laboratoire et en clinique, sauvant au final des vies de patients. Si l’on considère où nous en sommes aujourd’hui en biologie et IA, c’est similaire à là où nous en étions avec le traitement du langage naturel en 2020 avec GPT-3.

– Karim Beguir

Un nouveau supercalculateur pour booster l’IA en santé

Pour appuyer le lancement de son modèle BFN, InstaDeep s’est dotée d’un supercalculateur «near-exascale», qui place le partenariat dans le top 100 mondial en termes de puissance de calcul et d’infrastructure, et dans le top 20 des clusters de GPU H100 selon les deux entreprises. De quoi muscler encore davantage les capacités d’InstaDeep dans les multiples cas d’usage de l’IA en sciences de la vie.

Optimiser les opérations industrielles complexes avec l’IA

Mais la pépite africaine n’en oublie pas pour autant ses autres domaines d’expertise, à commencer par l’IA et le deep reinforcement learning pour l’optimisation industrielle. InstaDeep poursuit ainsi son projet d’automatisation de la planification et de la régulation ferroviaires pour Deutsche Bahn, un de ses partenaires historiques. De même, la société a renforcé sa collaboration avec l’aéroport de Francfort pour optimiser ses opérations complexes grâce à l’intelligence artificielle.

De manière générale, nous voyons aussi un fort potentiel dans les systèmes basés sur des agents intelligents. Nous pensons que l’optimisation industrielle et les systèmes agentiques, travaillant main dans la main avec des collaborateurs humains, vont révolutionner l’efficacité industrielle. C’est un autre domaine sur lequel nous travaillons depuis de nombreuses années et dans lequel nous continuons d’investir.

– Karim Beguir

DeepPCB, l’IA au service de la conception hardware

Début octobre, InstaDeep a également lancé la version pro de DeepPCB, un outil de conception de circuits imprimés entièrement assisté par IA, s’appuyant sur l’apprentissage par renforcement. Selon Karim Beguir, la startup se démarque en résolvant des cas d’usage complexes de l’IA, comme la génération de modèles pour l’ADN et la protéomique, ou les workflows agentiques pour l’optimisation combinatoire, là où nombre de ses concurrents se cantonnent à des tâches plus simples comme la génération de langage.

En plus de l’acquisition par BioNTech, c’est cette ingéniosité qui explique l’intérêt croissant des clients américains et européens pour les solutions d’InstaDeep, assure le CEO. L’entreprise compte désormais plus de 400 collaborateurs à travers le monde, dont une équipe basée dans un nouveau bureau à Kigali, au Rwanda, qui pilote les activités de renseignement géospatial du groupe. Initialement déployé au sol en partenariat avec Google pour détecter les foyers de reproduction des criquets en Afrique, le framework InstaGeo exploite désormais l’imagerie satellite et le machine learning pour prédire les prochaines invasions avec une précision de 80 à 85%.

C’est un véritable exemple de l’impact concret des technologies d’IA. Plutôt que de collecter des échantillons sur le terrain ou de dépendre d’infrastructures locales, nous pouvons fournir ces informations via des satellites et à grande échelle, puis alerter plusieurs gouvernements et acteurs pour s’attaquer à un défi croissant pour la sécurité alimentaire, surtout au vu des problèmes climatiques du continent.

– Karim Beguir

Rachetée pour plus d’un demi-milliard de dollars, InstaDeep prouve que l’intelligence artificielle made in Africa a le potentiel de révolutionner des secteurs aussi pointus que la biotechnologie, tout en relevant les défis industriels et sociétaux du continent. Quinze mois après son intégration au sein de BioNTech, la licorne tunisienne n’a pas fini de faire parler d’elle.

«Nous sommes stratégiquement alignés avec BioNTech sur les objectifs à poursuivre en matière de biologie et de capacités d’IA bio», affirme Karim Beguir, cofondateur et CEO d’InstaDeep, dans une interview accordée à TechCrunch. «Mais nous avons aussi une marge de manœuvre pour continuer à être une force de l’IA en Afrique et en général, tout en développant des technologies qui repoussent les frontières de l’innovation dans d’autres secteurs comme l’optimisation industrielle.»

Au cours des douze derniers mois, InstaDeep s’est attelé à déployer l’IA à chaque étape du pipeline de BioNTech afin d’améliorer les processus existants. En histologie par exemple, l’analyse de tissus et l’étiquetage visuel de différents types cellulaires (tumeurs, cellules saines…) étaient traditionnellement réalisés manuellement par des experts. Les technologies de vision par ordinateur et de segmentation d’InstaDeep ont permis d’accélérer ce workflow d’étiquetage par un facteur 5.

RiboMab, un projet prometteur d’immunothérapie à base d’ARNm

Autre avancée majeure : l’achèvement du projet RiboMab, qui porte sur des anticorps codés par ARNm. Initialement introduits sur la plateforme d’InstaDeep dédiée à la conception de protéines et à l’analyse de données biologiques (DeepChain) lors d’une première collaboration avec BioNTech en 2020, ces «RiboMabs» font désormais partie intégrante de l’arsenal thérapeutique anti-cancer et anti-infectieux de la biotech allemande.

Le domaine de la biotechnologie brasse une quantité considérable de données de santé sensibles. Les collecter et les analyser est une chose, les sécuriser en est une autre. BioNTech n’est pas à l’abri d’incidents comme celui qui a frappé 23andMe en 2023, exposant les informations de près de 7 millions de clients de l’entreprise de tests génétiques. En 2020 déjà, des pirates avaient accédé illégalement à des documents liés au vaccin anti-Covid de BioNTech et Pfizer en s’attaquant à l’Agence européenne des médicaments (EMA).

Confidentialité des données de santé : deux approches complémentaires

Face à ces risques, InstaDeep et BioNTech font preuve d’une extrême vigilance dans le traitement des données médicales, d’autant qu’ils utilisent actuellement l’IA pour enrichir leurs actifs data dans le but d’identifier de nouvelles cibles thérapeutiques contre le cancer et d’autres pathologies. Les deux entités ont néanmoins des approches distinctes et complémentaires: alors que BioNTech gère les données personnelles et cliniques des patients, InstaDeep développe et entraîne ses modèles d’IA sur des données publiques.

InstaDeep a développé et entraîné le modèle Nucleotide Transformer sur des données publiques. Mais lorsque nous voulons déployer le modèle sur des cas d’utilisation spécifiques et des données réelles de patients, nous le faisons au niveau de BioNTech, avec toutes les garanties de confidentialité liées à son statut de leader de la biopharma.

– Karim Beguir, CEO d’InstaDeep

Percée technologique avec les réseaux de flux bayésiens

Parmi les prochaines étapes clés pour InstaDeep au sein de BioNTech, Karim Beguir cite la «dernière percée» de sa société : les réseaux de flux bayésiens (BFN). Ce nouveau modèle génératif d’IA pour les protéines surpasse significativement les modèles autorégressifs et diffusifs selon l’entreprise. Une «technologie de pointe» pour Ugur Sahin, le CEO de BioNTech.

Concrètement, les BFN permettent de rechercher des propriétés spécifiques sur la chaîne lourde d’un anticorps (caractéristiques chimiques, hydrophobicité, longueur de séquence…) et produisent ainsi les protéines les plus naturelles et les mieux adaptées du marché. Des atouts cruciaux pour comprendre les fonctions complexes des protéines et concevoir de nouvelles protéines thérapeutiques.

Nous sommes enthousiastes quant au potentiel des innovations en IA comme la nôtre pour identifier des cas d’utilisation réels, collaborer étroitement avec BioNTech et construire des produits qui seront testés en laboratoire et en clinique, sauvant au final des vies de patients. Si l’on considère où nous en sommes aujourd’hui en biologie et IA, c’est similaire à là où nous en étions avec le traitement du langage naturel en 2020 avec GPT-3.

– Karim Beguir

Un nouveau supercalculateur pour booster l’IA en santé

Pour appuyer le lancement de son modèle BFN, InstaDeep s’est dotée d’un supercalculateur «near-exascale», qui place le partenariat dans le top 100 mondial en termes de puissance de calcul et d’infrastructure, et dans le top 20 des clusters de GPU H100 selon les deux entreprises. De quoi muscler encore davantage les capacités d’InstaDeep dans les multiples cas d’usage de l’IA en sciences de la vie.

Optimiser les opérations industrielles complexes avec l’IA

Mais la pépite africaine n’en oublie pas pour autant ses autres domaines d’expertise, à commencer par l’IA et le deep reinforcement learning pour l’optimisation industrielle. InstaDeep poursuit ainsi son projet d’automatisation de la planification et de la régulation ferroviaires pour Deutsche Bahn, un de ses partenaires historiques. De même, la société a renforcé sa collaboration avec l’aéroport de Francfort pour optimiser ses opérations complexes grâce à l’intelligence artificielle.

De manière générale, nous voyons aussi un fort potentiel dans les systèmes basés sur des agents intelligents. Nous pensons que l’optimisation industrielle et les systèmes agentiques, travaillant main dans la main avec des collaborateurs humains, vont révolutionner l’efficacité industrielle. C’est un autre domaine sur lequel nous travaillons depuis de nombreuses années et dans lequel nous continuons d’investir.

– Karim Beguir

DeepPCB, l’IA au service de la conception hardware

Début octobre, InstaDeep a également lancé la version pro de DeepPCB, un outil de conception de circuits imprimés entièrement assisté par IA, s’appuyant sur l’apprentissage par renforcement. Selon Karim Beguir, la startup se démarque en résolvant des cas d’usage complexes de l’IA, comme la génération de modèles pour l’ADN et la protéomique, ou les workflows agentiques pour l’optimisation combinatoire, là où nombre de ses concurrents se cantonnent à des tâches plus simples comme la génération de langage.

En plus de l’acquisition par BioNTech, c’est cette ingéniosité qui explique l’intérêt croissant des clients américains et européens pour les solutions d’InstaDeep, assure le CEO. L’entreprise compte désormais plus de 400 collaborateurs à travers le monde, dont une équipe basée dans un nouveau bureau à Kigali, au Rwanda, qui pilote les activités de renseignement géospatial du groupe. Initialement déployé au sol en partenariat avec Google pour détecter les foyers de reproduction des criquets en Afrique, le framework InstaGeo exploite désormais l’imagerie satellite et le machine learning pour prédire les prochaines invasions avec une précision de 80 à 85%.

C’est un véritable exemple de l’impact concret des technologies d’IA. Plutôt que de collecter des échantillons sur le terrain ou de dépendre d’infrastructures locales, nous pouvons fournir ces informations via des satellites et à grande échelle, puis alerter plusieurs gouvernements et acteurs pour s’attaquer à un défi croissant pour la sécurité alimentaire, surtout au vu des problèmes climatiques du continent.

– Karim Beguir

Rachetée pour plus d’un demi-milliard de dollars, InstaDeep prouve que l’intelligence artificielle made in Africa a le potentiel de révolutionner des secteurs aussi pointus que la biotechnologie, tout en relevant les défis industriels et sociétaux du continent. Quinze mois après son intégration au sein de BioNTech, la licorne tunisienne n’a pas fini de faire parler d’elle.

À lire également