Si vous aimez mon contenu, cliquez sur le ❤ au-dessus et à côté de mon nom pour m’aider à remonter sur Substack ou Gmail et parce que ça me donne encore plus envie de faire mieux la prochaine fois 😊
C’est jeudi, le jour d’EthicGPT ! 😊 Je suis très heureux de vous retrouver pour cette 33e édition !
Si quelqu’un vous a transféré cette édition et que le contenu vous plaît, n’hésitez pas à vous abonner et à la transférer également. Cela m’aidera beaucoup pour faire connaître mon travail 😌 Si vous êtes déjà abonné(e), vous pouvez également me soutenir.
Quelques liens utiles si jamais vous débarquez ici pour la première fois :
Vous souhaitez sponsoriser cette newsletter ? C’est par ici.
Mon podcast Singularité IA dans lequel je débats avec mon ami JB,
La présentation et les archives de cette newsletter
Prêt(e) à consacrer ces quelques sur l’IA avec moi ? C’est parti 🚀
Depuis la fin d’année dernière, je sens poindre une envie d’open source dans l’IA générative. Je ne compte plus les “spécialistes”, libertariens et autres anti OpenAI dire que le grand jour de l’open source va arriver.
La nouvelle de la levée de fonds de 385 millions de dollars de Mistral AI a d’ailleurs été le point d’orgue de cette frénésie. À l’avenir, l’IA sera open source ou ne sera pas. Vraiment ?
Si l’arrivée de l’open source est intéressante, je pense qu’il faut largement tempérer cet enthousiasme pour plusieurs raisons.
Qu’est-ce que l’IA open source ?
Quand on parle d'IA open source, on touche à ce que j’appelle un serpent de mer dans le monde numérique : l’open source. Il existe depuis des décennies, avec des réussites mais aussi des échecs. Pour le définir très (très) grossièrement, l’open source est un logiciel ou une interface dont l’accès est gratuit. Il s’oppose aux logiciels ou interfaces dit propriétaires. L’exemple le plus connu est l’opposition Windows (payant) et Linux (gratuit). Il y a donc aussi le fait pour une entité de générer du profit avec un outil propriétaire.
Pour l’IA open source, c’est à peu près la même chose. On a des outils propriétaires et payants. ChatGPT est l’exemple parfait, même si OpenAI propose une version gratuite. Mais d’autres sont gratuits. Les exemples les plus connus sont Llama 2 de Meta et la pépite française Mistral AI.
D’ailleurs, le marché de l’IA open source est en pleine effervescence, porté par la levée de fonds colossale de Mistral AI (385 millions de dollars). Des chiffres qui donnent le tournis et qui reflètent l'engouement autour de cette technologie, mais aussi de l’open source. Pourtant, il n'y a pas que les chiffres qui parlent : c'est toute une communauté, des têtes pensantes aux “geeks” nocturnes, qui vibre au rythme de l'open source au-delà de l’IA.
Pourtant, il y a un gros problème : le grand public reste à la traîne. Cela a déjà été le cas avec Linux, qui est pourtant un excellent produit. Mais le grand public et beaucoup d’entreprises préfèrent la facilité d’utilisation et l’interopérabilité des outils propriétaires. Pour l’IA, on semble se diriger vers la même chose.
C'est là le paradoxe de l'open source en IA : une promesse d'accessibilité qui peine encore à trouver un écho auprès du grand public.
Les avantages de l’IA open source
Même si je suis dubitatif sur son succès à l’avenir, l’IA open source possède de véritables atouts. D’abord, il y a l’innovation et la collaboration. L’open source est un monde où des développeurs contribuent à un projet commun. C’est un écosystème où les idées circulent librement, ce qui permet de “propulser” l'innovation.
L’exemple parfait du moment s’appelle Mistral, une start-up française, dont le modèle Medium n’est devancé en termes de performances que par GPT-4 !
L'IA open source, c'est l'outil parfait pour démocratiser l’outil et son utilisation. Il permet en théorie de mettre fin au monopole des géants de la tech et de proposer l’accès gratuit à la technologie. En d’autres termes, l’open source est plus a même d’aller vers l’objectif d’OpenAI qui est de faire de l’IA un bien commun de l’humanité.
Enfin, il est normal que je parle d’éthique dans cette newsletter EthicGPT ! L'open source est synonyme de transparence et de responsabilité, et donc d’éthique de l’IA. Alors qu’on ne sait pas vraiment comment OpenAI a entraîné ses modèles, tout est su et connu dans l’open source. Ainsi, on peut surveiller l’outil open source et éviter qu’il y ait des dérives.
En bref, l'open source en IA devrait être un allié inestimable dans notre quête d'une IA à visage humain. Pourtant, la théorie pourrait s’écraser sur l’autel de la pratique.
Les défis et limites de l’open source
Malheureusement, l’IA open source a aussi des limites et certaines me semblent rédhibitoires pour exister à l’avenir. D’abord, même si ce n’est pas le plus important pour moi, il y a la sécurité et la confidentialité. En effet, open source peut signifier ouvrir le code source à tout le monde. On peut donc avoir plus de vulnérabilités et de failles dans un outil open source. Cependant, point essentiel, ce problème a tendance à être corrigé et il n’est a priori par présent chez Mistral par exemple.
Ensuite, certains mettront en avant la qualité du produit. Sans un semblant de gouvernance, l’outil peut souffrir de défauts majeurs. L'absence de leadership clair peut transformer l'innovation en désordre et la dépendance à une communauté volatile reste un pari risqué. Mais là aussi, ce problème a tendance à s’estomper et je reprends mon exemple Mistral.
Pour moi, ce sont les 2 défis et limites qui suivent qui sont les plus importants.
D’une part, il y a l’argent, qui est le nerf de la guerre. Perso, je cherche à comprendre le business model de Mistral AI. Même si le produit est excellent, il souffrira d’un manque de financement, car l’entraînement d’un modèle d’IA est très cher. Sans faire payer les utilisateurs, même avec une somme modique, c’est pour moi impossible de rivaliser avec les outils propriétaires. Là encore, il semble qu’il y ait quand même une utilisation payante en tokens qui puisse remédier à cela. J’attends de voir la suite.
D’autre part, il y a l’accès. Aujourd’hui, un utilisateur lambda aura bien plus de facilités d’accès à OpenAI qu’à Mistral. C’est juste plus simple. Même si certains diront le contraire, qu’utiliser les outils open source sur Hugging Face est très simple, cela ne l’est pas pour le grand public. Il ne faut jamais oublier que la majorité est faignante, veut pouvoir utiliser les choses sans réfléchir à comment y accéder et sans savoir comment ça marche. En tant que répertoire de modèles open source, Hugging Face est un super outil, mais pas aussi simple d’accès que ChatGPT.
L’open source et l’IA éthique, un bon compromis ?
Pour moi, l’avantage majeur de l'IA open source, c’est qu’elle est celle qui pourra faire émerger une véritable IA éthique. D’abord, parce que l’open source en IA est bien plus mature que l’open source des autres outils numériques. Ensuite, parce qu’elle combine transparence, partage et responsabilité, qui sont des valeurs profondément éthiques. Clairement, OpenAI ne partage aucun de ces 3 valeurs
L’IA open source ne peut théoriquement souffrir d’aucune dérive. Le code est accessible, on sait comment les données sont entraînées et on sait même quelles données sont utilisées pour l’entraînement des LLM. Au moindre doute, la communauté peut très facilement éliminer le problème, ce qui serait impossible chez OpenAI par exemple.
Et je vais même me contredire par rapport à ce que j’ai dit avant. Finalement, le fait de reléguer l’argent au second plan peut être une bonne chose. Le but n’est plus de faire de l’argent, mais de proposer un outil pour le bien de tous. Il n’y a plus de course au profit, il y a une course au bien commun. C’est clairement quelque chose de bien plus positif.
Mais on en revient toujours au même point. Sans argent, il est difficile de maintenir un outil de qualité. Alors Mistral peut construire cet outil en étant valorisée à plus d’un milliard de dollars. Mais peut-elle maintenir cette qualité à long terme sans levée de fonds supplémentaire ?
Quelles perspectives futures pour l’IA open source ?
Je suis très partagé sur l’avenir de l’IA open source. J’ai peur d’un destin à la Web3 : de magnifiques promesses, mais un accès trop complexe. Le Web3 décentralisé et ouvert à tous est mort en raison d’une incompréhension du grand public. Il n’a jamais compris à quoi cela servait et en quoi ça l’aiderait. Résultat ? On aura au mieux un Web3 centralisé, qui sera la continuité du Web2.
Pour le Web3, je disais déjà que c’est le grand public qui allait décider du succès ou non. Pour l’IA open source, c’est la même chose. Si le grand public peut y accéder et l’utiliser sans difficulté, l’IA open source a un très bel avenir et pourra surpasser les modèles propriétaires.
Au contraire, si l’IA open source reste trop complexe d’accès par rapport à des outils comme ChatGPT et/ou ne parvient pas à financer des outils performants, elle finira comme Linux. Ce n’est pas une tare, car Linux rencontre un certain succès, mais seulement auprès d’une petite communauté.
Pour moi, l’IA open source doit suivre l’exemple Wikipedia, qui est l’un des rares outils open source a rencontré un succès auprès du grand public. Mais le pourra-t-elle ?
Voilà, c’est tout pour aujourd’hui, à la semaine prochaine 🙂