Le laboratoire français d’intelligence artificielle Kyutai a lancé hier Moshi, un modèle de langage multimodal open-source, capable d’écouter, de comprendre et de parler en temps réel avec une latence quasi inexistante de 200 millisecondes de bout en bout. Cette prouesse … Continuer la lecture →
Oui c’est moi qui avait mal compris, je m’attendais à du texte aussi