Data / IA
Microsoft lance un service d’avatars dopés à l’IA sous Azure
Par Laurent Delattre, publié le 23 août 2024
En combinant ses technologies d’animation d’Avatar et de « Text to Speech », Microsoft propose un nouveau service Azure AI qui permet aux entreprises de créer des Avatars qui parlent au sein de leurs applications, leurs présentations PowerPoint et sur leurs sites Web.
L’idée est simple mais devrait trouver bien des cas d’usage en entreprise. La nouvelle API « TTS Avatar » du service Azure AI Speech permet de convertir un texte en une vidéo photoréaliste d’un personnage prononçant ce même texte avec une voix des plus naturelles. Le service est disponible en plusieurs langues, dont le français.
Les développeurs peuvent utiliser TTS Avatar pour générer des avatars parlants soit en temps réel (via une intégration à GPT-4o) pour des chatbots plus interactifs, soit en mode Batch (pour des présentations de produits par exemple), selon les besoins de leurs applications.
Microsoft fournit une pléthore de codes sources d’exemples d’implémentation aussi bien en fonctionnement Batch qu’en fonctionnement Tchat temps réel. Mais il est aussi possible de travailler avec une approche “no-code” en s’appuyant sur l’outil d’avatar de synthèse vocale du Speech Studio.
Les vidéos produites sont en 1920×1080 pixels (Full HD) et en 25 images par seconde.
L’IA anime les lèvres et les expressions faciales pour retranscrire avec fidélité les intonations et messages du texte lu.
Le service propose en standard une variété d’avatars préconçus, ainsi qu’un portfolio de voix au son naturel et une option pour créer des voix synthétiques personnalisées en s’appuyant sur le service « Azure Custom Neural Voice ».
Les avatars photoréalistes peuvent également être personnalisés pour correspondre à l’image de marque d’une entreprise. Mais cette personnalisation n’est pour l’instant qu’en accès limité et nécessite de préalablement présenter son projet à Microsoft et suivre un parcours d’approbation.
À LIRE AUSSI :
À LIRE AUSSI :
À LIRE AUSSI :