Le problème
Pour générer des visuels, j'utilise généralement les modèles de Google pour leur multimodalité. Cependant, sur Google AI Studio, il manque certaines fonctionnalités offertes par l'API. Ici, j'exploite l'option "extend video" pour générer des clips longs destinés à des publicités. VEO 3.1 limite la génération à 8 secondes par clip. Produire une véritable publicité de 15 à 60 secondes nécessite donc d'enchaîner les extensions de manière séquentielle, de gérer la continuité entre les segments et de concaténer le résultat final.
Ce que j'ai développé
En général, j'évite d'utiliser Google AI Studio car l'interface peut être instable et les temps de génération sont souvent très longs.
- Une interface à entrée unique : décrivez votre publicité en langage naturel, choisissez une durée, et c'est tout.
- Un optimiseur de prompt basé sur Gemini qui transforme une idée vague en prompts VEO structurés par segment (cinématographie, sujet, action, indications audio, liens de continuité). Tout cela fonctionne grâce à un prompt sur mesure, créé à partir de mes instructions et optimisé par Gemini 3.1 Pro Preview, qui respecte le format d'entrée JSON de VEO 3.1 pour obtenir de meilleurs résultats.
- Enchaînement automatique des extensions : le serveur génère le premier segment, l'étend N fois, télécharge chaque partie et les concatène en un seul fichier avec ffmpeg.
- Suppression d'arrière-plan en un clic (extraction alpha image par image vers un WebM transparent) pour pouvoir incruster le sujet sur n'importe quel décor.

Stack technique
Node/Express. Gemini 3.1 Pro (optimisation de prompt). API VEO 3.1 (génération de vidéo + extension). @imgly/background-removal-node. ffmpeg.
Comment ça fonctionne
Brief -> Gemini optimise en N prompts de segment -> VEO génère le clip de base -> VEO étend N-1 fois -> concaténation ffmpeg -> suppression d'arrière-plan optionnelle -> MP4/WebM final.

Résultat final
Ensuite, je peux aller sur CapCut pour ajouter rapidement l'arrière-plan de mon application et intégrer mon IA qui explique les problèmes que SignatureMaker peut résoudre.

Durée
2026
Stack technique
Responsabilités
- Prompt engineering pour la continuité sur VEO
- Pipeline d'enchaînement d'extensions
- Intégration de la suppression d'arrière-plan
- Automatisation de la concaténation avec ffmpeg