
Ouvrez votre téléphone, enregistrez quelques secondes de votre visage et de votre voix et, instantanément, visualisez-vous dans une scène qui n'existait pas il y a quelque temps : c'est la nouvelle promesse d'OpenAI avec Sora2. L'application fait de vous le protagoniste d'un clip qui continue mouvements, rebonds et continuité comme si cela avait été filmé avec une caméra.
L'idée n'est pas particulièrement cryptique : il suffit de saisir son identité une fois pour que l'application vous intègre à des scénarios générés par l'IA. Ce qui est frappant, c'est le sentiment de contrôle créatif et la capacité du système à enchaîner les prises de vue sans que le « monde » ne s’effondre en cours de route. C'est pourquoi nous parlons de «TikTok d'OpenAI ».
Qu'est-ce que Sora 2 et pourquoi s'appelle-t-il TikTok d'OpenAI ?

Sora 2 est la nouvelle génération du modèle vidéo d'OpenAI, lancé parallèlement à une application sociale appelée Sora. Sa formule combine un générateur de clips avec un Flux de style TikTok, des remixes et des options pour utiliser votre propre image comme camée.
L'approche sociale ne se limite pas au défilement. OpenAI propose une expérience conçue pour créer avec d'autres personnes : vous pouvez remixer les vidéos d'autres personnes, répondez avec des variations et maintenez des fils créatifs autour de la même scène ou idée.
L'application est disponible de manière limitée : uniquement iOS, sur invitation et aux États-Unis et au Canada Pour l'instant, l'entreprise parle d'une expansion progressive et d'un accès Web pour ceux qui reçoivent une invitation, mais sans dates fixes pour les autres pays.
Parallèlement, le modèle Sora 2 se positionne également face à des alternatives telles que Piste (Gen-4) ou Google Véo:Son avantage unique est qu’il combine puissance technique et diffusion sociale dans un seul produit.
Mises à jour du modèle : physique, continuité et audio intégré

OpenAI compare le saut de Sora 2 à ce qui GPT-3.5 était autrefois Pour le texte. La grande différence réside dans la fidélité physique : si une balle ne rentre pas, elle rebondit sur le plateau au lieu de se « téléporter », un défaut courant des générations précédentes.
Le modèle maintient l'état du monde entre les plans, ce qui est essentiel pour raconter des histoires courtes sur plusieurs plans. Cette continuité permet transitions et changements de scène sans perdre de personnages ou d'accessoires en cours de route.
En plus de la vidéo, Sora 2 génère audio synchroniséVoix, effets et ambiances sonores en harmonie avec le contenu à l'écran. Le mixage image-son est né du message lui-même, simplifiant ainsi le travail des créateurs.
Les clips résultants peuvent couvrir des styles réalistes, cinématographiques ou d'action. Anime. , et pour l'instant ils se déplacent par courtes durées, de environ 5 à 10 secondes, assez pour des pièces virales et des micro-récits.
OpenAI admet qu'il y a encore des erreurs et que la cohérence n'est pas parfaite, mais maintient que les progrès par rapport à Sora 1 sont notables, notamment en rigidité, flottabilité et contact entre les objets et les personnes.
L'application Sora : caméos, remix et un flux basé sur la langue
La caractéristique la plus distinctive est la camées: Après une brève vérification faciale et vocale, vous pouvez apparaître dans n'importe quelle scène générée. C'est une option ; vous décidez si votre image peut être utilisée et qui peut l'utiliser.
Le flux intègre une « nouvelle classe » de recommandateur qui accepte instructions en langage naturelPar défaut, il donne la priorité aux personnes avec lesquelles vous interagissez et vous montre le contenu que le système estime plus susceptible de vous inciter à créer plutôt qu'à simplement regarder.
L'application simplifie le remixage : vous prenez le clip d'un autre utilisateur, vous ajoutez des modifications de texte et vous créez votre propre version. Ce mécanisme vise à optimiser co-création et des variations en chaîne sur la même invite ou le même scénario.
Pour renforcer la paternité et la traçabilité, OpenAI inclut métadonnées et filigranes indiquant que le matériel a été généré avec l'IA et limite la capture avec des mesures telles que le blocage de l'enregistrement d'écran.
Dans un avenir proche, l'entreprise parle d'ouvrir le accès via API, conservez Sora 1 Turbo et offrez plus de contrôle qualité dans une variante Pro liée aux abonnements ChatGPT Pro.
Bien-être, sécurité et limites : politiques et modération
OpenAI affirme qu'il n'optimise pas le temps d'utilisation continue : la conception est orientée vers création versus consommationL'application vous interroge périodiquement sur votre bien-être et vous propose d'ajuster votre flux avec des options claires.
Pour les mineurs, des limites par défaut s'appliquent au nombre de générations visibles, autorisations plus strictes sur les caméos et le contrôle parental de ChatGPT pour ajuster la personnalisation, le timing et les messages directs.
L'entreprise renforce la modération humaine pour répondre rapidement aux cas de harcèlement ou d'abus. Elle indique également que personnalités publiques sans consentement (caméo téléchargé par la personne) ni contenu adulte ou extrême.
- Vérification obligatoire de visage et voix pour activer les camées.
- Contrôle total de l'utilisateur sur qui peut utiliser votre camée, avec la possibilité de révoquer l'accès.
- Signes d'origine : métadonnées et filigranes dans les clips.
- Mesures contre les abus : modération humaine et des limites pour les adolescents.
En termes de disponibilité et de coût, Sora 2 démarre gratuit avec limites lié à la puissance de calcul. Les abonnés ChatGPT Pro ont accès à Sora 2 Pro avec une qualité supérieure, et un déploiement plus large est prévu à mesure que l'infrastructure se développe.
Pour l'instant, Sora 2 vise à transformer de courtes vidéos en un espace de jeu partagé, où chacun peut jouer dans des scènes en quelques secondes et les partager sur un environnement social contrôléSi cela réussit, cela pourrait marquer une période de créativité plus participative, avec des pièces qui mélangent réalisme physique, continuité narrative et son généré sans quitter un téléphone portable.

