xAI正式上线Grok Imagine Video 1.5:生成6秒720P视频仅需25秒
6月17日,马斯克旗下xAI公司今日发布公告,宣布Grok Imagine Video 1.5模型正式结束预览,在xAI API中正式上线。该模型于2026年6月3日推出预览版,主打“静态图一键生成带同步音频的短视频”,相比前代,在音画同步、运动真实性和生成速度三大维度上实现了显著升级。
在音画同步方面,Grok Imagine Video 1.5能够在单次生成中同时输出音效、环境音和对话,精准对齐音频与画面动作。该模型大幅提升了语音清晰度,口型同步效果更加自然,适用于需要人物配音的短片创作。在运动与物理表现方面,模型增强了视频内的运动连贯性,明显减少了常见的人物肢体扭曲和物体漂浮假象。模型能更好地模拟重量感与动量——例如人物走路时衣摆的自然晃动、下落物体的加速轨迹,整体观感更接近真实物理世界。
在生成速度方面,Grok Imagine Video 1.5 Fast模式下,生成一段6秒、分辨率720p的视频仅需约25秒,而前代则需要40秒以上。这一速度提升使得视频创作的工作流更加高效,也为实时或近实时的内容生成场景提供了更多可能性。
目前,Grok Imagine Video 1.5已在xAI API中以grok-imagine-video-1.5模型名称正式提供。开发者可通过上传起始图片、描述运动方式,并选择分辨率和时长来调用该模型。
业内人士指出,xAI在视频生成领域的快速迭代显示出其追赶竞争对手的紧迫感。相比此前谷歌Veo 2和Runway Gen-3等模型动辄数分钟的处理时间,Grok Imagine Video 1.5在速度上建立了显著优势。而音画同步和物理真实性的改进,也使其在社交短视频、营销素材和创意原型等应用场景中具备更强的实用价值。随着API的正式开放,更多第三方开发者将有机会基于该模型构建应用,视频生成赛道的竞争将进一步加剧。