xAI正式上线Grok Imagine Video 1.5：生成6秒720P视频仅需25秒

2026-06-17 14:51:53 | 弘乐 | 120

6月17日，马斯克旗下xAI公司今日发布公告，宣布Grok Imagine Video 1.5模型正式结束预览，在xAI API中正式上线。该模型于2026年6月3日推出预览版，主打“静态图一键生成带同步音频的短视频”，相比前代，在音画同步、运动真实性和生成速度三大维度上实现了显著升级。

在音画同步方面，Grok Imagine Video 1.5能够在单次生成中同时输出音效、环境音和对话，精准对齐音频与画面动作。该模型大幅提升了语音清晰度，口型同步效果更加自然，适用于需要人物配音的短片创作。在运动与物理表现方面，模型增强了视频内的运动连贯性，明显减少了常见的人物肢体扭曲和物体漂浮假象。模型能更好地模拟重量感与动量——例如人物走路时衣摆的自然晃动、下落物体的加速轨迹，整体观感更接近真实物理世界。

在生成速度方面，Grok Imagine Video 1.5 Fast模式下，生成一段6秒、分辨率720p的视频仅需约25秒，而前代则需要40秒以上。这一速度提升使得视频创作的工作流更加高效，也为实时或近实时的内容生成场景提供了更多可能性。

目前，Grok Imagine Video 1.5已在xAI API中以grok-imagine-video-1.5模型名称正式提供。开发者可通过上传起始图片、描述运动方式，并选择分辨率和时长来调用该模型。

业内人士指出，xAI在视频生成领域的快速迭代显示出其追赶竞争对手的紧迫感。相比此前谷歌Veo 2和Runway Gen-3等模型动辄数分钟的处理时间，Grok Imagine Video 1.5在速度上建立了显著优势。而音画同步和物理真实性的改进，也使其在社交短视频、营销素材和创意原型等应用场景中具备更强的实用价值。随着API的正式开放，更多第三方开发者将有机会基于该模型构建应用，视频生成赛道的竞争将进一步加剧。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。