今日(8月11日),昆仑万维(300418)启动SkyWork AI技术发布周(8月11日至15日),每日发布视频生成模型(SkyReels)等五大类多模态AI模型。这标志着其AI技术全面迈入商业化阶段,前期研发成果加速转化为产品矩阵,技术变现飞轮高效运转。
技术周首日,全球首个支持分钟级长视频生成的音频驱动模型SkyReels-A3亮相。该模型以四大技术创新直击直播电商万亿市场痛点,实现长视频连贯生成、影视级运镜控制与自然动作交互,为内容创作产业奠定新一代技术基石。
技术突破:构建多模态协同的生成范式
传统视频生成技术受限于误差累积效应,面临长视频画面崩坏与动作僵硬的行业瓶颈。模型Skyreels-A3的创新在于构建了多模态协同的生成范式,保证了画面的一致性,基于DiT视频扩散模型框架构建,通过三路输入处理系统实现文本、图像与音频的深度融合,突破了误差控制机制,创新采用分段插帧策略,通过确定起始帧和终止帧生成视频片段,并取用尾帧作为插帧监督信号,成功将180秒长视频的画面稳定度控制在较高值,彻底解决行业顽疾。
在艺术创作的高阶美感表达维度,模型首创基于ControlNet的镜头控制模块,支持固定镜头、推镜、拉镜、左摇、右摇、抬升、下降、手持镜头等8种运镜参数,且强度可自由连续调节。该技术使非专业用户也能精准控制镜头语言,这种能力源自对影视镜头物理轨迹的数学建模,显著提升直播带货场景的真实性,同时也可以提升音乐MV、电影片段的艺术表现力。
针对直播带货等交互场景中,效果不够逼真的痛点,模型通过DPO算法优化手部动作自然度,驱动生成效果逼近真人表现,该技术通过分析大量真实交互数据,建立“动作—商品—语音”的跨模态关联。
模型Skyreels通过Step蒸馏技术,将推理步数从40步压缩至4步,画面质量保持率超98%,使视频生成时间缩短至80秒,大幅降低创作者硬件门槛。人工盲测进一步验证其优势:在带货场景,在观众盲测中,89%的人认为模型Skyreels呈现的动作效果比竞品更真实自然,动作自然性和面部稳定性评分这两项关键指标均居行业首位。
商业化潜力:撬动万亿市场的创作革命
2023年以来,昆仑万维“All in AGI与AIGC”战略全面落地,实现了从技术研发到产品商业化的转变,并获得了用户广泛的认可。
昆仑万维2025年第一季度财报数据显示,经营性现金流净额增长58.3%,2024年15.4亿元的研发投入正持续转化为营收增长动能。这验证了AI技术商业化的可持续性,使其成为国内首个跑通“研发投入—产品变现—现金流反哺”闭环的AI企业。
当模型SkyReels赋能锚定直播电商领域电影制作、虚拟直播、游戏开发与教育内容创作,显著降低多角色视频制作门槛,让个性化、交互式内容的创作前所未有地高效与便捷。昆仑万维表示,技术周未来几日发布的其他模型也将开辟多元战场,五大模型正编织一张覆盖全球市场的商业化网络。(燕云)
股票投资公司排名前十提示:文章来自网络,不代表本站观点。