昆仑万维在近期的一周内,以惊人的速度发布了六款AI大模型,这一连串的动作在科技界掀起了轩然大波。从8月11日至15日,这家公司几乎每天都能在科技头条上占据一席之地,全面展示了其在多模态AI领域的突破性进展。
这一系列发布涵盖了视频生成、世界模型、统一多模态模型、智能体以及音乐创作等多个方向。昆仑万维通过Skywork平台,向外界展示了其技术的深度和广度。这种高频且密集的产品发布策略,在国内厂商中实属罕见,也让人不禁好奇,昆仑万维究竟在下一盘怎样的棋?
8月11日,昆仑万维首先推出了SkyReels-A3,这是一款基于音频驱动的人像视频生成模型。它利用先进的DiT(Diffusion Transformer)视频扩散模型技术,能够实现任意时长的全模态音频驱动数字人创作。用户只需上传一张照片并配上语音,模型就能精准匹配口型、表情和动作,生成高质量的视频内容。SkyReels-A3在唇形同步、面部稳定性和动作自然度方面表现出色,并支持更丰富的镜头变化和长达60秒的视频生成,为电影制作、虚拟直播、游戏开发等领域带来了全新的可能性。
紧接着,昆仑万维在第二天推出了Matrix系列世界模型的升级版本——Matrix-Game 2.0。这是一款交互式视频生成模型,能够在低延迟、高帧率的情况下生成连续的视频内容,且生成时长可扩展至分钟级。Matrix-3D模型则用于3D世界的生成与探索,能够生成支持360度自由环视的3D场景。这两个模型打破了内容生成与交互之间的壁垒,为游戏引擎、元宇宙等领域提供了强有力的技术支撑。
8月13日,昆仑万维发布了Skywork UniPic 2.0,这是一款面向统一多模态建模的高效训练与推理框架。它通过轻量化优化和多模态联合训练,构建了理解、生图、编辑一体化的核心能力。目前,Skywork UniPic 2.0及其系列模型已全面开源,为开发者提供了极大的便利。
在8月14日,昆仑万维正式推出了Skywork Deep Research Agent v2,这是天工超级智能体的核心引擎。自上线以来,该模型已经在AI Office领域发挥了巨大作用,为用户产出了大量高质量的文档、PPT等交付物。新版本的推出将进一步提升用户体验。
作为技术发布周的收官之作,昆仑万维在8月15日正式推出了音乐模型Mureka V7.5。这款模型能够AI生成音乐,不仅大幅节约了时间和成本,还在音乐性和文本控制准确性方面领先同类模型。Mureka自上线以来,已经在海内外获得了广泛好评,用户数量持续增长。
昆仑万维的这一系列动作并非突如其来,而是其长期投入AI领域的必然结果。作为一家从游戏起家的公司,昆仑万维在转型为平台型互联网企业后,又加速向AI企业转型。自提出“All in AGI 与 AIGC”以来,公司持续投入大量资源开发各类AI应用,并前瞻性地完成了“算力基础设施—大模型算法—AI应用”全产业链布局。
此次技术发布周不仅展示了昆仑万维在AI领域的强大实力,也标志着其从“技术探索期”迈入“商业收获期”。SkyReels、Mureka等产品矩阵已在终端市场获得积极反馈,海外业务增速迅猛。同时,昆仑万维还入选了Hugging Face发布的“中国AI开源16强”,进一步证明了其在开源社区的贡献和影响力。
随着AI技术的不断发展,昆仑万维将继续全心投入技术创新,保持竞争优势,加速AI应用落地和商业化变现。可以预见的是,这家公司在AI领域的探索之路还远未结束。