智谱AI新推“清影”工具:30秒生成视频,免费试用!,OpenAI下周推出GPT-4o语音模式,ChatGPT Plus用户将率先体验无缝AI聊天,OpenAI人事变动:AI安全高管马德里转岗,专注AI推理新领域,作家集体反对番茄小说AI协议,公司回应:已上线解除条款功能入口,橡鹿科技再获京东近 2 亿元战略投资,ElevenLabs推出Turbo 2.5 AI模型:普通话转语音速度飙升3倍,OpenAI发布GPT-4o mini,号称功能最强、成本效益最高的小模型,每秒40 Tokens!商汤绝影开创原生多模态大模型车载新时代,通义千问、GPT-4o 等七款大模型“高考”成绩揭晓:前三名文科破一本线,理科跃二本线,Meta因监管困扰,将不会在欧盟发布新的多模态 AI 模型,中国农大发布“神农大模型2.0”,赋能农业多领域创新,OpenAI“草莓”新项目曝光,AI推理能力迈向更高峰,OpenAI 提出通用人工智能五级标准,自认为即将达到第二级,AI护航,老小安康——用数智构筑家庭守护多重方案,谷歌DeepMind CEO直言:当前 AI 综合智力还不及家猫,微软放弃OpenAI董事会观察员席位,苹果也不会担任类似角色

十堰云电脑,滁州云主机_

【ITBEAR科技资讯】7月26日消息,智谱AI今日宣布对其视频生成模型进行了全面升级,并正式推出了新一代产品——CogVideoX。据悉,CogVideoX模型已在智谱清言的PC端、移动应用端以及小程序端全面上线,所有C端用户均可通过智谱清言的AI视频生成功能“清影”(Ying)免费体验AI文本生成视频和图像生成视频的服务。

据ITBEAR科技资讯了解,CogVideoX的核心技术特点显著。为解决内容连贯性问题,智谱AI自主研发了一套高效的三维变分自编码器结构(3D VAE)。该结构能够将原始视频数据压缩至原始大小的2%,显著降低了视频扩散生成模型的训练成本和难度。同时,结合3D RoPE位置编码模块,该技术在时间维度上提升了帧间关系的捕捉能力,从而建立了视频中的长期依赖关系。

智谱AI新推“清影”工具:30秒生成视频,免费试用!,OpenAI下周推出GPT-4o语音模式,ChatGPT Plus用户将率先体验无缝AI聊天,OpenAI人事变动:AI安全高管马德里转岗,专注AI推理新领域,作家集体反对番茄小说AI协议,公司回应:已上线解除条款功能入口,橡鹿科技再获京东近 2 亿元战略投资,ElevenLabs推出Turbo 2.5 AI模型:普通话转语音速度飙升3倍,OpenAI发布GPT-4o mini,号称功能最强、成本效益最高的小模型,每秒40 Tokens!商汤绝影开创原生多模态大模型车载新时代,通义千问、GPT-4o 等七款大模型“高考”成绩揭晓:前三名文科破一本线,理科跃二本线,Meta因监管困扰,将不会在欧盟发布新的多模态 AI 模型,中国农大发布“神农大模型2.0”,赋能农业多领域创新,OpenAI“草莓”新项目曝光,AI推理能力迈向更高峰,OpenAI 提出通用人工智能五级标准,自认为即将达到第二级,AI护航,老小安康——用数智构筑家庭守护多重方案,谷歌DeepMind CEO直言:当前 AI 综合智力还不及家猫,微软放弃OpenAI董事会观察员席位,苹果也不会担任类似角色

在可控性方面,智谱AI打造了一款端到端的视频理解模型,该模型能够为大量视频数据生成描述,增强了模型对文本的理解和对指令的遵循能力。这一创新确保了生成的视频更加符合用户的输入需求,并能够处理超长且复杂的prompt指令。

此外,CogVideoX模型采纳了一种将文本、时间、空间三维一体融合的transformer架构。该架构摒弃了传统的cross attention模块,设计了Expert Block以实现文本与视频两种不同模态空间的对齐,并通过Full Attention机制优化模态间的交互效果。

“清影”作为智谱AI推出的AI视频生成功能,其主要特点包括快速生成、高效的指令遵循能力、内容连贯性以及画面调度灵活性。用户只需30秒即可完成6秒视频的生成,即使是复杂的prompt,“清影”也能准确理解并执行。同时,生成的视频能够较好地还原物理世界中的运动过程,镜头也能流畅地跟随画面中的主体移动。

智谱大模型开放平台bigmodel.cn也已部署了“清影”。企业和开发者可通过API调用式体验并使用“清影”的文本生成视频和图像生成视频功能。这一举措无疑将进一步推动AI视频生成技术的应用与发展。

© 版权声明

相关文章