时间:2023-12-23|浏览:252
您准备好提高您的品牌知名度了吗? 考虑成为人工智能影响之旅的赞助商。 详细了解这里的机会 。
Stability AI 是一家以 Stable Diffusion 文本到图像生成器而闻名的公司,宣布其新的基础图像到视频模型 Stable Video Diffusion (SVD) 现已在其开发者平台上并通过其应用程序编程接口提供( API),允许第三方开发者将其整合到自己的应用程序、网站、软件和服务中。
该公司写道:“这一新功能提供了对专为各个领域设计的最先进视频模型的编程访问……我们发布此版本的目标是为开发人员提供一种有效的方法,将高级视频生成无缝集成到他们的产品中。”在一篇博客文章中。
虽然该版本可以帮助希望生成 AI 视频的企业,但也可能引起一些担忧,因为 Stability AI 因在 LAION-5B 上训练其模型而受到批评,LAION-5B 是一个开源 AI 数据集,已被发现包含至少 1,008 个视频儿童性虐待材料的实例,因此本周被下线。
尽管如此,对于希望在应用程序中构建生成视频的个人和企业来说,Stability 的新 SVD API 插件确实在质量方面提供了领先的选项之一,提供“2 秒的视频,包括 25 个生成的帧和 24 个生成的帧”。 FILM 插值,平均时间为 41 秒”,Stability AI 在其 LinkedIn 页面上发布的一篇文章称。
对于大型视频活动来说,这可能还不够,但它肯定可以派上用场来制作带有特定消息(包括模因)的 GIF。
VB事件
人工智能影响之旅
制定 AI 治理蓝图 – 请求 1 月 10 日活动的邀请。
了解更多
该产品采用了 Runway 和 Pika Labs 的竞争性视频生成模型,后者最近从 Lightspeed Venture Partners 筹集了 5500 万美元,并推出了一个新的网络平台来生成和编辑视频。
然而,这些产品都没有通过 API 提供视频生成人工智能模型——你需要直接访问它们各自的网站和应用程序才能使用它们,这意味着至少目前,外部开发人员无法真正在其上构建应用程序他们或合并他们。
值得注意的是,Stability 还计划为其视频生成器推出面向用户的网络体验,尽管没有透露何时推出。
该公司正在呼吁用户加入等待名单,成为第一批试用该界面的用户。
首先我们来了解一下稳定视频扩散有什么作用
近一个月前在研究预览中宣布,Stable Video Diffusion 允许用户通过静态图像(包括 JPG 和 PNG)提示来生成 MP4 视频。
根据该公司分享的样本,该模型在制作所需的剪辑方面做得不错,但仍处于初级阶段,只能生成持续长达两秒的短视频。
这甚至比以研究为中心的视频模型生成的四秒剪辑还要短。
当然,多个视频剪辑可以链接在一起形成一个更大的视频。
就稳定性而言,它声称可以在广告、营销、电视、电影和游戏等领域提供帮助。
更有趣的是,与上个月发布的用于探测和反馈的模型不同,最近发布的模型可以生成多种布局和分辨率的视频,包括1024×576、768×768和576×1024。
它还包括运动强度控制和基于种子的控制等附加功能,允许开发人员在可重复生成或随机生成之间进行选择。
尽管存在争议,但稳定仍在继续
虽然 Stable Video Diffusion 的推出确实为企业提供了一种在其产品中构建视频生成功能的简单方法,但这也凸显了 Stability AI 已准备好争夺市场,尽管有些人质疑其训练数据的来源。
就在最近,斯坦福互联网天文台的一份报告发现,免费的 LAION-5B 数据集已用于训练流行的 AI 文本到图像生成器,包括 Stable Diffusion 1.5(由 Runway 发布并由 Stability 支持),包含至少 1,008 起儿童性虐待材料。
出版商 LAION 现已删除该数据集。
甚至在今年早些时候,该公司就在一项集体诉讼中被点名,指控该公司向 LAION 支付费用,以获取“未经许可创建稳定扩散的数十亿受版权图像的副本”。
目前,Stability 的开发者平台 API 提供对所有公司模型的访问,从 Stable Diffusion XL 文本到图像生成器到新的 SVD 模型。
该公司还提供会员资格,帮助客户在本地托管模型。
VentureBeat 的使命
是成为技术决策者获取有关变革性企业技术和交易知识的数字城镇广场。
了解我们的简报。