URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 039/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.039
by Rocket
探索·AI产品
🌐 CAT3D:谷歌推出的多视图扩散模型,实现 3D 内容创造
谷歌在本周的发布中,继 Gemini 之后,又推出了 CAT3D,这是一项能够将任意数量的图像转换成 3D 场景的技术。
- 图像到 3D 场景:CAT3D 能够处理多张图片,并将它们转换成一个立体的 3D 场景。
- 交互式渲染:生成的 3D 场景可以进行交互式渲染,允许用户以更动态的方式探索和编辑场景。
- 快速处理:从视图生成到 3D 重建的整个处理过程非常迅速,总时间可以短至一分钟。
🎨 T2V-NPR:文本或图像到矢量图形的转换技术
T2V-NPR 是一种创新的技术,能够将文本或图像转换成矢量图形(SVG)。
关键特性:
- 文本和图像输入:T2V-NPR 可以接受文本描述或图像作为输入,然后生成相应的矢量图形。
- 细节级别可调:该技术允许用户根据需要调整生成的 SVG 图形的细节级别,提供从简到繁的不同表现。
- 多样风格支持:T2V-NPR 支持多种不同的样式,用户可以根据个人喜好或设计需求选择合适的风格。
- 动画功能:T2V-NPR 还能够根据文本提示对 SVG 图形进行动画处理,使得图形能够表现出动态效果。
T2V-NPR 的推出为设计师和创意工作者提供了一个强大的工具,它不仅可以简化设计流程,还能够激发新的创意表达。这项技术的应用前景广泛,包括但不限于平面设计、网站设计、动画制作等领域。通过 T2V-NPR,用户可以更高效地将创意想法转化为视觉图形,并轻松实现动态展示。
🎉 普通人也能用的类 Sora 视频生成工具:viva 正式发布
海外产品 viva 推出了首个面向所有用户开放的 Sora 同架构视频生成模型,目前阶段免费提供。
主要特性:
- 文本和图片生成视频:支持通过文本描述或图片来生成视频内容。
- 4K 分辨率放大:具备高分辨率视频生成能力。
- 提示词自动优化:能够自动优化生成视频的提示词。
- 视频长度:文生视频可生成最长 5 秒,图生视频 4 秒。
- 运动幅度:据测试,viva 可能是目前运动幅度最大的视频生成模型。
- 图像分辨率:在可用的视频生成产品中,图像分辨率最大。
- 竖屏视频优势:viva 擅长生成高质量的竖屏视频,满足短视频内容的需求。
用户建议:
- 运动幅度调节:建议将运动幅度调节至大约 20,以获得较好的效果。
- 效果比较:文生视频效果优于图生视频。
- 一致性和物理模拟:在一些测试中,一致性保持得不是很好,且没有表现出 Sora 那样强大的物理特性模拟和 3D 一致性。
与竞品比较:
- 与谷歌 Veo 模型对比:在写实内容上,viva 与谷歌刚发布的 Veo 模型表现相近。
演示信息:
- 视频演示:提供了 viva 视频演示,从 15 秒开始,展示了与谷歌 Veo 模型使用相同提示词的对比。
viva 的发布为普通用户带来了易于使用的视频生成工具,尤其适合需要制作短视频内容的用户。尽管在某些方面还有待提高,但其在竖屏视频生成上的优势和免费使用的特点,使其成为一个有吸引力的选择。
📉 Stability AI 考虑出售,2024年Q1亏损超3000万美元
生成式人工智能初创公司 Stability AI 据报道在 2024 年第一季度亏损超过 3000 万美元,目前正考虑出售选项。这一决策反映了公司在财务上的困境,以及在 AI 市场激烈竞争中寻求新的生存和发展策略的迫切需求。
尽管 Stability AI 之前因其创新的 AI 模型受到业界关注,但持续的亏损和资金压力迫使公司探索包括出售在内的多种策略,以期改善其财务状况并找到新的增长路径。