URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 024/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.024
by Rocket
🗣️ 微软VASA-1让静态照片动起来
微软刚刚推出了VASA-1,这是一个新的AI模型,能够从单个静态图像和音频剪辑生成极其逼真的头部说话视频。
主要细节包括:
- VASA-1只需使用一张照片和一个语音音频文件,就能创建出具有同步嘴部动作和情感动画的主题真实谈话视频。
- 该模型能够生成细腻的表情、自然的头部动作,甚至是逼真的歌唱表演,超越了简单的唇形同步。
- 用户可以使用输入滑块来控制生成视频的各个方面,如眼睛注视方向、头部距离和情绪基调。
重要性:
- VASA-1代表了技术上的一大飞跃,在虚拟化身、游戏和计算机动画等领域具有潜在的应用前景。
- 尽管这只是一个研究演示,但生成极其逼真的深度伪造视频的能力已经显现,这在即将到来的选举和不良行为者的更广泛采用方面具有重大影响。
VASA-1的发布展示了AI在视频生成领域的最新进展,同时也引发了关于深度伪造技术可能被滥用的担忧。随着这类技术的不断发展,社会需要对如何安全、负责任地使用AI进行深入讨论,并制定相应的规范和法律。
🛠️ 谷歌重组以加强AI产品开发
谷歌宣布了一项重组计划,旨在加强其人工智能产品的研发能力。作为重组的一部分,谷歌将创建一个新的“平台和设备”团队,并将研究团队与DeepMind团队合并。这一举措预计将促进谷歌在AI领域的创新和产品开发,通过整合资源和专业知识,提高研发效率。
DeepMind作为谷歌旗下的AI研究实验室,以其在深度学习和强化学习等领域的突破性工作而闻名。通过与谷歌的研究团队合并,DeepMind可能会获得更多的资源和支持,同时谷歌的研究团队也将受益于DeepMind的先进技术和研究成果。
这次重组反映了谷歌对AI技术长期投资的承诺,以及其在推动AI技术发展和应用方面所扮演的角色。通过优化组织结构
📉 Stability AI 裁员10%调整业务规模
AI初创公司Stability AI在前CEO Emad Mostaque离职后宣布裁员10%,旨在调整业务规模。公司在全球约有200名员工,裁员数量约20人。此举意在降低成本、加强与投资者和合作伙伴的支持,并推动团队继续开发创新产品。Stability AI还面临人员流动问题和侵权诉讼挑战,核心研发团队此前已集体辞职。尽管困难重重,公司仍致力于应对当前挑战。
🎬 人工智能正在改变我们制作和观看电影的方式
最近,Netflix的新真实犯罪纪录片《詹妮弗做了什么》中的照片引起了观众的注意,因为其中的主角耳朵和牙齿不匹配,书架上的物品也显得模糊不清。不久之后,人们意识到这些照片很可能是用人工智能生成或编辑的。
人工智能迅速渗透到电影和电视节目的制作中,例如:
- A24 据称使用 AI 生成的电影海报来宣传其新大片《内战》。
- 恐怖电影《深夜与恶魔》因使用 AI 生成的转场序列而受到负面评论。
- 电视制造商 TCL 将推出新的流媒体服务,其中包括“第一部 AI 生成的浪漫喜剧”。
- 制片厂使用 AI 对老电影进行 4K 修复,但有些观众对此表示不满,认为这给电影增添了一种不自然的塑料感。
电影制片人正在考虑如何合乎道德地使用 AI。档案制片人联盟(Archival Producers Alliance)起草了一套指导方针和最佳实践来解决这个问题。该联盟希望导演们在使用 AI 时保持透明,并从可能受到影响的任何人那里获得同意。
今年晚些时候,当 OpenAI 的文本转视频工具 Sora 向公众发布时,这些问题将变得尤为重要。随着 AI 技术的发展,电影和电视行业将面临新的挑战和机遇,同时也需要制定新的标准和规范来指导 AI 的使用。
🎮 Video2Game:将视频转换为实时交互式游戏环境
Video2Game是一项创新技术,能够将现实世界场景的视频自动转换成逼真且交互式的游戏环境。这意味着用户可以利用现有的视频素材,通过Video2Game的技术,快速创建出可以在浏览器上运行的游戏环境。
这项技术的应用潜力巨大,无论是游戏开发者、教育工作者还是娱乐内容创作者,都可以利用Video2Game将视频内容转化为互动体验。这不仅为视频内容提供了新的利用方式,也为游戏创作开辟了新的可能性。
用户可以访问Video2Game提供的演示游戏,体验这种从视频到游戏环境转换的效果,并探索其在不同领域的应用前景。这一技术的发展可能会对游戏开发和互动媒体产生深远影响,使得高质量的游戏内容创作变得更加便捷和可访问。
🎨 Leonardo.Ai 推出 Style Reference:创新风格参考工具
Leonardo.Ai 很高兴推出了 Style Reference,这是一款强大且多功能的工具,旨在改变创意过程。用户可以使用任何图像作为风格参考,将其气氛、颜色和视觉主题融入新的创作中。
主要特点包括:
- 变换:用户可以轻松地将另一张图像的风格应用到新一代图像上。
- 自定义:通过简单的设置调整风格效果的强度,从微妙的情绪滤镜到最接近原始风格的高强度效果。
- 效率:使用任何图像作为风格参考,加快工作流程,提供实现所需输出的简化方法。
- 多功能性:适用于需要风格一致性的多种创意应用,包括时尚、室内设计、叙事讲述和营销视觉。
Style Reference 是叙事者寻求主题一致性和营销专业人士希望保持视觉主题的理想工具,它通过提供一致的风格,增强了创意工作的连贯性和专业性。
🚀 Adobe 发布 MeshLRM,快速生成高质量网格
Adobe 升级了其 LRM 模型,推出了 MeshLRM,支持高质量的网格重建。该技术需要四个输入图像,并能在不到一秒的时间内生成网格,同时支持文本到3D和单图像到3D的转换,通过首先生成四个基础图像来实现。