URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 051/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.051
by Rocket
探索·AI大事件
📱 Apple 在 WWDC 2024 上的重大宣布
在 WWDC 2024 主题演讲中,Apple 宣布了一系列备受期待的更新,包括 Apple Intelligence 的推出和 Siri 的重大改版。
Apple Intelligence:Apple 的新 AI 功能,旨在提供个性化体验,强调安全性和隐私保护。
Siri 改版:Siri 将集成 ChatGPT,由 OpenAI 的 GPT-4 支持,带来更自然和个性化的交互体验。
与 OpenAI 合作:Apple 确认将与 OpenAI 以外的其他 AI 合作伙伴合作,如 Google 的 Gemini 模型。
设备兼容性:Apple Intelligence 将仅适用于 iPhone 15 Pro、15 Pro Max 以及搭载 M1 或更新芯片的 iPad 和 Mac。
iOS 18:新操作系统将带来更自由的应用图标和小部件布局,以及新的暗模式图标。
Vision Pro 更新:包括新的空间照片功能,以及 Vision Pro 头戴设备在八个新国家的上市。
macOS Sequoia:最新的 macOS 版本,引入 iPhone 镜像功能,允许用户通过 Mac 控制 iPhone。
Tap to Cash:新功能,允许用户通过将两部 iPhone 碰在一起进行付款,扩展了 Apple Pay 的 Tap to Pay 功能。
照片应用更新:引入新的导航和组织功能,使查找和分享照片更加容易。
Passwords 应用:新的 Passwords 应用,改进了 iCloud 账户上存储和同步密码的体验。
iPad 的 Smart Script:使用 Apple Pencil 时,Notes 应用中的新功能,通过机器学习改善手写笔记的外观。
计算器应用:iPad 的计算器应用得到了更新,增加了数学笔记功能。
卫星消息:类似紧急 SOS 功能,允许用户在没有信号的情况下通过卫星发送消息。
开发者工具:Apple 还为开发者提供了将 Apple Intelligence 体验集成到他们软件中的工具和 SDK。
Apple 在 WWDC 2024 上的宣布表明了公司在 AI 和个性化体验方面的雄心,同时也展示了其在软件和硬件上的持续创新。随着这些新功能的推出,用户可以期待更加智能和互联的 Apple 生态系统。
探索·AI开源
👥 MultiPly:单目视频中的多人3D重建
MultiPly 是一项技术,它能够从野外单目视频中对多个人物进行三维重建。
关键特点:
- 3D重建:MultiPly 能够将单目视频中的人物以三维形式重建出来。
- 处理遮挡:该技术能够处理视频中的人物遮挡问题,即使在视线受限的情况下也能进行准确重建。
- 互动识别:MultiPly 能够识别并处理人物之间的互动,使得重建结果更加自然和真实。
- 野外视频适用:该方法适用于在自然环境中拍摄的视频,显示出它在现实世界应用中的潜力。
MultiPly 的推出为视频分析和人物动态捕捉领域带来了新的技术突破,它可以广泛应用于电影制作、游戏开发、虚拟现实和增强现实等领域,为这些行业提供更加高效和精确的人物建模解决方案。随着技术的不断进步,我们可以期待看到更多创新的应用出现,进一步丰富我们的视听体验。
📹 StreamV2V:实时视频翻译的新方法
StreamV2V 是一种创新的视频到视频转换方法,具备以下特点:
- 实时翻译:能够在用户提示下对视频进行实时翻译,适用于多种视频编辑和处理场景。
- 高效性能:在单个 A100 GPU 上以每秒 20 帧(FPS)的速度运行,确保了流畅的视频处理体验。
- 时间一致性:该方法能够保持视频帧之间的时间一致性,避免在视频转换过程中出现跳跃或不连贯的现象。
- 文本到图像流式传输:除了视频翻译,StreamV2V 同样适用于文本到图像的流式传输任务,增加了其应用的多样性。
StreamV2V 的推出为视频内容创作者和编辑者提供了一个强大的工具,使得视频处理更加高效和便捷。随着技术的进步,实时视频翻译和流式传输的能力将在视频制作、直播、监控等领域发挥重要作用。
探索·AI数据
📈 AI模型训练成本呈指数级增长
- 早期成本:最初训练成为现代AI模型基础的transformer模型的成本不到一台中端笔记本电脑的价格,仅需930美元。
- 近年来成本:自2017年以来,训练成本急剧上升。例如,2023年训练Gemini Ultra的成本超过1.91亿美元,而GPT-4的成本超过7800万美元。
- 成本对比:相比之下,Meta的Llama-2模型训练成本相对较低,不到400万美元。
- 未来预测:机器学习科学家Nathan Lambert估计,Llama-2的继任者训练成本可能接近1亿美元,而Llama 4可能超过10亿美元。
- 大型科技公司:这样的成本水平意味着只有大型科技公司,如Meta,才有可能承担得起先进的AI模型训练成本。
- GPT-5成本预测:根据一些估计,训练下一代模型GPT-5的成本可能高达25亿美元。
这一成本增长凸显了AI领域内研发投入的显著增加,同时也反映了技术进步和模型规模扩大对资源需求的影响。随着AI技术的发展,未来模型训练的成本可能会继续上升,这可能会对行业格局和研究方向产生重要影响。
对这个话题感兴趣的小伙伴,欢迎加我一起探索交流~
