AIDaily 044/100

URL

type

status

date

slug

summary

🖼️

每天都能接收到无数条与AI、科技、艺术、经济相关的信息。但是感觉自己就像那只掰玉米的熊，掰了一路，最后出来发现只剩下手里的两根玉米🌽。今年希望能够以Newsletter的形式，给自己掰下来的玉米们找个背篓。人们会被自己热爱的事物改变，而没有人因为给予而贫穷。

Vol.044

by Rocket

探索·AI大事件

📱 苹果与 OpenAI 达成合作协议，iOS 18 将集成生成式 AI 功能

苹果公司已与 OpenAI 达成协议，将在其即将发布的 iOS 18 系统中引入一系列生成式 AI 功能。这一合作预计将在 WWDC 2024 上正式宣布，届时还将发布改进版的 Siri 语音助手。

关键点：

合作伙伴: 苹果与 OpenAI 合作，计划将 ChatGPT 集成到 iOS 18 中。

WWDC 宣布: 预计在6月份 WWDC 2024 上正式宣布合作伙伴关系。

Siri 改进: 预计 Siri 将获得 AI 功能上的改进。

备选方案: 苹果同时与谷歌谈判，考虑引入 Gemini 作为 AI 功能的备选方案。

这一合作将为 iOS 18 带来一系列新的 AI 功能，标志着苹果在 AI 领域的进一步深入和创新。尽管存在挑战和风险，苹果的这一举措有望推动其在 AI 技术和应用方面的持续发展。

🤖 OpenAI 在 Viva Technology 展示 ChatGPT-4o 与 Sora 结合的多模态演示

在 Viva Technology 活动上，OpenAI 的开发人员体验主管 Romain Huet 展示了一些创新演示，这些演示展示了如何将 ChatGPT-4o 的多模态能力与 Sora 技术相结合。

关键点：

多模态集成：展示了 OpenAI 如何利用 Sora 创建视频内容，并与 ChatGPT 配合生成脚本。

语音合成：使用语音引擎为视频内容添加旁白，增强了视频的表现力。

内容创作：这种技术组合为讲故事和演示文稿提供了无限的可能性，使得内容创作更加丰富和动态。

尽管如此，演示中也指出了当前模型的一些局限性：

观点局限：尽管功能强大，但生成的内容仍然倾向于保持模型通常的、礼貌的和集中化的观点。

这次展示不仅展示了 OpenAI 在多模态 AI 领域的最新进展，也揭示了 AI 技术在创意产业中的潜在应用，尤其是在视频制作和内容创作方面。随着技术的不断进步，我们可以期待 AI 在帮助用户创造更加引人入胜的故事和演示方面发挥更大的作用。同时，这也提示了 AI 技术在发展中需要考虑如何打破局限，提供更多样化和个性化的内容。

探索·AI大模型

🌐 Cohere 推出新的多语言大型语言模型（LLMs）

Cohere 的非营利性研究部门 C4AI 刚刚推出了 Aya 23，这是一系列最先进的多语言大型语言模型，具有开放权重，并支持 23 种不同的语言。

关键点：

Aya 23：包含两个模型，一个 8B 参数模型注重效率和可访问性，另一个 35B 参数的高级模型基于 Command R 架构。

性能提升：Aya 23 在多个基准测试中显著优于前身 Aya 101，也超过了 Google 的 Gemma 和 Mistral 等其他公开竞争对手。

深度专注：这些新模型在 Aya 101 计划的基础上进一步发展，Aya 101 曾覆盖 101 种语言，而 Aya 23 更加注重语言支持的深度。

重要性：

全球影响：随着人工智能的影响力在全球范围内扩散，能否访问顶级模型将成为世界许多地区的关键问题。

民主化访问：通过民主化访问这些最先进的多语言模型，Cohere 迈出了重要一步，确保全球各地的人们都能从人工智能的快速发展中受益。

Cohere 通过推出 Aya 23，不仅展示了其在 AI 技术领域的领导地位，也为全球用户提供了更广泛的语言支持，推动了人工智能技术的普及和应用。这将有助于缩小不同地区在 AI 应用方面的差距，并促进全球范围内的技术交流与合作。

探索·AI产品

📰 OpenAI 与新闻集团签署多年协议，扩大 AI 训练内容来源

OpenAI 已成功与新闻集团（News Corp）签订了一项多年许可协议，根据该协议，OpenAI 将能够使用来自多个知名媒体机构的内容进行人工智能训练。

关键信息：

合作伙伴：新闻集团是一家全球领先的媒体和信息服务公司，旗下包括《华尔街日报》（The Wall Street Journal）、《纽约邮报》（The New York Post）、MarketWatch 和《巴伦周刊》（Barron’s）等。

内容许可：OpenAI 通过这项协议获得了这些媒体的大量内容使用权，这些内容将用于训练和改进其 AI 模型。

AI 训练：AI 模型的训练需要大量的数据，而新闻集团提供的内容将丰富 OpenAI 的数据资源，帮助提升 AI 在理解和生成语言方面的能力。

这项协议的签订对 OpenAI 来说是一个重要的里程碑，因为它不仅确保了高质量内容的稳定供应，还有助于提高其 AI 技术的准确性和可靠性。同时，这也体现了新闻集团对 AI 技术发展的支持和信心，以及对内容创新和分发方式的积极探索。

通过与新闻集团的合作，OpenAI 将能够进一步推动其 AI 技术的发展，为用户提供更准确、更丰富的信息和服务。这一合作也可能为媒体行业带来新的变革，特别是在内容创作、分发和交互方面。

💡 AI PC 预计到 2028 年将占据市场 65%：摩根士丹利 根据摩根士丹利的深度报告，预计到 2028 年，AI 个人电脑(PC)将占据市场 65% 的份额。微软在上周推出了其 AI 就绪的 PC，这标志着一个新时代的开始，并可能引发商业 PC 的更新换代。

关键点：

市场份额预测：摩根士丹利预测，AI PC 将迅速增长，到 2028 年将占据个人电脑市场的主要部分。

微软的引领作用：微软通过推出 AI 就绪的 PC，为行业树立了标杆，预计将引领一波商业 PC 的更新潮。

商业市场先行：报告认为，商业 PC 市场将是 AI 技术的初期采用者，这可能是因为企业用户更倾向于采用先进技术以提高生产力和效率。

技术革新：AI PC 的推出代表了个人电脑技术的一次重大革新，它将为用户提供更强大的计算能力和智能化的功能。

摩根士丹利的这一预测突显了 AI 技术在个人电脑领域的快速发展和广泛应用前景。随着 AI 技术的不断进步，未来的个人电脑将更加智能，能够更好地理解和预测用户需求，提供个性化的服务和体验。这不仅将改变个人用户的计算习惯，也将对商业和工业应用产生深远影响。

探索·AI融资

🚀 xAI 接近完成 6.5 亿美元融资，估值可能超 240 亿美元

据报道，埃隆·马斯克的人工智能公司 xAI 即将完成一轮价值 6.5 亿美元的融资。此轮融资得到了包括 a16z、Lightspeed、Sequoia 和 Tribe 在内的风险投资公司的强力支持，这可能会使公司的估值超过 240 亿美元。

这笔资金的注入将为 xAI 提供更多的资源来推动其在人工智能领域的研究和发展，同时也反映了市场对其技术和未来潜力的高度认可。xAI 致力于开发先进的人工智能技术，旨在创建一个更加智能和互联的世界。

此轮融资的成功不仅将增强 xAI 在竞争激烈的 AI 市场中的地位，也可能加速其产品开发和市场扩张计划。随着人工智能技术的不断进步和应用，xAI 有望在塑造未来技术格局中发挥重要作用。

探索·AI开源

🎥 ViViD：革新的视频虚拟试妆技术

ViViD 是一项突破性的视频虚拟试妆技术，它能够将服装项目转移到目标人物的视频上。

关键特点：

服装细节捕捉：ViViD 技术能够精确捕捉服装的纹理、颜色和样式细节。

人体姿势识别：该技术还能够识别和适应目标人物的人体姿势，确保服装在视频中的自然展示。

连贯逼真视频：通过结合服装细节和人体姿势，ViViD 能够生成既连贯又逼真的视频效果。

🤲 Semantic Gesticulator：先进的语义感知手势合成技术

Semantic Gesticulator 是一项创新技术，能够生成与语音同步的逼真手势，这些手势与所传达的语义内容高度对应，对有效沟通极为重要。

关键特点：

语义感知：该技术能够理解和分析语音中的语义内容，并据此生成相应的手势。

共同语音手势合成：Semantic Gesticulator 不仅生成手势，而且确保这些手势与语音同步，增强了交流的自然性和表现力。

逼真手势：生成的手势接近真实人类在交流中使用的手势，提高了交互的真实感和亲切感。

Semantic Gesticulator 的应用示例展示了该技术在模拟真实沟通场景中的潜力，它可以广泛应用于虚拟助手、教育软件、视频会议平台等多个领域，提升用户体验，使人工智能的交互更加自然和富有表现力。

🎭 NOVA-3D：3D 动漫角色重建的创新技术

NOVA-3D 是一项突破性的技术，极大地简化了3D动漫角色的创建过程，它能够利用非重叠的正面和背面视图来生成三维动漫角色。

关键特点：

非重叠视图：NOVA-3D 技术通过分析角色的正面和背面视图，即使这些视图不重叠，也能构建出完整的三维模型。

3D 动漫角色生成：这项技术为动漫爱好者和专业人士提供了一个强大的工具，可以轻松地从二维图像创建出三维角色模型。

AIDaily 044/100

Vol.044

Rocket

AIGC创作者社区

加入智否AIFunr社区讨论分享