URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 044/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.044
by Rocket
探索·AI大事件
📱 苹果与 OpenAI 达成合作协议,iOS 18 将集成生成式 AI 功能
苹果公司已与 OpenAI 达成协议,将在其即将发布的 iOS 18 系统中引入一系列生成式 AI 功能。这一合作预计将在 WWDC 2024 上正式宣布,届时还将发布改进版的 Siri 语音助手。
关键点:
- 合作伙伴: 苹果与 OpenAI 合作,计划将 ChatGPT 集成到 iOS 18 中。
- WWDC 宣布: 预计在6月份 WWDC 2024 上正式宣布合作伙伴关系。
- Siri 改进: 预计 Siri 将获得 AI 功能上的改进。
- 备选方案: 苹果同时与谷歌谈判,考虑引入 Gemini 作为 AI 功能的备选方案。
这一合作将为 iOS 18 带来一系列新的 AI 功能,标志着苹果在 AI 领域的进一步深入和创新。尽管存在挑战和风险,苹果的这一举措有望推动其在 AI 技术和应用方面的持续发展。
🤖 OpenAI 在 Viva Technology 展示 ChatGPT-4o 与 Sora 结合的多模态演示
在 Viva Technology 活动上,OpenAI 的开发人员体验主管 Romain Huet 展示了一些创新演示,这些演示展示了如何将 ChatGPT-4o 的多模态能力与 Sora 技术相结合。
关键点:
- 多模态集成:展示了 OpenAI 如何利用 Sora 创建视频内容,并与 ChatGPT 配合生成脚本。
- 语音合成:使用语音引擎为视频内容添加旁白,增强了视频的表现力。
- 内容创作:这种技术组合为讲故事和演示文稿提供了无限的可能性,使得内容创作更加丰富和动态。
尽管如此,演示中也指出了当前模型的一些局限性:
- 观点局限:尽管功能强大,但生成的内容仍然倾向于保持模型通常的、礼貌的和集中化的观点。
这次展示不仅展示了 OpenAI 在多模态 AI 领域的最新进展,也揭示了 AI 技术在创意产业中的潜在应用,尤其是在视频制作和内容创作方面。随着技术的不断进步,我们可以期待 AI 在帮助用户创造更加引人入胜的故事和演示方面发挥更大的作用。同时,这也提示了 AI 技术在发展中需要考虑如何打破局限,提供更多样化和个性化的内容。
探索·AI大模型
🌐 Cohere 推出新的多语言大型语言模型(LLMs)
Cohere 的非营利性研究部门 C4AI 刚刚推出了 Aya 23,这是一系列最先进的多语言大型语言模型,具有开放权重,并支持 23 种不同的语言。
关键点:
- Aya 23:包含两个模型,一个 8B 参数模型注重效率和可访问性,另一个 35B 参数的高级模型基于 Command R 架构。
- 性能提升:Aya 23 在多个基准测试中显著优于前身 Aya 101,也超过了 Google 的 Gemma 和 Mistral 等其他公开竞争对手。
- 深度专注:这些新模型在 Aya 101 计划的基础上进一步发展,Aya 101 曾覆盖 101 种语言,而 Aya 23 更加注重语言支持的深度。
重要性:
- 全球影响:随着人工智能的影响力在全球范围内扩散,能否访问顶级模型将成为世界许多地区的关键问题。
- 民主化访问:通过民主化访问这些最先进的多语言模型,Cohere 迈出了重要一步,确保全球各地的人们都能从人工智能的快速发展中受益。
Cohere 通过推出 Aya 23,不仅展示了其在 AI 技术领域的领导地位,也为全球用户提供了更广泛的语言支持,推动了人工智能技术的普及和应用。这将有助于缩小不同地区在 AI 应用方面的差距,并促进全球范围内的技术交流与合作。
探索·AI产品
📰 OpenAI 与新闻集团签署多年协议,扩大 AI 训练内容来源
OpenAI 已成功与新闻集团(News Corp)签订了一项多年许可协议,根据该协议,OpenAI 将能够使用来自多个知名媒体机构的内容进行人工智能训练。
关键信息:
- 合作伙伴:新闻集团是一家全球领先的媒体和信息服务公司,旗下包括《华尔街日报》(The Wall Street Journal)、《纽约邮报》(The New York Post)、MarketWatch 和《巴伦周刊》(Barron’s)等。
- 内容许可:OpenAI 通过这项协议获得了这些媒体的大量内容使用权,这些内容将用于训练和改进其 AI 模型。
- AI 训练:AI 模型的训练需要大量的数据,而新闻集团提供的内容将丰富 OpenAI 的数据资源,帮助提升 AI 在理解和生成语言方面的能力。
这项协议的签订对 OpenAI 来说是一个重要的里程碑,因为它不仅确保了高质量内容的稳定供应,还有助于提高其 AI 技术的准确性和可靠性。同时,这也体现了新闻集团对 AI 技术发展的支持和信心,以及对内容创新和分发方式的积极探索。
通过与新闻集团的合作,OpenAI 将能够进一步推动其 AI 技术的发展,为用户提供更准确、更丰富的信息和服务。这一合作也可能为媒体行业带来新的变革,特别是在内容创作、分发和交互方面。
💡 AI PC 预计到 2028 年将占据市场 65%:摩根士丹利
根据摩根士丹利的深度报告,预计到 2028 年,AI 个人电脑(PC)将占据市场 65% 的份额。微软在上周推出了其 AI 就绪的 PC,这标志着一个新时代的开始,并可能引发商业 PC 的更新换代。
关键点:
- 市场份额预测:摩根士丹利预测,AI PC 将迅速增长,到 2028 年将占据个人电脑市场的主要部分。
- 微软的引领作用:微软通过推出 AI 就绪的 PC,为行业树立了标杆,预计将引领一波商业 PC 的更新潮。
- 商业市场先行:报告认为,商业 PC 市场将是 AI 技术的初期采用者,这可能是因为企业用户更倾向于采用先进技术以提高生产力和效率。
- 技术革新:AI PC 的推出代表了个人电脑技术的一次重大革新,它将为用户提供更强大的计算能力和智能化的功能。
摩根士丹利的这一预测突显了 AI 技术在个人电脑领域的快速发展和广泛应用前景。随着 AI 技术的不断进步,未来的个人电脑将更加智能,能够更好地理解和预测用户需求,提供个性化的服务和体验。这不仅将改变个人用户的计算习惯,也将对商业和工业应用产生深远影响。
探索·AI融资
🚀 xAI 接近完成 6.5 亿美元融资,估值可能超 240 亿美元
据报道,埃隆·马斯克的人工智能公司 xAI 即将完成一轮价值 6.5 亿美元的融资。此轮融资得到了包括 a16z、Lightspeed、Sequoia 和 Tribe 在内的风险投资公司的强力支持,这可能会使公司的估值超过 240 亿美元。
这笔资金的注入将为 xAI 提供更多的资源来推动其在人工智能领域的研究和发展,同时也反映了市场对其技术和未来潜力的高度认可。xAI 致力于开发先进的人工智能技术,旨在创建一个更加智能和互联的世界。
此轮融资的成功不仅将增强 xAI 在竞争激烈的 AI 市场中的地位,也可能加速其产品开发和市场扩张计划。随着人工智能技术的不断进步和应用,xAI 有望在塑造未来技术格局中发挥重要作用。
探索·AI开源
🎥 ViViD:革新的视频虚拟试妆技术
ViViD 是一项突破性的视频虚拟试妆技术,它能够将服装项目转移到目标人物的视频上。
关键特点:
- 服装细节捕捉:ViViD 技术能够精确捕捉服装的纹理、颜色和样式细节。
- 人体姿势识别:该技术还能够识别和适应目标人物的人体姿势,确保服装在视频中的自然展示。
- 连贯逼真视频:通过结合服装细节和人体姿势,ViViD 能够生成既连贯又逼真的视频效果。
🤲 Semantic Gesticulator:先进的语义感知手势合成技术
Semantic Gesticulator 是一项创新技术,能够生成与语音同步的逼真手势,这些手势与所传达的语义内容高度对应,对有效沟通极为重要。
关键特点:
- 语义感知:该技术能够理解和分析语音中的语义内容,并据此生成相应的手势。
- 共同语音手势合成:Semantic Gesticulator 不仅生成手势,而且确保这些手势与语音同步,增强了交流的自然性和表现力。
- 逼真手势:生成的手势接近真实人类在交流中使用的手势,提高了交互的真实感和亲切感。
Semantic Gesticulator 的应用示例展示了该技术在模拟真实沟通场景中的潜力,它可以广泛应用于虚拟助手、教育软件、视频会议平台等多个领域,提升用户体验,使人工智能的交互更加自然和富有表现力。
🎭 NOVA-3D:3D 动漫角色重建的创新技术
NOVA-3D 是一项突破性的技术,极大地简化了3D动漫角色的创建过程,它能够利用非重叠的正面和背面视图来生成三维动漫角色。
关键特点:
- 非重叠视图:NOVA-3D 技术通过分析角色的正面和背面视图,即使这些视图不重叠,也能构建出完整的三维模型。
- 3D 动漫角色生成:这项技术为动漫爱好者和专业人士提供了一个强大的工具,可以轻松地从二维图像创建出三维角色模型。