AI Daily
🗒️AIDaily 078/100 OpenAI超级碗首秀,字节发布Goku广告模型、艺术家抵制佳士得AI拍卖、Anthropic经济指数发布…
00 分钟
2025-2-11
2025-2-12
/* */
URL
type
status
date
slug
summary
tags
category
icon
password

AIDaily 078/100

🖼️
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。 但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。 今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。 人们会被自己热爱的事物改变,而没有人因为给予而贫穷。

Vol.078

by Rocket

探索·AI产品

飞书多维表格接入DeepSeek R1模型,功能强大且实用

飞书多维表格已正式接入DeepSeek R1模型,这一集成极大地提升了其在数据处理与分析上的智能化水平。用户现在可以在多维表格的AI字段捷径中直接调用DeepSeek R1模型,实现以下功能:
  1. 论文解读与扩展:用户可以上传PDF文件,DeepSeek R1能够自动分析论文的关键信息,包括优点和不足,并生成社交媒体的发布文案。
  1. 虚拟数字人视频生成:支持直接生成虚拟数字人视频,适用于广告视频生成。
  1. 产品展示视频生成:可以从产品图片生成人物互动视频,保持产品样式。
  1. 批量处理任务:用户可以在多维表格中一次性输入多个提示词,实现批量处理任务,无需逐个调用API。
 

Google DeepMind推出AlphaGeometry2:在IMO几何问题上超越金牌得主

Google DeepMind的AlphaGeometry2在解决国际数学奥林匹克竞赛(IMO)几何问题方面取得了重大突破,其表现超过了平均金牌得主。
  • 性能提升:AlphaGeometry2解决了过去25年IMO中84%的几何问题,显著高于其前身AlphaGeometry1的54%解题率。
  • 技术细节:该系统结合了谷歌Gemini系列的语言模型和符号引擎,通过神经符号混合方法解决复杂的几何问题。
  • 训练数据:为了解决几何问题,DeepMind为AlphaGeometry2生成了超过3亿个不同复杂度的合成定理和证明。
 

Perplexity AI推出“百万美元问题”抽奖活动

Perplexity AI宣布将在2025年2月9日超级碗期间举办“百万美元问题”抽奖活动。参与者需要在比赛期间通过Perplexity应用程序向AI提问,以获得抽奖资格。具体参与条件包括:
  • 必须是18岁及以上的美国居民。
  • 需要下载Perplexity移动应用,并在比赛期间(太平洋时间下午3点至晚上7点半)至少向AI提问5个问题。
  • 每人最多可获得5次抽奖机会。活动结束后,将在比赛结束后约1小时内随机抽取获奖者。
 

🏈 OpenAI超级碗首秀:用动画点讲述人类发明史

OpenAI在2025年超级碗上发布了首条电视广告,这是其首次大规模的付费广告活动,该广告时长为60秒,投放成本约为1400万美元。
  • 创意呈现:广告通过独特的点画风格动画,展示了人类技术的进化,从早期的火和轮子到现代的DNA测序和太空探索,最终聚焦于ChatGPT处理日常任务的能力,创意源自ChatGPT的光标点。
  • 聚焦应用:广告未过度宣传AI能力,而是聚焦于其实际应用,避免引发争议。
 
 
探索·AI开源

字节跳动发布Goku和Goku+视频生成模型

字节跳动与香港大学联合发布了名为Goku的视频生成模型,以及其广告视频生成的扩展版本Goku+。这些模型能够根据文本提示生成高质量的视频内容,支持多种生成任务,包括文本到视频、图像到视频、文本到图像等。

Goku模型特点

  • 高质量视频生成:Goku能够生成包括动画、自然风光、动物行为等多种场景的视频,效果生动真实。
  • 虚拟数字人视频:支持直接生成虚拟数字人视频,Goku+将文本转换为超现实的人类视频,具有稳定的手部动作和丰富的面部及身体动作。
  • 产品展示视频:可以从产品图片生成人物互动视频,保持产品样式,适用于广告视频生成。
  • 广告视频生成:Goku+专注于广告场景,能够根据文本描述生成高质量的广告视频,支持人物与产品的自然互动,显著降低制作成本。

技术细节

  • 数据集:Goku团队构建了包含3600万视频和1.6亿图像的数据集,通过多种技术严格筛选数据质量。
  • 架构:基于Rectified Flow Transformer框架,支持多模态训练,能够处理复杂的时空依赖关系。
  • 性能:在多个视频生成基准测试中表现优异,特别是在VBench测试中,Goku-T2V模型以84.85分获得第二名。

应用场景

  • 广告视频制作:Goku+能够根据文本描述生成高质量的广告视频,支持从文本直接生成视频、从产品图片生成人物互动视频,以及生成产品展示视频。
  • 虚拟数字人视频生成:Goku+可以将文本转换为超现实的人类视频,生成超过20秒的视频,具有稳定的手部动作和丰富的面部及身体动作。
  • 内容创作:Goku能生成多种场景的视频,为艺术创作者提供丰富的灵感和创作素材。
  • 教育与培训:可用于制作教育视频和培训课程,提高教育培训的效果和趣味性。
  • 娱乐产业:在电影、电视剧、动画等娱乐产业中,Goku可用于内容制作和特效生成。

项目资源

 

cursor-tools增强Cursor Agent的能力

cursor-tools是一个强大的扩展工具集,旨在显著增强Cursor Agent的能力。
notion image
  • 网页搜索功能:通过Perplexity AI,cursor-tools为Cursor提供了网页搜索功能,帮助开发者快速获取最新信息。
  • 大规模代码库分析:支持使用Gemini 2.0进行大规模代码库分析,提升代码理解和生成的效率。
  • 浏览器自动化:cursor-tools支持浏览器自动化操作,包括打开网页、执行操作、观察交互元素和提取数据等。
  • GitHub Issues和Pull Requests支持:cursor-tools允许AI编码助手直接从命令行访问和处理GitHub Issues和Pull Requests。
 
探索·AI版权

🎨 超过2000名艺术家联名抵制佳士得AI艺术拍卖

佳士得即将举办的“增强情报”AI艺术拍卖会引发了广泛争议:
  • 版权争议:艺术家指责AI模型在训练中使用了受版权保护的作品,未经艺术家授权。
  • 公开信:超过2800名艺术家签署公开信,要求佳士得取消此次拍卖。
  • 拍卖背景:此次拍卖会计划于2月20日开始,展出现场作画机器人等作品。
  • 佳士得回应:拍卖行表示,参与拍卖的艺术家作品使用AI是为了增强创作,且数据训练基于艺术家自身的输入。
  • 艺术家态度:部分艺术家对AI在艺术创作中的应用持开放态度,但许多传统艺术家担心其权益受损。
此次事件凸显了AI技术在艺术领域应用中的版权和伦理问题,引发了艺术界对AI创作与传统艺术创作之间界限的深刻思考。
 
探索·新研究

🌐 OpenAI高管在东京大学探讨AI未来

OpenAI首席执行官Sam Altman和首席产品官Kevin Weil在东京大学全球教育中心发表演讲,回答了关于AI未来、GPT-5等新模型以及Stargate项目等问题。
  • Stargate项目:Altman表示,价值5000亿美元的Stargate项目将使下一代模型能够开发出首批“科学知识的新位”。
  • 模型能力:OpenAI的内部模型目前是全球第50大程序员,预计到今年年底可能达到第1名。
  • 开源方向:Altman认为OpenAI将朝着开源方向发展,因为社会愿意接受开放模型带来的权衡。
  • AI能力提升:Altman将AI能力的提升比作“试图超越计算器”,认为AI将在每个通用领域超越人类。
 

📈 Anthropic发布“Anthropic经济指数”:AI使用模式深度分析

Anthropic通过分析Claude上的数百万条匿名聊天记录,发布了“Anthropic经济指数”,揭示了AI在不同职业中的使用模式:
  • 职业分布:在22个职业类别中,“计算机与数学”占比最高(37.2%),而“办公室与行政支持”在劳动力市场中占比最高(12.2%)。渔业、林业在两个维度中的占比都最低(0.3%与0.1%)。
  • 薪资与AI使用:AI使用集中在中等至中高收入群体,低收入和高收入职业的AI使用率较低。
  • 增强与自动化:AI使用更偏向“增强”(57%),即与人类协同完成任务,而非“自动化”(43%),即AI直接执行任务。
  • 使用深度:仅4%的职业在超过75%的任务中使用AI,但36%的职业在至少25%的任务中使用AI,说明中等程度的使用更为普遍。
Anthropic还开源了数据集,供研究人员进一步分析。
 

AI技术的快速进步:五年内基准测试的显著提升

Jason Wei发布的图表展示了过去五年AI技术在各种基准测试中的快速进步,直观地反映了AI能力的显著提升。
notion image
  • 基准测试(Benchmark)
    • 定义:基准测试是评估AI能力的一种方法,通过让AI回答问题或完成任务并打分,类似于学校的考试。
    • 类型
      • 常识问答:如TriviaQA,测试AI对琐事或常识性问题的回答能力。
      • 多科目知识:如MMLU,测试AI在不同科目上的知识水平。
      • 基础数学:如GSM8K,测试AI解决小学或基础数学问题的能力。
      • 高级理工科考试:如MATH、AIME、GPQA等,测试AI在更专业、难度更高的数学和理工科问题上的表现。
      • “人类的最终考试”:假设性的“终极测试”,代表AI面临的极具挑战性的重要考试。
  • 测试结果:图表中的每条彩色线代表一种特定的AI测试,展示了AI在这些测试中的表现随时间的快速提升。
  • 技术进步:AI技术在短短几年内不断更新升级,准确率不断提高,甚至超过人类平均水平或接近满分。
  • 行业影响
    • 学习能力:AI的学习和推理能力正在以惊人的速度提升。
    • 复杂任务处理:AI在处理复杂任务方面的能力也在迅速增强。
    • 未来展望:AI的快速进步预示着未来可能在更多领域超越人类,带来深远的变革。
这张图表不仅展示了AI技术的快速进步,也提醒我们AI的发展速度可能远超我们的预期。未来,AI可能会在更多领域实现突破,带来更多的可能性和挑战。
 
探索·AI人员变动

Ilya Sutskever的Safe Superintelligence寻求200亿美元估值融资

Safe Superintelligence(SSI)由OpenAI前首席科学家Ilya Sutskever于2024年6月创立,目标是开发具有“超级智能”的AI模型,并防止有害输出。
  • 融资情况:SSI正在与投资者洽谈,计划以至少200亿美元的估值进行融资。这将是该公司继2024年9月以50亿美元估值完成10亿美元融资后的又一轮重大融资。
  • 技术方向:SSI专注于开发安全的超级智能AI模型,其技术路线与现有AI开发方法不同,旨在探索新的研究方向。
  • 团队构成:SSI的创始团队还包括前OpenAI研究员Daniel Levy和前Y Combinator合伙人Daniel Gross,后者曾领导苹果公司的AI开发工作。
 
 
【🚀 精选内容】
❤ 如果对你有帮助,欢迎分享或者Buy Me A Coffee ❤
 
💡
对这个话题感兴趣的小伙伴,欢迎加我一起探索交流~
 
notion image
 
 
 
 
 
 
上一篇
AIDaily 079/100 苹果与阿里巴巴合作、Perplexity发布Sonar模型、OpenAI自研芯片、苹果AI台灯、马斯克收购OpenAI被拒、Anthropic融资、巴黎AI峰会…
下一篇
AIDaily 077/100 ElevenLabs Studio开放使用、OpenAI Canvas开放共享、Pika Labs Pikadditions发布、OpenAI超级碗广告、Mistral Le Chat移动应用发布…