AI Daily
🗒️AIDaily 077/100 ElevenLabs Studio开放使用、OpenAI Canvas开放共享、Pika Labs Pikadditions发布、OpenAI超级碗广告、Mistral Le Chat移动应用发布…
00 分钟
2025-2-10
2025-2-10
/* */
URL
type
status
date
slug
summary
tags
category
icon
password

AIDaily 077/100

🖼️
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。 但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。 今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。 人们会被自己热爱的事物改变,而没有人因为给予而贫穷。

Vol.077

by Rocket

探索·AI产品

ElevenLabs Studio工具开放使用 可制作长播客

ElevenLabs宣布其Studio工具现已向所有用户开放。Studio是一个长格式文本到音频的编辑器,专为创作者和讲故事的人设计,能够将有声读物、旁白、文章甚至播客等带入生活。用户可以利用其多角色、精细的声音定制、节奏控制等功能,将文字内容转化为生动的音频作品。
此次更新包括以下亮点:
  • 节奏控制:用户现在可以通过菜单栏添加持续时间为0.1秒至3秒的停顿。
  • 自动角色声音分配:当导入包含多个角色的有声读物或剧本时,系统会自动为每个角色分配不同的声音。
  • GenFM功能:用户可以轻松创建播客风格的讨论,通过上传文档或从URL导入内容,选择主持人与嘉宾之间的对话形式或仅由主持人播报的形式。
此外,ElevenLabs Studio还支持多种文件格式,包括EPUB、TXT、PDF、HTML等,用户可以直接从URL初始化项目。该工具提供了一个全面的编辑器,用户可以添加多个章节,为不同部分分配独特的声音,重新生成并下载选定的短语,并锁定已完成的部分以便更好地组织内容。
ElevenLabs Studio的开放,为创作者和企业提供了更强大的工具,用于制作高质量的音频内容,无论是有声读物、播客还是其他长格式音频项目。
 

OpenAI Canvas及o1模型更新

OpenAI宣布用户现在可以与合作者共享Canvas工作区,方便团队协作和项目共享。
  • o1模型集成:Canvas现在集成了o1模型,支持更复杂的任务处理,如代码生成和文档编辑。
  • HTML与React支持:Canvas新增了对HTML和React代码的渲染支持,提升开发效率。
  • o3-mini模型更新
    • 思维链更新:OpenAI更新了o3-mini模型的思维链展示方式,使其更透明、更详细,帮助用户理解模型的推理过程。
此次更新面向所有用户,包括免费和付费用户,付费用户还将体验到更高级的o3-mini-high版本。
 

Pika Labs推出Pikadditions:视频编辑新突破

  • 功能介绍
    • 无缝集成:Pikadditions允许用户将任何人物或物体无缝融入现有视频中,同时保留原始视频和声音。
    • 操作简单:用户只需上传一张图片和一个视频,并输入简单的提示(Prompt),AI将自动完成合成。
  • 技术特点
    • 现实与想象融合:通过先进的AI技术,Pikadditions在1080p高清分辨率下,实现虚拟元素与现实画面的完美融合。
    • 智能场景整合:系统会根据视频中的动作和场景上下文,自动调整添加元素的大小、位置和动作,确保自然和引人入胜的整合。
    • 专业级增强引擎:利用最新的2.1模型技术,Pikadditions提供工作室级别的效果,确保每个添加元素自然地融入视频。
  • 使用方法
    • 上传视频和图片:用户需上传一个至少五秒长的视频和一张图片。
    • 输入提示:描述如何将添加的元素融入视频,考虑当前动作和场景上下文。
  • 免费体验:新用户注册可获得15次免费体验机会。
 

OpenAI将在超级碗期间首次投放广告

OpenAI将在2025年超级碗期间播出其首个电视广告,这是其首次大规模的付费广告活动。
该广告时长为60秒,投放成本约为1400万美元,预计观看人数将达到1.3亿。
  • 广告创意:广告通过独特的点画风格动画,展示了人类技术的进化,从早期的火和轮子到现代的DNA测序和太空探索,最终聚焦于ChatGPT处理日常任务的能力。
 

Mistral推出Le Chat移动应用及平台更新

法国AI创业公司Mistral AI发布了iOS和Android版的Le Chat移动应用,这是其聊天机器人Le Chat的手机版,具备网页搜索、多模态输入、图像生成和代码解释器等功能。
notion image
  • 核心功能
    • 网页搜索:结合网页搜索、新闻、社交媒体平台及其他来源的新近资讯,确保回应的正确及时效性。
    • 多模态输入:支持视觉和文件理解,基于视觉和光学字符识别(OCR)模型,可准确读取PDF、试算表、log文件与复杂图片文件。
    • 代码解释器:内置Code interpreter功能,用户可在沙箱环境中运行程序、进行科学分析、执行虚拟化及模拟。
    • 图像生成:基于Black Forest Labs Flux Ultra模型,生成逼真的高品质图片。
  • 速度优势:Le Chat引入了“Flash Answers”功能,处理速度超过ChatGPT和Claude等竞争对手的10倍,1秒可输出1,000字。
  • 定价方案
    • 免费版:提供最新模型、网页搜索、图像生成、文件上传、打开URL及Canvas功能。
    • Pro版:每月14.99美元,提供Mistral最高性能模型、无限消息、更高速率限制,并可选择不与Mistral共享数据。
    • Team版:每月每用户24.99美元,面向企业用户。
    • 企业版:提供本地部署、VPC或SaaS部署选项,支持自定义模型和工具集成,目前处于私密预览阶段。
    •  

GitHub Copilot全面整合智能体技术

GitHub Copilot引入了新的代理模式,能够自主迭代代码,自动识别并修复运行时错误,同时推断并执行额外任务,显著提升开发效率。
  • 视觉功能(Vision):新增“视觉”功能,支持用户上传截图、照片或图表等非文本文件,并据此生成界面、代码及替代文本。
  • Copilot Edits功能:该功能现全面可用,支持在VS Code中通过自然语言指令进行多文件编辑,提供代码更改建议。
  • 下一步编辑建议(Next Step Editing Suggestions):分析开发者最近的操作,预测其下一步需求,并提供智能编辑建议。
  • Project Padawan:预告了一个名为Project Padawan的自主编码代理,预计今年推出,能够处理GitHub问题并生成经过全面测试的拉取请求。
 
探索·AI数字人

AI生成的贾斯汀·比伯歌曲引发关注

2024年4月,一首据称由贾斯汀·比伯演唱的AI生成歌曲开始在社交媒体平台上广泛传播,尤其是在TikTok和YouTube上。假AI生成的贾斯汀·比伯(Justin Bieber)的歌曲在YouTube上有近200万次观看。
 
探索·新研究

Neuralink揭示其三名患者如何“在日常生活中使用心灵感应”

Neuralink的实验性脑接口技术取得了显著进展,其三名患者通过植入的脑机接口设备实现了“心灵感应”功能。
  • 患者体验
    • 首位患者Noland Arbaugh:通过植入设备,Noland能够仅凭意念控制电脑,观看视频、阅读、下棋和玩游戏,甚至在飞机上使用该技术。
    • 第二位患者:成功植入了400个电极,设备运行良好,患者能够通过意念控制外部设备。
  • 技术细节
    • 植入设备:Neuralink的设备通过植入大脑的电极捕捉神经信号,并将其转化为计算机可识别的指令。
    • 产品Telepathy:该产品旨在帮助神经元受损的人恢复身体功能,使他们能够通过意念控制设备。
  • 未来展望
    • 更多植入手术:Neuralink计划在2025年完成至少8次植入手术,进一步验证技术的安全性和实用性。
    • 终极目标:马斯克表示,Neuralink的终极目标是让人类与AI建立共生关系,降低AI带来的风险。
 
 
【🚀 精选内容】
❤ 如果对你有帮助,欢迎分享或者Buy Me A Coffee ❤
 
💡
对这个话题感兴趣的小伙伴,欢迎加我一起探索交流~
 
notion image