URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 057/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.057
by Rocket
探索·AI大模型
🎯全新Claude 3.5 Sonnet能力大升级,发布Artifacts功能
今天,Anthropic推出了Claude 3.5 Sonnet,这是即将发布的Claude 3.5模型家族中的首款产品。
Claude 3.5 Sonnet在各项评估中表现出色,超越竞争对手和Claude 3 Opus。速度快,成本低。

Claude 3.5 Sonnet现在可在Claude.ai和Claude iOS应用上免费使用,而Claude Pro和Team计划的订阅者可以享受显著更高的访问速率。
它还通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI提供服务。模型的成本为每百万输入tokens(Token)3美元,每百万输出tokens 15美元,具有200K上下文窗口(context window)。
技术革新:性能与效率的完美结合
Claude 3.5 Sonnet 在性能方面有了显著提升。与前一代模型相比,它在自然语言处理任务上的表现更加出色,处理速度更快,理解能力更强。Anthropic 通过优化模型架构,使得 Claude 3.5 Sonnet 能够在更短的时间内完成更复杂的任务,同时大幅降低了能耗。

这一技术突破得益于 Anthropic 的多项创新:
- 架构优化:通过深度学习网络的改进,Claude 3.5 Sonnet 拥有了更高效的计算能力。
- 数据训练:使用海量优质数据进行训练,使模型在语言理解和生成方面表现更为出色。
- 能耗优化:新模型在计算资源的使用上更加高效,降低了碳足迹。
最先进的视觉能力

此外,Claude 3.5 Sonnet是目前最强大的视觉模型,在标准视觉基准测试中超过了Claude 3 Opus。
这些显著改进在需要视觉推理的任务中尤为明显,如解释图表和图形。
Claude 3.5 Sonnet还可以准确地从不完美的图像中转录文本,对于零售、物流和金融服务至关重要📦💰。
Artifacts——使用Claude的新方式


Anthropic还在Claude.ai上推出了Artifacts,这是一个扩展用户与Claude互动的新功能。
当用户请求Claude生成代码片段、文本文件或网站设计等内容时,这些Artifacts会出现在他们对话旁边的专用窗口中,这创建了一个动态工作空间,用户可以实时查看、编辑和构建Claude的创作内容,将AI生成的内容无缝集成到他们的项目和工作流程中。
这标志着Claude从对话AI向协作工作环境的演变。未来,它将支持团队协作,甚至整个组织的知识、文档和工作都能集中在一个共享空间中。
🎨 Microsoft Florence-2:AI视觉模型
- 新模型发布:Microsoft推出了Florence-2,一种新型AI视觉模型。
- 基于提示的指令:该模型使用基于文本提示的指令来执行任务。
- 任务表现:在字幕生成、对象检测和图像分割等任务中展现卓越性能。
- 技术应用:Florence-2的推出可能为图像识别和处理带来新的应用场景,提升AI在视觉理解方面的能力。
探索·AI产品
📱 Snap展示实时图像扩散模型 生成AR体验

- AR体验生成:Snap预览了一种能在智能手机上实时生成增强现实(AR)体验的图像扩散模型。
- Lens Studio 5.0:该模型集成在Snap的Lens Studio 5.0中,为AR创作者提供了新的AI工具。
- 实时互动:这项技术允许用户在智能手机上享受实时的AR互动体验。
- 创作者工具:新的AI工具旨在辅助AR创作者更高效地设计和实现创新的AR内容。
产品地址:‣
探索·AI视频
🎬 快手可灵大模型更新:发布图生视频与视频续写 最长3分钟
- 新功能开放:快手可灵大模型正式开放图生视频功能,允许用户将静态图像转化为动态视频。
- 文本控制运动:用户可以通过提示词文本控制图像中物体的运动,实现个性化视频生成。
- 视频续写功能:推出视频续写功能,支持对已生成视频的一键续写和多次续写。
- 最长视频时长:视频续写功能支持最长生成约3分钟的视频,满足更长内容创作需求。
- AI视频创作:更新强化了AI在视频创作领域的应用,为用户提供更丰富的视频编辑和创作工具。
探索·AI版权
🚨 Perplexity面临法律诉讼
新闻出版商福布斯威胁对AI搜索初创公司Perplexity采取法律行动,指控其聊天机器人在未适当归属的情况下窃取并重新发布原始报道。
- 内容复制:福布斯声称Perplexity的聊天机器人总结了其一篇调查文章,并以极少的来源进行了复制。
- AI版本传播:AI生成的版本随后被推送给Perplexity的订阅者,并被制作成YouTube视频,其排名超过了福布斯自己的内容。
- 公司回应:Perplexity首席执行官Aravind Srinivas回应称,产品仍有改进空间,公司正寻求与出版商保持一致的方法。
- 调查发现:《连线》杂志的调查发现Perplexity在抓取明确禁止爬虫的网站时产生幻觉信息,并包含不正确的归因。
- 行业紧张:AI公司和媒体公司间的紧张关系不断升级,法律依据尚不明确,出版商在保护知识产权方面面临困境。目前出版商可行的选择是通过许可交易或采取法律行动来应对。
探索·AI大事件
🚀 科技巨头共建xAI的AI工厂
- 合作方:戴尔、英伟达和超级微型计算机合作为xAI建立AI工厂。
- 项目目标:为xAI的大型超级计算机提供支持,训练和扩展Grok AI聊天机器人。
- 服务器组装:戴尔负责组装一半服务器机架,超级微型计算机负责另一半。
- 计算规模:计划使用高达100,000个Nvidia H100 GPU,可能是现有最大AI集群的4倍。
- 时间规划:马斯克希望超级计算机在2025年秋季前全面运行,以加速Grok模型开发。
- 行业意义:此次合作展现了推进AI边界所需的巨大计算能力,巨额资本的投入可能使Grok成为OpenAI和Anthropic等的有力竞争者。
这一合作项目不仅体现了AI领域对计算资源的大量需求,也预示着Grok AI聊天机器人在技术进步和市场竞争中的潜在发展。
探索·AI开源
🧩 乐高爱好者打造AI驱动的像素画打印机

YouTube上一位乐高爱好者,制作了一个AI LEGO PixelArt打印机。这个打印机能够根据输入的主题创作出精美的像素艺术作品,并用乐高块拼搭出来。先使用OpenAI的Dall-E 3生成图像,并通过编程将图像转换为32x32像素的LEGO像素图像,然后打印机就会识别对应的颜色进行拼砌。
对这个话题感兴趣的小伙伴,欢迎加我一起探索交流~
