URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 030/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.030
by Rocket
🧸 Grok AI 毛绒玩具:孩子们的智能新伙伴
由硅谷初创公司 Curio 利用 OpenAI 技术开发的 AI 毛绒玩具 Grok,不仅拥有马斯克前女友、加拿大音乐家 Grimes 的配音,还具备了先进的语言模型,为儿童提供了一个既能提供教育又能娱乐的互动体验。
- Grimes 配音:Grok 毛绒玩具由 Grimes 配音,增加了玩具的吸引力和亲切感。
- 语言大模型:内置的语言大模型使得 Grok 能够与孩子们进行动态对话,提供在场陪伴感。
- 教育与娱乐:Grok 旨在通过丰富的教育和娱乐体验提高孩子的想象力水平。
- 无屏幕娱乐:适应3-7岁儿童,提供无需屏幕的互动娱乐方式。
Curio 公司的这一创新产品,结合了传统的毛绒玩具温暖和现代 AI 技术的智慧,为儿童社交和学习提供了一个新选择。AI 毛绒玩具 Grok 的推出,不仅展现了 AI 技术在玩具行业的应用潜力,也为父母提供了一个在忙碌时能够陪伴和教育孩子的工具。
🤖 星尘智能发布 AI 机器人 Astribot S1,旨在普及 AI 助理
星尘智能公司发布了 AI 机器人 Astribot S1,这款机器人在同规格机器人中具备“最强操作性能”,并通过模仿学习能够执行多项复杂任务,展现出媲美成年人的敏捷性和灵活性。
主要特点:
- 高性能:Astribot S1 在未经过加速处理的 1 倍速视频中,展示了在家居和工作场景中的卓越性能。
- 多任务执行:S1 能够完成叠衣、分拣物品、颠锅炒菜、吸尘清洁、竞技叠杯等复杂任务。
- 大模型测试:机器人已接入大模型进行测试,并预计在 2024 年内完成商业化。
- AGI 发展:随着 AI 向通用人工智能(AGI)的方向发展,大模型与机器人的结合成为必然趋势。
星尘智能 CEO 来杰强调,公司的目标是让数十亿人拥有 AI 机器人助理。Astribot S1 被设计为能够像人一样学习、思考和劳动,使用人的工具和设备,帮助完成枯燥、困难或危险的任务,并适应环境变化,照顾家庭成员。
这一愿景体现了星尘智能对 AI 机器人在日常生活中应用的长远考量,预示着 AI 技术将更深入地融入人们的工作和生活,开启 AI 通用机器人的巨大潜力。同时,公司也鼓励用户向 S1 提出更多需求,以不断提升机器人的能力,使其无限接近人类水平。
Sam Altman 最新对人工智能未来发展的看法
在斯坦福大学的闭门演讲中,Sam Altman 分享了他对人工智能未来发展的看法,特别是关于 OpenAI 开发的大型语言模型(LLMs)的进展。以下是 Sam 在演讲中提到的一些关键点:
- GPT 模型的持续进步:Sam Altman 强调,人工智能模型将继续变得更加强大,而我们目前还没有达到其发展曲线的顶端。
- GPT5 的预期性能:他提到,尽管听起来像是回避问题,但 GPT5 或无论 OpenAI 如何命名其下一个模型,都将比 GPT4 更加智能。他认为这是一个在人类历史上非常显著的事实。
- 科学的确定性:Sam 表达了一种科学上的确定性,即 GPT5 将比 GPT4 更聪明,GPT6 又将比 GPT5 更聪明,而且我们离这个智能曲线的顶部还有很远的距离。
- 对未来的展望:Sam 的言论表明,OpenAI 对于其人工智能技术的未来非常乐观,并且他们预计将继续推动模型性能的边界。
- OpenAI 对抗模仿的自信:Sam 还提到 OpenAI 不担心他们的技术被复制,这可能反映了 OpenAI 在 AI 领域的领导地位和对自身创新能力的信心。
Sam Altman 的这些观点揭示了 OpenAI 对于其人工智能技术发展的长远规划和对行业未来的信念。随着技术的不断进步,我们可以预见到 AI 将在更多领域发挥更大的作用,同时也带来了对伦理、治理和安全性的进一步考量。
🏙️ a16z 推出 AI 小镇,由 Llama3 驱动实现本地运行
风险投资公司 Andreessen Horowitz(a16z)开发的 AI 小镇(AI Town)现在可以通过 Llama3 完全在本地运行,为用户带来了更加丰富的虚拟社交体验。
- 本地运行:AI 小镇不再依赖云端服务器,而是利用 Llama3 模型在本地设备上运行,提高了响应速度和隐私保护。
- 支持 Convex、Ollama:AI 小镇兼容多种 AI 模型和框架,包括 Convex 和 Ollama,增强了其灵活性和扩展性。
- 本地 Vite 网络服务器:通过本地 Vite 网络服务器,AI 小镇能够提供更加流畅和稳定的在线体验。
AI 小镇是一个创新的虚拟环境,AI 角色在这里进行居住、聊天和社交活动。这个平台可能被设计为一个社交和娱乐的空间,同时也是一个展示 AI 技术潜力的实验场。通过在本地运行,a16z 的 AI 小镇展示了 AI 技术在提供个性化和互动体验方面的新可能性。
这一发展还表明,随着 AI 技术的不断进步,我们越来越能够将复杂的 AI 应用集成到本地设备中,这为未来的应用开发和用户体验设计开辟了新的道路。
🔥 NVIDIA 发布 NeRF-XL,革新多 GPU 分布式神经辐射场渲染
NVIDIA 推出了一种新方法 NeRF-XL,用于在多个 GPU 上分布神经辐射场(NeRFs),使得可以训练和渲染任意大规模容量的 3D 场景。
令人震撼的三个示例:
- Laguna Seca Raceway:在 8 个 GPU 上渲染了 1 平方千米的赛道路场景。
- 墨西哥海滩:在 32 个 GPU 上渲染了 2018 年飓风迈克尔过后的 6 平方千米海滩场景。
- MatrixCity:在 64 个 GPU 上渲染了 25 平方千米的城市场景。
NeRF-XL 的发布,标志着在 3D 场景渲染技术上的一大步,它允许研究人员和开发者创建和渲染比以往任何时候都要大和详细的虚拟环境。这项技术的应用前景广阔,包括电影制作、游戏开发、虚拟现实、城市规划等多个领域,都能从这一突破中受益。NVIDIA 的这一创新再次证明了其在 GPU 技术和图形渲染领域的领导地位。
🌟 InternVL:开源的 GPT-4V 商用替代模型
InternVL 被标榜为最接近 GPT-4V 性能的开源模型,它不仅可以处理图像和文本数据,还能够理解它们之间的复杂关系,例如图像中的对象与相关描述之间的对应关系。
- 多模态理解:InternVL 能够理解图像内容和文本之间的联系,尤其在 OCR(光学字符识别)和文档理解方面表现出色。
- 高分辨率支持:该模型支持高达 4K 分辨率的输入,有效识别和解释文档图像中的文字。
- 整合大语言模型:InternVL 能够与现有的大型语言模型整合,创建功能丰富的多模态对话系统。
- 基准测试表现:InternVL 1.5 在多个重要基准测试中表现卓越,如文档理解(DocVQA)、图表分析(ChartQA)、数学视觉问答(MathVista)等。
InternVL 1.5 的性能在某些情况下甚至超越了现有的顶尖商业模型,如 GPT-4V 和 Gemini Pro,提供了一个开源的、可商用的替代方案,这对于希望利用最新 AI 技术而不必依赖专有软件的开发者和企业来说是一个吸引人的选择。
🎭 使用 AI 技术将 2D 动漫人物转换为 3D 真人视频
最新的 AI 技术现在能够实现从 2D 动漫人物到逼真真人图像的转换,并进一步制作成动画视频。
- 使用 Stable Diffusion (SD) 生成图像:Stable Diffusion 是一种强大的图像生成模型,能够根据提供的 2D 参考动漫人物生成逼真的真人图像。
- Haiper AI 制作动画视频:Haiper AI 是一种能够将生成的静态真人图像转换成动画视频的工具,使得角色能够进行各种动作和表情变化。
- Cog-Become-Image 工具:这是一个可以用于人物图像转换的工具,它能够将任意人物图像转换成用户指定的另一种图像风格或形式。