URL
type
status
date
slug
summary
tags
category
icon
password
AIDaily 068/100
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。
但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。
今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。
人们会被自己热爱的事物改变,而没有人因为给予而贫穷。
Vol.068
by Rocket
探索·AI产品
🎨 Ideogram 2.0发布重大升级

- 新版本发布:Ideogram发布了其高级文本到图像模型的2.0版本,引入重大升级和新功能。
- 五种图像样式:包括一般、写实、设计、3D和动漫风格,提供多样化的视觉效果。
- 写实风格:显著改善了人体特征如手和头发的纹理,解决了以往模型的常见问题。
- 设计风格:改进了文本渲染,便于用户创作贺卡、T恤设计等。
- 免费套餐:Ideogram提供免费服务,用户每天可免费生成约40张图像或10个提示。
- 行Ideogram 2.0以高质量的图像渲染和近乎完美的细节处理,成为模因、新闻通讯图像、YouTube缩略图、海报等用例的新标准。
🎨 Midjourney开放网络AI图像编辑器
- 全面开放:Midjourney向所有用户开放了其基于网络的AI图像编辑器和新工具。
- 免费试用:为新用户提供了免费试用,以便他们能够测试这些工具的功能。
- 用户友好:通过提供试用期,Midjourney降低了用户尝试AI图像编辑的门槛。
- 技术应用:Midjourney的AI图像编辑器可能包含多种创新功能,使用户能够更便捷地进行图像创作和编辑。
Midjourney的这一举措体现了其对用户体验的重视,同时也展示了AI技术在图像编辑领域的应用潜力,为创意产业带来了新的工具和可能性。
探索·AI硬件
🤖 迪士尼AI赋予机器人生命
苏黎世联邦理工学院和迪士尼研究中心的科学家合作开发了一种AI系统。该系统能通过简单的文本或图像输入,为虚拟角色和机器人生成逼真的基于物理的运动。采用两阶段方法,先从大数据集中学习运动的潜在表示,然后通过强化学习训练控制策略。
- 运动多样性:系统能处理从简单行走到复杂杂技的多样化动作,准确性和泛化能力超越以往方法。
- 适应性:AI适应物理限制,能够将动作转移到真实机器人上,同时保持平衡和风格。
- 实际演示:迪士尼发布了视频,展示了一个经过新AI技术训练的机器人,它可以跳舞并在被推动时保持站立。
- 行业意义:该系统为动画与机器人技术间架设了桥梁,使类人机器人能更自然地移动,更好地适应新环境。
随着个人机器人预计在2025年到来,以及AI和机器人技术的快速发展,我们与机器人共存的时代可能比预期更早到来。迪士尼AI系统的这一突破不仅推动了机器人技术的发展,也预示着人机共生时代的临近,为未来的人机交互和协作提供了新的可能性。
探索·AI大模型
🚀 微软和英伟达推出高效AI模型
- 微软Phi-3.5:推出三个新型号,包括42B参数MoE-instruct、3.82B参数mini-instruct和视觉指令模型,均在多基准测试中达到先进水平。
- 性能对比:与Gemini 1.5 Flash相媲美,在某些测试中接近OpenAI的GPT-4o。
- 英伟达Mistral-NeMo-Minitron 8B:基于上月发布的12B版本进行更新,通过修剪不必要权重并重新训练以提高准确性。
- 定制化应用:小尺寸使其高度可定制,适用于电话应用和客户服务聊天机器人等特定用途。新模型在不牺牲准确性的情况下提高速度和效率,Nvidia的8B模型计算成本比12B版本降低40倍。随着AI公司应对能源消耗和成本问题,这些高效模型的紧凑形态可能变得与模型功能同等重要。
🛠️ OpenAI开放GPT-4o调整权限给开发人员
- 访问开放:OpenAI宣布开放对GPT-4o模型的访问权限,允许独立开发人员进行调整。此前,大型科技公司的软件工程师才能使用最前沿的模型,独立开发人员通常只能使用开源的简化版本。
- 微调优势:通过微调,工程师可以最大化模型性能,满足特定需求,提升准确度和效率。
- 定制潜力:定制版本的GPT-4o,如专注于数学或编程的版本,有潜力刷新行业基准和记录。为庆祝新定制功能,OpenAI将提供每天100万个训练代币的免费额度,直至9月23日。
🔥 xAI发布Grok 2早期测试版
- 早期测试:xAI开始向选定的高级X用户推出Grok 2的早期测试版。
- 技术优势:Grok 2能使用X的实时数据,区别于ChatGPT和其他大型语言模型(LLMs)。
- 两种模式:提供常规模式和“有趣”模式,后者展现更独特和有趣的个性。
- 新闻处理:在收集和总结新闻时,Grok 2能引用特定推文,这是其他模型不具备的功能。Grok 2相较于其他顶级AI聊天机器人,如ChatGPT,其最大的优势在于能够访问X的实时信息并提供未经过滤的响应。随着Grok 3预计将在2024年底推出,xAI在短时间内证明了自己在LLM领域的竞争力。
🚀 Groq发布Whisper模型精简版API

- 技术升级:Groq为OpenAI的Whisper文本转语音模型推出了精简版API。
- 性能提升:新API的速度比原版快了240倍,提供更迅速的语音生成能力。
- 成本效益:与原模型相比,精简版API的成本显著降低,提高了性价比。
这一API的推出可能为需要快速文本转语音服务的应用程序带来便利,如实时翻译、语音助手等。Groq的这一创新为语音技术领域带来了新的选择,其高速和低成本的特点有望推动相关技术的广泛应用和创新。
探索·AI投融资
🤝 加州与谷歌签订3亿美元五年合作计划
- 合作内容:加州与谷歌签订了一项为期5年、价值3亿美元的合作协议,旨在资助州内新闻编辑室和人工智能(AI)项目。
- 年度项目:合作计划中包括每年4000万美元的“人工智能创新加速器”项目。
- 资金投入:这项合作将为新闻机构和AI领域的创新项目提供稳定的资金支持。
- 目标与影响:通过这笔资金,加州和谷歌期望能够推动新闻行业的可持续发展和AI技术的创新与应用。
这一合作计划体现了加州与谷歌对媒体和AI技术发展的重视,同时也展示了公私合作伙伴关系在推动社会进步和技术创新中的潜力。
对这个话题感兴趣的小伙伴,欢迎加我一起探索交流~
