AIDaily 067/100

URL

type

status

date

slug

summary

🖼️

每天都能接收到无数条与AI、科技、艺术、经济相关的信息。但是感觉自己就像那只掰玉米的熊，掰了一路，最后出来发现只剩下手里的两根玉米🌽。今年希望能够以Newsletter的形式，给自己掰下来的玉米们找个背篓。人们会被自己热爱的事物改变，而没有人因为给予而贫穷。

Vol.067

by Rocket

探索·AI产品

🗣️ OpenAI向ChatGPT Plus用户提供GPT-4o超现实语音

新功能开放：OpenAI为ChatGPT Plus用户中的一部分人提供了GPT-4o模型的超现实语音功能。

语音技术：这项技术能够生成高度逼真的语音输出，提升人机交互的自然度和流畅性。

用户体验：超现实语音功能可能为用户带来更加丰富和生动的交流体验。

服务升级：这表明OpenAI在不断扩展和优化其高级服务，为付费用户提供更多增值功能。

🌟 Midjourney发布V6.1版本

图像质量提升：V6.1版本在图像质量上进行了改进，提供更清晰和逼真的视觉效果。

连贯性增强：新版本在生成图像的逻辑和场景连贯性方面进行了优化。

文本渲染改进：对文本的渲染效果进行了改进，使得文字与图像内容更加和谐。

新升级模型：引入了新的升级模型，提高了图像处理的速度和质量。

个性化模型：新增个性化模型，使用户能够根据自己的喜好调整图像风格。

处理速度加快：整体处理速度得到提升，缩短了用户等待时间。

美感增强：改进了图像的整体美感，使得生成的图像更加吸引眼球。

探索·AI硬件

🤖 AI可穿戴设备Friend融资250万美元

解决孤独问题：Friend旨在解决现代社会中日益严重的孤独问题，特别是美国年轻人中有61%报告长期感到孤独。

创始人背景：由哈佛辍学生Avi Schiffman创建，他因建立首个全球COVID追踪器而获得Webby年度人物奖。

产品介绍：Friend是一款99美元的AI可穿戴设备，设计为在用户需要时提供友情、伙伴关系或倾诉对象。

交互方式：Friend内置于吊坠中的聊天机器人，用户可通过按钮激活与之交互，AI随互动发展个性，目标是接近人类。

技术特点：设备始终监听，支持语音交互，但只能通过文本响应。

市场反应：发布视频在社交媒体上引起关注，观众意见不一，有些人认为它有《黑镜》的既视感。

资金筹集：已从包括Perplexity CEO和Morning Brew CEO在内的投资者那里筹集了250万美元，其中180万美元用于购买friend.com域名。

💰 Perplexity向出版商支付内容费用

新闻媒体面临互联网、社交媒体算法变化和生成式LLMs的连续冲击。Perplexity认为AI平台可能为困境中的行业带来新的收入来源。Perplexity推出新计划，与《时代》、《德克萨斯论坛报》和《财富》等出版商分享广告收入。

版权争议：此前，《福布斯》、《连线》等媒体曾指责Perplexity未经授权使用并重新发布他们的内容。

和解尝试：新计划可能是Perplexity弥补版权争议的方式。市场对计划的反应褒贬不一，一些媒体公司认为为时已晚，而另一些则认为比谷歌的模式更优。

潜在影响：尽管目前广告收入分成可能不足以改变行业现状，但如果Perplexity继续增长，这可能在未来产生显著差异。

Perplexity的新计划是AI领域与内容创作者合作模式的一次尝试，旨在平衡技术创新与版权保护的关系。

🛠️ Meta推出无需代码的AI Studio聊天机器人构建器

技术突破：Meta新推出的AI Studio允许用户无需编码技能即可构建聊天机器人。

定制化体验：用户可以调整聊天机器人的语气、个性、口号等参数，并定义其专业领域。

应用场景：创建的AI可以在WhatsApp、Messenger等应用或在线门户上使用。

社交媒体集成：Instagram影响者可以创建基于自己个性的聊天机器人，与粉丝互动，并有特殊标签以区分。

灵感来源：Meta可能从Character AI获得灵感，后者是首家允许用户轻松构建定制AI模型的公司。

市场策略：Character AI的成功让Meta看到通过提供定制化AI模型来提高用户参与度的潜力。

Meta的AI Studio为用户提供了一个创新的平台，让他们能够根据自己的需求和创意构建个性化的聊天机器人，同时保持了Meta对开源理念的承诺。

🎨 Liblib上线ComfyUI在线服务

网站更新：国内最大的SD模型分享网站Liblib在融资成功后，推出了在线的ComfyUI服务。

便捷功能：用户可以直接使用网站内丰富的SD模型资源，无需下载即可进行创作。

技术集成：目前网站已经集成了超过4000个节点，为用户提供了强大的创作支持。

会员优势：成为会员可以享受更流畅的使用体验，非会员可能需要排队等待。

社交媒体标签：相关讨论和分享在微博等社交媒体上使用#ai画图#标签。

Liblib的这一更新为AI绘画爱好者提供了一个更加方便和高效的创作平台，推动了AI艺术创作工具的普及和发展。

探索·AI大模型

🔊 Stable Audio Open：开源音频样本和声音设计模型

开源模型：Stable Audio Open是一个开源的文本到音频模型，能够生成长达47秒的音频样本和声音效果。

音频创作：用户可以利用该模型创造鼓点、乐器连复段、环境声音、拟音以及音乐制作和其他声音设计的制作元素。

音频变化与风格转换：模型支持音频样本的变化和风格转换，提供多样化的声音创作可能性。

微调和定制：开源特性允许用户基于自己的音频数据对模型进行微调，例如鼓手可以使用自己的鼓声录音来生成新的节拍。

高质量音频输出：该模型专门训练，以生成高质量的音频数据。

社区赋能：此版本的发布是一个重要的里程碑，进一步开放了音频生成能力，为声音设计师、音乐家和创意社区提供支持和赋能。

Stable Audio Open的推出为音频制作和声音设计领域带来了创新的工具，降低了创作高质量音频内容的门槛，同时为个性化和定制化音频创作提供了便利。、

👁️ 01.AI发布Yi-Vision视觉语言API

创始人背景：由李开复创立的01.AI推出了一款新的技术产品。

产品介绍：Yi-Vision是一种视觉语言API，专为解决复杂视觉任务而设计。

应用领域：该API适用于图像理解和分析，能够提高对视觉内容的处理能力。

技术优势：Yi-Vision通过先进的算法，增强了对图像数据的识别和分析，为各种应用场景提供支持。

Yi-Vision的推出体现了01.AI在视觉AI领域的专业能力和创新精神，为图像处理和智能分析提供了新的解决方案。

探索·AI研究

🍏 苹果研究论文透露使用Alphabet TPU训练LLM

意外选择：苹果公司在其研究论文中透露，选择使用Alphabet的TPU来训练其专有的大型语言模型(LLM)。

技术替代：这一决策意味着苹果没有采用Nvidia的流行AI加速器，而是选择了Alphabet的技术。

潜在合作：这可能表明苹果与Alphabet在AI硬件方面有某种形式的合作或技术交流。

战略意义：选择TPU可能基于性能、成本效益或其他战略考量，这对苹果的AI发展具有重要意义。

这一消息揭示了苹果在AI领域的技术选择和合作伙伴关系，展示了大型科技公司在推动AI技术发展中的多样性和灵活性。

👓 马克·扎克伯格预测智能眼镜的普及

行业领导者观点：Meta首席执行官马克·扎克伯格在SIGGRAPH上发表演讲，对智能眼镜的未来发展做出预测。

技术普及预期：扎克伯格预测，搭载人工智能技术的智能眼镜将变得十分常见，并被广泛采用。

产品线发展：他预见未来将出现一系列具有不同潜在潜力的眼镜产品。

市场定价策略：扎克伯格认为，以大约300美元的价格点，将会有数亿人使用这项技术，推动其成为普及的消费品。

技术展示：在雷朋智能眼镜的展示台前，扎克伯格发表了演讲，展示了Meta在智能眼镜领域的技术成果和市场信心。

扎克伯格的演讲体现了Meta对智能眼镜市场的乐观态度和长远规划，同时也反映了人工智能技术在可穿戴设备领域的应用潜力和市场前景。

🧠 DeepMind的AlphaProof模型解决奥林匹克级别数学问题

AI领域新突破：继国际象棋、将棋和围棋后，DeepMind的AlphaProof模型在数学领域取得进展，解决了今年国际数学奥林匹克(IMO)中的四分之六题目。

竞赛地位：IMO是世界上最负盛名的数学竞赛之一，AlphaProof的表现相当于获得银牌。

创造力与思维：IMO题目要求掌握不同定理和原理，同时需要高水平的创造力和非常规思维。

AlphaProof原理：与通常在训练数据中找模式的LLMs不同，AlphaProof生成多个答案并通过逆向工作测试其准确性。

技术提升：AlphaProof得到专门研究形状的AlphaGeometry 2模型的增强。

改进空间：DeepMind研究副总裁Pushmeet Kohli承认模型并不完美，尤其在组合学相关问题上遇到难题。

速度问题：与学生四个半小时解决每个问题的相比，AlphaProof解决一个特别具有挑战性的计算需要三天。

数学界震惊：尽管如此，AlphaProof解决了今年最难的问题，这是609名参赛者中只有5人实现的壮举。

未来应用：AlphaProof未来可能作为实验室助手，帮助数学家尝试不寻常的假设。

通用人工智能(AGI)：这些新能力让我们更接近AGI，即人工智能超越人类智能的理论点。

AlphaProof的成功不仅展示了AI在解决复杂逻辑难题方面的进步，也预示着AI在辅助科学研究方面的潜力，同时为实现更高级的通用人工智能铺平了道路。

🎼 MusiConGen：文本到音乐的精确生成

技术介绍：MusiConGen是一项基于Transformer的文本到音乐生成技术，提供对节奏和和弦的精确控制。

音乐特征控制：用户可以通过符号和弦序列、每分钟节拍数(BPM)和文本提示来定义音乐的特征。

应用潜力：这项技术为音乐创作提供了新的工具，允许艺术家和音乐爱好者以更直观的方式创作音乐。

创作自由度：MusiConGen的使用提供了高度的自由度，允许用户根据自己的创意输入生成个性化的音乐曲目。

MusiConGen通过结合文本提示和音乐参数的控制，推动了音乐生成技术的发展，为音乐产业带来了创新的可能性。

探索·AI投融资

🎨 Canva计划收购Leonardo AI增强设计平台

收购动态：Canva计划收购澳大利亚初创公司Leonardo AI。

战略目的：旨在将更多生成工具整合到Canva的设计平台中。

创新集成：通过收购，Canva旨在提升其平台的创意和自动化设计能力。

市场扩展：此举可能帮助Canva拓宽其在图形设计和创意市场中的业务范围。

技术融合：预计Leonardo AI的技术将与Canva的现有工具和功能无缝融合，为用户提供更丰富的设计体验。

💡

对这个话题感兴趣的小伙伴，欢迎加我一起探索交流~

AIDaily 067/100

Vol.067

Rocket

AIGC创作者社区

加入智否AIFunr社区讨论分享