AI Daily
🗒️AIDaily 052/100
00 分钟
2024-6-12
2025-1-22
/* */
URL
type
status
date
slug
summary
tags
category
icon
password

AIDaily 052/100

 
🖼️
每天都能接收到无数条与AI、科技、艺术、经济相关的信息。 但是感觉自己就像那只掰玉米的熊,掰了一路,最后出来发现只剩下手里的两根玉米🌽。 今年希望能够以Newsletter的形式,给自己掰下来的玉米们找个背篓。 人们会被自己热爱的事物改变,而没有人因为给予而贫穷。

Vol.052

by Rocket

探索·AI大事件
🚀 Midjourney 上线 model personalization"模型个性化"功能、
Midjourney新推出的"模型个性化"允许用户根据自己的喜好调整算法,减少训练数据带来的偏见。用户在编写提示时,MJ算法通常会用它们自己的“偏好”来填补空白,这实际上是MJ社区的集体偏见和偏好的结合。个性化学习用户喜好,使算法更贴合用户品味。
notion image
模型个性化要求
  • 目前,模型个性化从成对排名中的投票和你在探索页面上喜欢的图像中学习。
  • 你需要大约200个成对排名/点赞才能使这个功能起作用。
  • 你可以在成对排名页面上查看你的评分数量,或者在Discord上输入/info来查看。
如何使用模型个性化?
  • 只需在你的提示后输入-p,或者使用提示栏中的设置按钮为所有提示启用个性化。
  • 当你启用个性化时,你的提示后会添加一个“代码”,你可以分享这个代码,以便其他人可以使用应用于该图像的个性化效果。
  • 你可以使用-s 100(0是关闭,1000是最大,100是默认值)来控制个性化效果的强度。
  • 个性化代码示例:如--personalize bd974fq,每个用户的代码都是独特的,反映了个人的风格和偏好。
 
🤖 苹果发布私有云个性化AI 苹果在WWDC上展示其AI愿景,推出Apple Intelligence,旨在跨产品线提供个性化AI服务并确保数据安全。该系统优先在设备上处理AI任务,必要时云端数据交换将加密并使用后删除,称为Private Cloud Compute的流程将由独立安全研究人员验证,标志着苹果在隐私保护AI服务方面迈出的重要一步。
  • 全球开发者大会发布:苹果在大会上首次展示利用AI增强产品线的愿景。
  • Apple Intelligence功能:跨苹果产品线集成,提供个性化AI服务,保障数据安全。
  • 隐私保护:苹果强调本地设备上优先处理AI任务,保护用户隐私。
  • 加密数据交换:云端数据交换加密,并在使用后删除,确保数据安全。
  • 私有云计算:引入Private Cloud Compute,处理云中敏感数据的新方法。
  • 独立安全验证:私有云计算过程由独立安全研究人员进行审核验证。
  • 技术飞跃:标志着苹果在隐私保护AI服务方面迈出的重要步伐。
 
探索·AI开源
🌟 ComfyUI 准备迎接 SD3 Medium 模型开源
  • 模型开源预告:备受期待的#SD3 Medium模型即将于明天开源。
  • ComfyUI 适配:ComfyUI团队已经提前完成了适配工作,涉及13000+行代码,体现了巨大的工作量和对新模型的期待。
  • 适配完成:目前适配工作已经完成,团队正准备迎接模型的发布。
notion image
 
🔄 TextGrad:通过文本实现自动“区分”
  • 技术革新:人工智能正经历范式转变,通过组合多个大型语言模型(LLMs)和其他复杂组件取得突破性进展。
  • 自动化优化:TextGrad代表一种自动化优化方法,旨在简化和改进AI系统的开发流程。利用文本作为输入,自动区分和优化AI模型的性能,提高效率和准确性。
  • 应用场景:该技术可应用于自然语言处理、机器学习和其他需要模型微调的领域。
  • 优势:相比传统手动调参方法,TextGrad通过自动化手段减少人力成本,加快模型迭代速度。
TextGrad作为AI领域的一项创新技术,展现了通过文本实现自动区分和优化的巨大潜力,为AI模型的高效开发和应用提供了新思路。
 
🐕 密歇根大学AI解码狗叫声研究
  • 研究背景:密歇根大学研究团队利用AI模型分析狗的叫声,旨在解码叫声背后的深层含义。
  • 数据收集:研究人员收集了74只不同品种、年龄和情境下的狗的叫声作为研究数据。
  • AI模型训练:使用的AI模型最初设计用于分析人类语音,经过960小时的语音数据训练,并针对狗叫声进行了微调。
  • 研究结果
    • AI能从吠叫中识别出个别狗。
    • 准确区分狗的品种和性别。
    • 以70%的准确率将吠叫与情绪背景(如玩耍和攻击)匹配。
 
 
🎬 腾讯Follow-Your-Emoji面部表情迁移技术
notion image
  • 面部表情迁移:新技术能够将任何人的面部表情迁移到其他照片或视频中。
  • 无需音频驱动:与音频驱动的视频生成不同,这项技术专注于面部表情的迁移。
  • 表情同步:即使没有声音,表情也能与视频内容同步得很好。
  • 广泛适用性:技术适用于真人、卡通、雕塑甚至动物的面部表情迁移。
  • 视频生成:可以生成说话的视频,也可以仅显示表情的同步视频。
 
 
 
💡
对这个话题感兴趣的小伙伴,欢迎加我一起探索交流~
 
notion image