1. 首页 >精选经验 > 综合经验 > 正文

AppleMGIE作为开源AI图像编辑工具发布

导读 苹果最新的人工智能模型被誉为革命性的,因为它能够根据使用多模态大语言模型(MLLM)处理的提示来执行Photoshop风格的修改等任务。因此,它...

苹果最新的人工智能模型被誉为“革命性的”,因为它能够根据使用多模态大语言模型(MLLM)处理的提示来执行“Photoshop风格的修改”等任务。因此,它被称为MLLM引导图像编辑(MGIE),并且被评定为在像素级别“操作”图像。

AI可用于图像编辑和生成;然而,机器学习的这种应用可能很难将人类指令与实际目标和相应的输出相匹配,这些指令可能会受到技术、有意或理想化的修饰变化的影响。然而,苹果公司的新MGIE模型已经被认为能够“彻底改变”该技术。

它被认为改进了指令的“解释”,并配有上下文,例如“意识到”诸如“更改背景并添加星球大战背景”之类的提示可能需要添加“光剑或宇宙飞船”,这要归功于MLLM的集成,从而与其竞争对手InsPix2Pix或前身LLM引导图像编辑(LGIE)相比,在定性分析和人工评估方面提供潜在的卓越结果。

它还可以利用其MLLM来“推理”,让食物图片变得“更健康”可能涉及到一些蔬菜的增加。MGIE被评为“Photoshop”级别的这样做,并且还可以以像素级的准确度和精确度执行局部或一般的“照片优化”。

Apple与加州大学圣巴巴拉分校(UCSB)的团队合作,在2024年学习表示国际会议(ICLR2024)上展示了Apple对AI研究的最新尝试,该团队还发表了一篇基于同一工作的论文目前在arXiv上可用。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!