Meta突破技术界限:自回归模型翻新图像生成,AI能生成2048×2048分辨率惊人图像

3个月前 科技 20观看
摘要 标题:Meta突破技术界限:自回归模型翻新图像生成,AI能生成2048×2048分辨率惊人图像随着科技的进步,人工智能(AI)正在逐步改变我们的生活。近日,Meta AI创新推出Token-Shuffle,这一技术突破旨在解决自回归模型在生成高分

标题:Meta突破技术界限:自回归模型翻新图像生成,AI能生成2048×2048分辨率惊人图像Gii喜好网-记录每日喜好的科技时尚娱乐生活

随着科技的进步,人工智能(AI)正在逐步改变我们的生活。近日,Meta AI创新推出Token-Shuffle,这一技术突破旨在解决自回归模型在生成高分辨率图像方面的扩展难题。Token-Shuffle通过识别多模态大语言模型中的视觉词汇冗余,提出了一种创新策略,直击计算成本问题,让自回归模型能够高效处理最高2048×2048分辨率的图像。Gii喜好网-记录每日喜好的科技时尚娱乐生活

自回归模型是一种用于时间序列分析的统计方法,主要用于预测数据序列中的未来值。该模型的核心思想是当前的值与过去的值之间存在线性关系,因此可以用变量自身的历史数据来预测当前或未来的值。近年来,自回归模型在图像合成方面大放异彩,然而在面对高分辨率图像时,AR 模型遭遇瓶颈。Gii喜好网-记录每日喜好的科技时尚娱乐生活

Token-Shuffle的推出,为这一瓶颈问题提供了有效的解决方案。该方法通过将空间上相邻的视觉token沿通道维度合并,并在推理后再恢复原始空间结构,大幅降低了计算成本。这种token融合机制不仅让自回归模型能够高效处理高分辨率图像,还无需改动Transformer架构,也无需额外预训练编码器,操作简单且兼容性强。Gii喜好网-记录每日喜好的科技时尚娱乐生活

具体而言,Token-Shuffle包含token-shuffle和token-unshuffle两个步骤。输入准备阶段,空间相邻的token通过MLP(多层感知机)压缩为单个token,减少token数量。以窗口大小s为例,token数量可减少s²分之一,显著降低Transformer的计算量(FLOPs)。此外,该方法还引入了针对自回归生成的classifier-free guidance(CFG)调度器,动态调整引导强度,优化文本-图像对齐效果。Gii喜好网-记录每日喜好的科技时尚娱乐生活

实验结果表明,Token-Shuffle在GenAI-Bench和GenEval两大基准测试中展现了强大实力。基于2.7B参数的LLAMA模型,Token-Shuffle在“困难”提示下取得VQAScore 0.77,超越了其他AR模型如LlamaGen和扩散模型LDM。而在GenEval中,其综合得分也达到了0.62,为AR模型树立了新标杆。用户评估也显示,尽管在逻辑一致性上略逊于扩散模型,但Token-Shuffle在文本对齐、图像质量上优于LlamaGen和Lumina-mGPT。Gii喜好网-记录每日喜好的科技时尚娱乐生活

值得注意的是,Token-Shuffle不仅在技术上有所突破,而且为未来的发展提供了广阔的空间。首先,随着算力资源的不断提升,高分辨率图像生成将成为可能。这意味着我们可以获得更加精细、更加真实的图像,这对于医疗、科研、艺术等领域具有重要意义。其次,Token-Shuffle方法的兼容性强,易于与其他AI技术结合使用,进一步拓展其在各个领域的应用范围。最后,Token-Shuffle的提出也反映了Meta AI对于人工智能研究的重视和投入,这无疑将推动AI技术的发展,为人类生活带来更多便利。Gii喜好网-记录每日喜好的科技时尚娱乐生活

总的来说,Meta AI的Token-Shuffle为自回归模型在图像生成领域打开了新的可能。这一突破性的技术不仅提高了生成图像的质量和效率,也为未来的研究提供了新的方向。我们期待看到更多像Token-Shuffle这样的技术出现,推动人工智能的发展,为人类社会带来更多福音。Gii喜好网-记录每日喜好的科技时尚娱乐生活

Gii喜好网-记录每日喜好的科技时尚娱乐生活

Gii喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
国产男装,终于靠女性“支棱”起来了?

国产男装,终于靠女性“支棱”起来

文丨关樾出品丨消费最前线去年双

11-19 127阅读
纯电210km 奇瑞风云T9超长续航版上市:限时国补14.89万元

纯电210km 奇瑞风云T9超长续航版

11月19日

11-19 127阅读
灵初智能完成天使轮融资

灵初智能完成天使轮融资

近日,

11-19 117阅读
生成式AI热潮之下,应届毕业生的机会何在?

生成式AI热潮之下,应届毕业生的机

图片来源:由无界AI生成“互联网充

11-19 120阅读
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

Scaling Law遭遇瓶颈,OpenAI被曝

文章来源:量子位图片来源:由无界AI

11-19 106阅读
卖熏鸡卖青团,付费才能抢鲜看,芒果TV靠麦琳挣了多少钱?

卖熏鸡卖青团,付费才能抢鲜

11-19 109阅读
毒铁锅 遭央视多次曝光,把美食变成 毒药 ,大家应提高警惕(遭央视多次曝光)

毒铁锅 遭央视多次曝光,把

前言 前一段时间,我国市面上出现了

11-19 105阅读
()

()

血珀,一直是很多玩琥珀的朋友的心

11-19 103阅读
《号手就位》主角为什么都选择入伍,最后他们如何了?

《号手就位》主角为什么都

《号手就位》是中国首部火箭军题

11-19 115阅读
《好东西》豆瓣9.1,放映时观众数次鼓掌,导演:桥段全靠硬编

《好东西》豆瓣9.1,放映时

邵艺辉自编自导,宋佳、钟楚曦、章宇、

11-19 123阅读
帝国时代2高清版秘籍,帝国时代2高清重制版(HD版)秘籍

帝国时代2高清版秘籍,帝国

帝国时代2高清版是最近很多玩家在玩的

11-19 119阅读
新斗罗大陆兑换码,2024新斗罗大陆礼包兑换码

新斗罗大陆兑换码,2024新

新斗罗大陆是一款十分好玩的手游,如果你

11-19 114阅读
原神疗养观察任务流程|原神疗养观察攻略

原神疗养观察任务流程|原

原神疗养观察是游戏中须弥地区魔神任务

11-19 104阅读
原神八个探索性成就任务攻略|八个探索性隐藏成就做法

原神八个探索性成就任务攻

八个探索性成就是原神须弥地区的隐藏任

11-19 111阅读
饥荒石头怎么大量获得?饥荒快速获得大量石头的技巧分享

饥荒石头怎么大量获得?饥

饥荒石头怎么大量获得?石头是饥荒游戏里

11-19 116阅读