OpenAI 推出 GPT-4o 原生图像生成功能,效果令用户惊叹

1个月前 科技 6观看
摘要 在 OpenAI 于 2024 年 5 月发布首个"全能"多模态模型 GPT-4o 即将一周年之际,这款经典模型又带来了新的惊喜。今天,OpenAI 终于为 ChatGPT 的 Plus、Pro、Team 和免费用户开放了 GPT-4o 的原生

在 OpenAI 于 2024 年 5 月发布首个"全能"多模态模型 GPT-4o 即将一周年之际,这款经典模型又带来了新的惊喜。mNa喜好网-记录每日喜好的科技时尚娱乐生活

今天,OpenAI 终于为 ChatGPT 的 Plus、Pro、Team 和免费用户开放了 GPT-4o 的原生多模态图像生成功能。公司表示,该功能很快也将面向企业版、教育版用户开放,并通过 API 提供服务。mNa喜好网-记录每日喜好的科技时尚娱乐生活

与 ChatGPT 此前使用的生成式 AI 图像模型(OpenAI 的 DALL-E 3,一个通过去除像素噪声从文本提示重建图像的经典扩散 Transformer 模型)不同,这个新的图像生成器是输出文本和代码的同一模型的一部分,因为 OpenAI 训练整个模型同时理解所有这些媒体形式。mNa喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 总裁 Greg Brockman 早在 2024 年 5 月就预览过 GPT-4o 的这种原生功能,但出于目前尚未公开的原因,公司一直将其保留到现在才发布——这是在 Google AI Studio 发布了被许多 AI 高级用户认为类似的 Gemini 2 Flash 实验模型功能之后。mNa喜好网-记录每日喜好的科技时尚娱乐生活

这带来了质量更高的图像生成器,可以生成更逼真的图像和更准确的嵌入文本,已经给用户留下了深刻印象——有用户称其质量"令人疯狂"。mNa喜好网-记录每日喜好的科技时尚娱乐生活

同样值得注意的是,OpenAI 仍然没有明确说明 GPT-4o 的图像生成功能是用什么数据训练的——考虑到该公司和其他模型提供商的历史,很可能包含了从网络上抓取的许多艺术作品,其中一些可能受版权保护,这很可能会激怒这些作品背后的艺术家。mNa喜好网-记录每日喜好的科技时尚娱乐生活

将图像生成引入 ChatGPT 和 SoramNa喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 一直致力于将图像生成作为其 AI 模型的核心功能。通过 GPT-4o,用户现在可以直接在 ChatGPT 中生成图像,通过对话进行完善,并即时调整细节。mNa喜好网-记录每日喜好的科技时尚娱乐生活

该模型还集成到了 OpenAI 的视频生成平台 Sora 中,进一步扩展了多模态功能。mNa喜好网-记录每日喜好的科技时尚娱乐生活

在 X 平台的公告中,OpenAI 确认 GPT-4o 的图像生成旨在: - 准确渲染图像中的文本,可以创建标志、菜单、邀请函和信息图表 - 精确执行复杂提示,即使在详细构图中也能保持高保真度 - 基于先前的图像和文本构建,确保多次交互中的视觉一致性 - 支持各种艺术风格,从照片写实到风格化插图mNa喜好网-记录每日喜好的科技时尚娱乐生活

用户可以在 ChatGPT 中描述一个图像,指定诸如宽高比、配色方案 (十六进制代码) 或透明度等细节,GPT-4o 将在一分钟内生成它。mNa喜好网-记录每日喜好的科技时尚娱乐生活

正如独立 AI 顾问 Allie K. Miller 在 X 上所写,这是"文本生成的巨大飞跃",是她见过的"最好的" AI 图像生成模型。mNa喜好网-记录每日喜好的科技时尚娱乐生活

主要功能和用例mNa喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4o 的设计不仅注重视觉效果,还确保实用性。主要应用包括: - 设计与品牌 – 生成带有精确文本布局的标志、海报和广告 - 教育与可视化 – 创建科学图表、信息图表和历史图像用于学习 - 游戏开发 – 在不同设计迭代中保持角色一致性 - 营销与内容创作 – 根据品牌需求制作社交媒体素材、活动邀请函和数字插图mNa喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4o 如何改进 DALL-E 的生成图像mNa喜好网-记录每日喜好的科技时尚娱乐生活

根据 OpenAI 在 X 上的官方帖子,GPT-4o 相比之前的模型有以下几项改进:mNa喜好网-记录每日喜好的科技时尚娱乐生活

更好的文本集成: - 与过去在可读性和文本布局方面存在困难的 AI 模型不同,GPT-4o 现在可以准确地在图像中嵌入文字mNa喜好网-记录每日喜好的科技时尚娱乐生活

增强的上下文理解: - GPT-4o 利用聊天历史,允许用户交互式地完善图像,并在多次生成中保持连贯性mNa喜好网-记录每日喜好的科技时尚娱乐生活

改进的多对象绑定: - 虽然之前的模型在正确定位场景中的多个不同对象时存在困难,但 GPT-4o 现在可以同时处理 10-20 个对象mNa喜好网-记录每日喜好的科技时尚娱乐生活

多样化的风格适应: - 该模型可以生成或转换图像为各种风格,从手绘草图到高分辨率照片写实风格mNa喜好网-记录每日喜好的科技时尚娱乐生活

局限性mNa喜好网-记录每日喜好的科技时尚娱乐生活

尽管取得了进展,GPT-4o 仍然存在一些已知挑战:mNa喜好网-记录每日喜好的科技时尚娱乐生活

裁剪问题: - 大尺寸图像(如海报)有时可能裁剪过紧mNa喜好网-记录每日喜好的科技时尚娱乐生活

非拉丁文字的准确性: - 某些非英语字符可能无法正确渲染mNa喜好网-记录每日喜好的科技时尚娱乐生活

小文本的细节保留: - 高度详细或小字体的文本可能会失去清晰度mNa喜好网-记录每日喜好的科技时尚娱乐生活

编辑精确度: - 修改图像的特定部分可能会无意中影响其他元素mNa喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 正在通过持续的模型改进来解决这些问题。mNa喜好网-记录每日喜好的科技时尚娱乐生活

安全和标签措施mNa喜好网-记录每日喜好的科技时尚娱乐生活

作为 OpenAI 负责任 AI 开发承诺的一部分,所有 GPT-4o 生成的图像都包含 C2PA 元数据,允许用户验证其 AI 来源。mNa喜好网-记录每日喜好的科技时尚娱乐生活

此外,OpenAI 还建立了内部搜索工具来帮助检测 AI 生成的图像。mNa喜好网-记录每日喜好的科技时尚娱乐生活

系统设有严格的保护措施来阻止有害内容和防止滥用,比如禁止生成露骨、欺骗性或有害的图像。mNa喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 还确保对包含真实人物的图像施加更严格的限制。mNa喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI CEO Sam Altman 将此次发布描述为"创作自由的新高度",强调用户将能够创建广泛的视觉内容,同时 OpenAI 将基于实际使用情况观察和完善其方法。mNa喜好网-记录每日喜好的科技时尚娱乐生活

随着 AI 生成图像变得更加精确和易于使用,GPT-4o 代表着将文本转图像生成技术转变为主流通信、创意和生产力工具的重要一步。mNa喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
问界理想的新擂台:问界M8 VS 理想L8

问界理想的新擂台:问界M8 VS 理想

要说近年来什么行业最“卷”,相信

11-19 63阅读
联想VS中兴!专利大战谁将胜出?

联想VS中兴!专利大战谁将胜出?

【锋巢网】最近,通信圈又出了一个

11-19 67阅读
极氪总裁提醒用户警惕杀猪盘:低价买车是诱饵

极氪总裁提醒用户警惕杀猪盘:低价

11月19日

11-19 69阅读
华为强机皇!Mate 70系列关键信息汇总:外观/性能/影像揭秘

华为强机皇!Mate 70系列关键信息

华为Mate

11-19 64阅读
一家城配自动驾驶服务商,融了7个亿丨投融周报

一家城配自动驾驶服务商,融了7个

大家

11-19 65阅读
NCT成员道英自2021年演出《玛丽・安东妮》之后睽违3年再度登上音乐剧舞台演出《笑面人》

NCT成员道英自2021年演出

NCT成员道英自2021年演出《玛

11-19 68阅读
《藏海花之暗巢汹涌》定档11月14日 古穴探险再寻迷踪嗜血凶怪惊悚升级

《藏海花之暗巢汹涌》定档

  改编自南派三叔原著小说《藏海花

11-19 70阅读
中国世界电影学会|2024·法国优秀影片展映圆满落幕

中国世界电影学会|2024·法

  由中国世界电影学会、中国文联电

11-19 66阅读
时隔3年正式回归连更2条作品 李子柒:还有存货正在剪

时隔3年正式回归连更2条作

11月12日消息,时

11-19 58阅读
徐克执导!新《射雕英雄传》官宣定档2025大年初一 肖战饰演郭靖

徐克执导!新《射雕英雄传》

11月15日消息,今

11-19 66阅读
2024年真实有效能赚钱的app有哪些?盘点赚钱软件app排行榜前十名!

2024年真实有效能赚钱的ap

随着移动互联网的快速发展,赚钱的方式也

11-19 218阅读
TGA:DLC、拓展包、新赛季、重制版等均可提名所有奖项

TGA:DLC、拓展包、新赛季、

今日(11月16日),TGA主创Geoff Keighley与

11-19 73阅读
原子之心前期速刷神经聚合物的方法分享

原子之心前期速刷神经聚合

神经聚合物是原子之心游戏中用来解锁技

11-19 63阅读
原神林中遇变任务怎么做?原神林中遇变主线攻略

原神林中遇变任务怎么做?

林中遇变是原神须弥地区魔神主线任务的

11-19 62阅读
硬件情报站第156期:AMD锐龙9800X3D黄牛价翻倍 网友14900K送保被拒

硬件情报站第156期:AMD锐龙

11-19 74阅读