NVIDIA RTX™ GPU 低成本启动零售 AI 场景开发

3个月前 科技 21观看
摘要 零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。客户体验 A

零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。mwl喜好网-记录每日喜好的科技时尚娱乐生活

客户体验 AI 场景的研究目前集中在 AI 客服,内部流程主要是 AI 营销合同生成合规审查供应链优化等。在项目研究和前期预演阶段,采用 NVIDIA RTX™ 系列的高性能 GPU,进行本地化部署大模型,已经可以经济又高效地应对多数的 AI 场景开发。mwl喜好网-记录每日喜好的科技时尚娱乐生活

1、AI 客服场景与适配算力mwl喜好网-记录每日喜好的科技时尚娱乐生活

很多零售企业在转型中开始基于 DeepSeek 搭建客服,客服场景以对话交互为主,输入与输出较短,对并发、首字延迟有一定需求。接下来列举几个常用模型场景,以及我们所测试的算力方案数据。mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 选择模型 DeepSeek-R1 32B(FP16),采用4卡 NVIDIA RTX™ 5000 Ada(单卡32GB显存)的方案,可以支持约64个用户同时进行简单问答,来保障首字时延控制大约在1秒以内;采用 8卡 NVIDIA RTX™ 5000 Ada 则可以支持至120多个并发,首字时延保持在2秒以内。mwl喜好网-记录每日喜好的科技时尚娱乐生活

1.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技mwl喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 选择模型 DeepSeek-R1 70B(FP16),采用 8卡 NVIDIA RTX™ 5880 Ada(单卡48GB显存) 的平台方案,能够应对80多个并发,首字时延控制在3秒以内。mwl喜好网-记录每日喜好的科技时尚娱乐生活

2.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技mwl喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 通义千问 QWQ 32B 模型因其回答问题逻辑性强,逐渐被用户所认可,性能直逼 DeepSeek 满血版,采用4卡 NVIDIA RTX™ 5000 Ada (单卡32GB显存)时,并发数在100以内时,平均用户吞吐率可以达到 14 tokens/smwl喜好网-记录每日喜好的科技时尚娱乐生活

3.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技mwl喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。mwl喜好网-记录每日喜好的科技时尚娱乐生活

*数据测试环境:mwl喜好网-记录每日喜好的科技时尚娱乐生活

4卡测试环境:CPU:Intel(R)Xeon(R) w5-3433,内存:256GB DDR5,硬盘:1TB。mwl喜好网-记录每日喜好的科技时尚娱乐生活

8卡测试环境:CPU:英特尔® 至强® Silver 4314,内存:256GB DDR4,硬盘:3.84TB。mwl喜好网-记录每日喜好的科技时尚娱乐生活

2、AI 营销场景与适配算力mwl喜好网-记录每日喜好的科技时尚娱乐生活

依托 DeepSeek 模型逐步开发企业自有的智能营销工作流,可以极大地降本增效。该场景则以知识库场景为主,需要流畅地对海量文档、数据库信息进行检索和输出内容,长输入长输出场景居多,对于并发、时延、吞吐率都有一定要求。mwl喜好网-记录每日喜好的科技时尚娱乐生活

对于小型团队来说,采用4卡 NVIDIA RTX 5000 Ada 的机型方案,可以应对基本的扩散模型训练、文生图、文生视频等生成式 AI 设计需求,也能应对 AI 营销文案制作、数据分析处理等应用,可预期达到的性能效果如下:mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够支持64个并发,保证流畅地信息检索和输出;mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 采用通义千问 QWQ 32B (FP16)模型,长输入长输出的场景里,能够较好地支持到80个并发。mwl喜好网-记录每日喜好的科技时尚娱乐生活

4.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技mwl喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。mwl喜好网-记录每日喜好的科技时尚娱乐生活

对于大型项目或团队来说,搭载 8卡 NVIDIA RTX 5880 Ada 并行计算,预期的性能效果如下:mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够很好地支持80个并发;mwl喜好网-记录每日喜好的科技时尚娱乐生活

· 采用 DeepSeek-R1 70B(FP16)模型,长输入、长输出的场景中,可以较好地支持16个并发。mwl喜好网-记录每日喜好的科技时尚娱乐生活

5.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技mwl喜好网-记录每日喜好的科技时尚娱乐生活

*测试环境同上mwl喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。mwl喜好网-记录每日喜好的科技时尚娱乐生活

生成式 AI 设计项目中,ComfyUI 工作流可以较好地帮助企业快速地制作产品营销图/视频,更快地迭代营销方案。所涉及的模型如 SDXL,Flux 等,在高 batch size 情形下的训练和推理,GPU 显存建议在24GB以上。我们测试了一些 batch size 模型训练和推理的场景数据,供大家在 GPU 选型时做参考:mwl喜好网-记录每日喜好的科技时尚娱乐生活

6.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*以上数据使用电商数据集进行测试,数据来源于赞奇科技mwl喜好网-记录每日喜好的科技时尚娱乐生活

*数据测试环境:mwl喜好网-记录每日喜好的科技时尚娱乐生活

GPU: NVIDIA RTX 5000 Ada (32GB) *1 / NVIDIA RTX 5880 Ada (48GB) *1mwl喜好网-记录每日喜好的科技时尚娱乐生活

CPU: Intel i5-12600KF (3.7GHz) *1,mwl喜好网-记录每日喜好的科技时尚娱乐生活

内存:64GB,系统:win 11mwl喜好网-记录每日喜好的科技时尚娱乐生活

在生成式 AI+三维可视化结合开发产品配置器、线上导购、数字人导购员等数字孪生场景中,NVIDIA RTX GPU 既可以进行 AI 训练推理,又因为其具有 RT core,也可以用于支持图形可视化场景,这是其独到的优势。这类数字孪生的营销场景,需要由 NVIDIA RTX 5000 Ada 或 NVIDIA RTX 5880 Ada 来做助力,才能运行得起较为复杂的模型和高并发的场景。mwl喜好网-记录每日喜好的科技时尚娱乐生活

3、其他 AI 应用场景mwl喜好网-记录每日喜好的科技时尚娱乐生活

其他 AI 应用场景例如合同生成、合规审查、供应链优化、用户行为分析等,需要实时处理大量数据,进行复杂的模型推理与分析,可采取四卡乃至八卡 NVIDIA RTX 5880 Ada 的方案,凭借高显存与超强的并行计算能力来执行较为复杂的 AI 任务。例如合同生成,同样也是大语言模型推理中,主要涉及长输入、长输出的场景,数据可参考上方 AI 营销场景的数据。mwl喜好网-记录每日喜好的科技时尚娱乐生活

供应链优化、用户行为分析等场景,需具体依据用户的数据库、系统等信息来做判断,赞奇目前开放免费为用户咨询评估,具体可点击下方链接登记。mwl喜好网-记录每日喜好的科技时尚娱乐生活

https://rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQbmwl喜好网-记录每日喜好的科技时尚娱乐生活

7.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

以上数据均为测试得出,为用户高效地选型提供参考。但涉及到用户的多重场景和特殊需求,建议大家提前做机器测试,以调整至最优方案。下面列出上方提到的两个型号显卡的具体参数。mwl喜好网-记录每日喜好的科技时尚娱乐生活

这两个型号均为 NVIDIA RTX Ada Lovelace 架构的顶配显卡,AI 能力与图形性能都远远超过了上一代安培架构“卡皇”——NVIDIA RTX™ A6000mwl喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA RTX 系列高性能显卡参数概览mwl喜好网-记录每日喜好的科技时尚娱乐生活

8.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。mwl喜好网-记录每日喜好的科技时尚娱乐生活

技术支持mwl喜好网-记录每日喜好的科技时尚娱乐生活

9.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

10.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

11.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

12.jpgmwl喜好网-记录每日喜好的科技时尚娱乐生活

mwl喜好网-记录每日喜好的科技时尚娱乐生活

mwl喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
模型能力比肩OpenAI-o1 夸克全新“AI搜题”让新题、难题都有解

模型能力比肩OpenAI-o1 夸克全新

【锋巢网】随着AI融入学习场景,诸

11-19 136阅读
轻薄手机用上潜望!曝vivo S20系列首次搭载潜望长焦镜头

轻薄手机用上潜望!曝vivo S20系列

11月1

11-19 121阅读
‌TCL华星宣布印刷OLED量产及APEX技术品牌‌

‌TCL华星宣布印刷OLED量产及APE

11-19 111阅读
52岁浙商要搞AD钙奶,宗馥莉又有一战

52岁浙商要搞AD钙奶,宗馥莉又有一

带领

11-19 106阅读
长沙缓过来了

长沙缓过来了

2024

11-19 100阅读
()

()

血珀,一直是很多玩琥珀的朋友的心

11-19 103阅读
李子柒被质疑漆器做假,发出过敏照片力证,全身红肿成“电视机”

李子柒被质疑漆器做假,发出

2024年11月12日停更长达三年的李子柒

11-19 126阅读
余顺《不越雷池》 尘世清浊,做个正人只能不怕难 黄梅戏(余顺不越雷池尘世清浊)

余顺《不越雷池》 尘世清

戏剧|DRAMA 昨晚在国家大剧

11-19 107阅读
董明珠称训员工被指霸道很好笑:企业管理者声音大点还没这个话语权了

董明珠称训员工被指霸道很

11月16日消息,之

11-19 118阅读
全新《柯南》动画上线:侦探与怪盗抢王者水晶

全新《柯南》动画上线:侦探

11月18日消息,《

11-19 103阅读
大宇资讯恐怖游戏《咒》今日Steam全球同步上市

大宇资讯恐怖游戏《咒》今

恐怖游戏大厂-大宇资讯宣布,改编自台湾

11-19 129阅读
和平精英跳伞怎么快速落地?和平精英跳伞技巧

和平精英跳伞怎么快速落地

《和平精英》游戏中玩家将通过跳伞进入

11-19 130阅读
奥特曼格斗进化0怎么获得奥特之父?奥特曼格斗进化0解锁奥父教程

奥特曼格斗进化0怎么获得

《奥特曼格斗进化0》游戏中玩家可以操

11-19 208阅读
原子之心激光模块解谜攻略

原子之心激光模块解谜攻略

原子之心游戏里面有一个被动安保激光模

11-19 116阅读
原神流转存续的花神诞祭主线任务攻略

原神流转存续的花神诞祭主

流转存续的花神诞祭是原神须弥地区魔神

11-19 131阅读