NVIDIA RTX™ GPU 低成本启动零售 AI 场景开发

1周前 科技 4观看
摘要 零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。客户体验 A

零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。StH喜好网-记录每日喜好的科技时尚娱乐生活

客户体验 AI 场景的研究目前集中在 AI 客服,内部流程主要是 AI 营销合同生成合规审查供应链优化等。在项目研究和前期预演阶段,采用 NVIDIA RTX™ 系列的高性能 GPU,进行本地化部署大模型,已经可以经济又高效地应对多数的 AI 场景开发。StH喜好网-记录每日喜好的科技时尚娱乐生活

1、AI 客服场景与适配算力StH喜好网-记录每日喜好的科技时尚娱乐生活

很多零售企业在转型中开始基于 DeepSeek 搭建客服,客服场景以对话交互为主,输入与输出较短,对并发、首字延迟有一定需求。接下来列举几个常用模型场景,以及我们所测试的算力方案数据。StH喜好网-记录每日喜好的科技时尚娱乐生活

· 选择模型 DeepSeek-R1 32B(FP16),采用4卡 NVIDIA RTX™ 5000 Ada(单卡32GB显存)的方案,可以支持约64个用户同时进行简单问答,来保障首字时延控制大约在1秒以内;采用 8卡 NVIDIA RTX™ 5000 Ada 则可以支持至120多个并发,首字时延保持在2秒以内。StH喜好网-记录每日喜好的科技时尚娱乐生活

1.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技StH喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。StH喜好网-记录每日喜好的科技时尚娱乐生活

· 选择模型 DeepSeek-R1 70B(FP16),采用 8卡 NVIDIA RTX™ 5880 Ada(单卡48GB显存) 的平台方案,能够应对80多个并发,首字时延控制在3秒以内。StH喜好网-记录每日喜好的科技时尚娱乐生活

2.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技StH喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。StH喜好网-记录每日喜好的科技时尚娱乐生活

· 通义千问 QWQ 32B 模型因其回答问题逻辑性强,逐渐被用户所认可,性能直逼 DeepSeek 满血版,采用4卡 NVIDIA RTX™ 5000 Ada (单卡32GB显存)时,并发数在100以内时,平均用户吞吐率可以达到 14 tokens/sStH喜好网-记录每日喜好的科技时尚娱乐生活

3.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技StH喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。StH喜好网-记录每日喜好的科技时尚娱乐生活

*数据测试环境:StH喜好网-记录每日喜好的科技时尚娱乐生活

4卡测试环境:CPU:Intel(R)Xeon(R) w5-3433,内存:256GB DDR5,硬盘:1TB。StH喜好网-记录每日喜好的科技时尚娱乐生活

8卡测试环境:CPU:英特尔® 至强® Silver 4314,内存:256GB DDR4,硬盘:3.84TB。StH喜好网-记录每日喜好的科技时尚娱乐生活

2、AI 营销场景与适配算力StH喜好网-记录每日喜好的科技时尚娱乐生活

依托 DeepSeek 模型逐步开发企业自有的智能营销工作流,可以极大地降本增效。该场景则以知识库场景为主,需要流畅地对海量文档、数据库信息进行检索和输出内容,长输入长输出场景居多,对于并发、时延、吞吐率都有一定要求。StH喜好网-记录每日喜好的科技时尚娱乐生活

对于小型团队来说,采用4卡 NVIDIA RTX 5000 Ada 的机型方案,可以应对基本的扩散模型训练、文生图、文生视频等生成式 AI 设计需求,也能应对 AI 营销文案制作、数据分析处理等应用,可预期达到的性能效果如下:StH喜好网-记录每日喜好的科技时尚娱乐生活

· 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够支持64个并发,保证流畅地信息检索和输出;StH喜好网-记录每日喜好的科技时尚娱乐生活

· 采用通义千问 QWQ 32B (FP16)模型,长输入长输出的场景里,能够较好地支持到80个并发。StH喜好网-记录每日喜好的科技时尚娱乐生活

4.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技StH喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。StH喜好网-记录每日喜好的科技时尚娱乐生活

对于大型项目或团队来说,搭载 8卡 NVIDIA RTX 5880 Ada 并行计算,预期的性能效果如下:StH喜好网-记录每日喜好的科技时尚娱乐生活

· 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够很好地支持80个并发;StH喜好网-记录每日喜好的科技时尚娱乐生活

· 采用 DeepSeek-R1 70B(FP16)模型,长输入、长输出的场景中,可以较好地支持16个并发。StH喜好网-记录每日喜好的科技时尚娱乐生活

5.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*测试数据来源:赞奇科技StH喜好网-记录每日喜好的科技时尚娱乐生活

*测试环境同上StH喜好网-记录每日喜好的科技时尚娱乐生活

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。StH喜好网-记录每日喜好的科技时尚娱乐生活

生成式 AI 设计项目中,ComfyUI 工作流可以较好地帮助企业快速地制作产品营销图/视频,更快地迭代营销方案。所涉及的模型如 SDXL,Flux 等,在高 batch size 情形下的训练和推理,GPU 显存建议在24GB以上。我们测试了一些 batch size 模型训练和推理的场景数据,供大家在 GPU 选型时做参考:StH喜好网-记录每日喜好的科技时尚娱乐生活

6.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*以上数据使用电商数据集进行测试,数据来源于赞奇科技StH喜好网-记录每日喜好的科技时尚娱乐生活

*数据测试环境:StH喜好网-记录每日喜好的科技时尚娱乐生活

GPU: NVIDIA RTX 5000 Ada (32GB) *1 / NVIDIA RTX 5880 Ada (48GB) *1StH喜好网-记录每日喜好的科技时尚娱乐生活

CPU: Intel i5-12600KF (3.7GHz) *1,StH喜好网-记录每日喜好的科技时尚娱乐生活

内存:64GB,系统:win 11StH喜好网-记录每日喜好的科技时尚娱乐生活

在生成式 AI+三维可视化结合开发产品配置器、线上导购、数字人导购员等数字孪生场景中,NVIDIA RTX GPU 既可以进行 AI 训练推理,又因为其具有 RT core,也可以用于支持图形可视化场景,这是其独到的优势。这类数字孪生的营销场景,需要由 NVIDIA RTX 5000 Ada 或 NVIDIA RTX 5880 Ada 来做助力,才能运行得起较为复杂的模型和高并发的场景。StH喜好网-记录每日喜好的科技时尚娱乐生活

3、其他 AI 应用场景StH喜好网-记录每日喜好的科技时尚娱乐生活

其他 AI 应用场景例如合同生成、合规审查、供应链优化、用户行为分析等,需要实时处理大量数据,进行复杂的模型推理与分析,可采取四卡乃至八卡 NVIDIA RTX 5880 Ada 的方案,凭借高显存与超强的并行计算能力来执行较为复杂的 AI 任务。例如合同生成,同样也是大语言模型推理中,主要涉及长输入、长输出的场景,数据可参考上方 AI 营销场景的数据。StH喜好网-记录每日喜好的科技时尚娱乐生活

供应链优化、用户行为分析等场景,需具体依据用户的数据库、系统等信息来做判断,赞奇目前开放免费为用户咨询评估,具体可点击下方链接登记。StH喜好网-记录每日喜好的科技时尚娱乐生活

https://rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQbStH喜好网-记录每日喜好的科技时尚娱乐生活

7.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

以上数据均为测试得出,为用户高效地选型提供参考。但涉及到用户的多重场景和特殊需求,建议大家提前做机器测试,以调整至最优方案。下面列出上方提到的两个型号显卡的具体参数。StH喜好网-记录每日喜好的科技时尚娱乐生活

这两个型号均为 NVIDIA RTX Ada Lovelace 架构的顶配显卡,AI 能力与图形性能都远远超过了上一代安培架构“卡皇”——NVIDIA RTX™ A6000StH喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA RTX 系列高性能显卡参数概览StH喜好网-记录每日喜好的科技时尚娱乐生活

8.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。StH喜好网-记录每日喜好的科技时尚娱乐生活

技术支持StH喜好网-记录每日喜好的科技时尚娱乐生活

9.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

10.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

11.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

12.jpgStH喜好网-记录每日喜好的科技时尚娱乐生活

StH喜好网-记录每日喜好的科技时尚娱乐生活

StH喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
年轻人的失眠症,正在被包装成“熬夜经济”

年轻人的失眠症,正在被包装成“熬

最近一段时间,各大奶茶店纷纷开启

11-19 65阅读
“鲶鱼”雷军:抖音粉丝突破3000万,换一种方式卷同行?

“鲶鱼”雷军:抖音粉丝突破3000万

在流

11-19 55阅读
一家城配自动驾驶服务商,融了7个亿丨投融周报

一家城配自动驾驶服务商,融了7个

大家

11-19 63阅读
1元水,巨头们的游戏

1元水,巨头们的游戏

今年

11-19 67阅读
致命错误!Sam Altman发一张对比图,遭到大量吐槽

致命错误!Sam Altman发一张对比图

图片来源:由无界AI生成OpenAI联合

11-19 70阅读
安倍遇刺事件的态度问题(安倍遇刺事件的态度问题)

安倍遇刺事件的态度问题(安

安倍遇刺事件的态度问题 刘明

11-19 59阅读
《令人心动的offer6》:职综天花板如何让英雄主义落地现实

《令人心动的offer6》:职综

  《令人心动的offer》第六季以豆瓣

11-19 59阅读
2024花田音乐节燃爆金乡卫城,重磅阵容嗨唱两天狂欢不停

2024花田音乐节燃爆金乡卫

  11月23至24日,金乡卫城·花

11-19 64阅读
零容忍!税务部门公布3起网络主播偷税被处罚案件

零容忍!税务部门公布3起网

11月15日消息,近

11-19 65阅读
不愧是中国第一网红!李子柒油管日收入预估超8万:停更期间单月广告分成超78万

不愧是中国第一网红!李子柒

11月14日消息,据

11-19 57阅读
2024年真实有效能赚钱的app有哪些?盘点赚钱软件app排行榜前十名!

2024年真实有效能赚钱的ap

随着移动互联网的快速发展,赚钱的方式也

11-19 200阅读
饥荒通过卡猪人快速回复san值的详细操作方法

饥荒通过卡猪人快速回复sa

饥荒游戏里面玩家经常会面对san值不足

11-19 62阅读
饥荒san值怎么恢复?饥荒恢复san值的途径一览

饥荒san值怎么恢复?饥荒恢

san值是饥荒游戏里面的一个重要数值,玩

11-19 67阅读
饥荒中毒了怎么解毒?饥荒解除中毒状态的详细操作方法

饥荒中毒了怎么解毒?饥荒

饥荒中毒了怎么解毒?在饥荒游戏中玩家偶

11-19 61阅读
饥荒南瓜可以做什么?饥荒超全南瓜食谱分享

饥荒南瓜可以做什么?饥荒

南瓜是饥荒游戏里面的一种蔬菜,玩家可以

11-19 64阅读