OpenAI抨击的“蒸馏”技术 很多大型AI公司正争着用

5个月前 科技 25观看
摘要 大型公司也开始利用蒸馏技术北京时间3月3日,当DeepSeek在今年初凭借低成本模型一鸣惊人时,OpenAI曾在没有证据的情况下指控DeepSeek违规“蒸馏”。据《金融时报》报道,包括OpenAI、微软和Meta

大型公司也开始利用蒸馏技术rE5喜好网-记录每日喜好的科技时尚娱乐生活

大型公司也开始利用蒸馏技术rE5喜好网-记录每日喜好的科技时尚娱乐生活

北京时间3月3日,当DeepSeek在今年初凭借低成本模型一鸣惊人时,OpenAI曾在没有证据的情况下指控DeepSeek违规“蒸馏”。据《金融时报》报道,包括OpenAI、微软和Meta在内的领先AI公司正转用“蒸馏”技术,以便在全球竞争中开发出更便宜、便于消费者和企业采用的AI模型。rE5喜好网-记录每日喜好的科技时尚娱乐生活

通过蒸馏技术,企业使用一个被称为“教师”模型的大语言模型生成数据,然后用这些数据训练一个较小的“学生”模型,从而快速将大模型的知识和预测能力转移到较小的模型上。rE5喜好网-记录每日喜好的科技时尚娱乐生活

虽然蒸馏技术已被广泛应用多年,但是近期的进展使得业内专家相信,对于寻求以经济高效的方法来开发大模型应用的创业公司来说,这项技术将逐渐成为他们的福音。rE5喜好网-记录每日喜好的科技时尚娱乐生活

“蒸馏技术相当神奇,”OpenAI平台产品负责人奥利维尔·戈德门特(Olivier Godement)表示,“其本质上是利用一个非常庞大且智能的前沿模型来训练一个较小的模型……使其在特定任务上具备极强的能力,同时成本极低,执行速度极快。”rE5喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI的GPT-4,谷歌Gemini和Meta的Llama等大语言模型需要海量数据和算力来开发和维护。虽然这些公司尚未披露训练大模型的具体成本,但很可能高达数亿美元。借助蒸馏技术,开发者和企业可以以极低的成本获取这些模型的能力,使应用开发者能够在笔记本电脑和智能手机等设备上快速运行AI模型。rE5喜好网-记录每日喜好的科技时尚娱乐生活

【来源:凤凰网科技rE5喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
抖音电商拐点已至,从美妆行业开始跌落?

抖音电商拐点已至,从美妆行业开始

前几日,抖音首次公布了“双11”大

11-19 120阅读
辽宁省40+高校升级5.5G:上传提升2倍 下载快4.2Gbps

辽宁省40+高校升级5.5G:上传提升2

11月18日

11-19 109阅读
‌全新宝马2系Gran Coupé国产版明年上市

‌全新宝马2系Gran Coupé国产版

11-19 125阅读
凯迪拉克公布2026款Vistiq电动SUV细节,明年上市

凯迪拉克公布2026款Vistiq电动SU

11-19 120阅读
李子柒复更,三大平台提前过年

李子柒复更,三大平台提前过年

停更1

11-19 106阅读
《永夜星河》三折叠剧情,怎么「折」都有面儿

《永夜星河》三折叠剧情,怎

作者 / 郑容和编辑 / 朱   婷运营

11-19 108阅读
安倍遇刺事件的态度问题(安倍遇刺事件的态度问题)

安倍遇刺事件的态度问题(安

安倍遇刺事件的态度问题 刘明

11-19 111阅读
《山河之影》是耽改吗?谢铿然最后是不是下线了?

《山河之影》是耽改吗?谢铿

电视剧《山河之影》是你根据同名

11-19 112阅读
我们都在等待,等待钟声响起的那一刻。那是我生命最后的一刻,那也是最好的时刻

我们都在等待,等待钟声响起

  一段民族不可遗忘的历史,一个隐蔽

11-19 107阅读
2024年全球票房十强!电影《毒液:最后一舞》中国票房破6亿

2024年全球票房十强!电影《

11月13日消息,根

11-19 107阅读
动作射击新作《Kusan: City Of Wolves》公布 2026年发售

动作射击新作《Kusan: Cit

韩国开发商CIRCLEfromDOT与英国发行商

11-19 116阅读
《勇者斗恶龙3重制版》发售再度引发社会现象 DQ休假燃起

《勇者斗恶龙3重制版》发

日本国民RPG《勇者斗恶龙》系列呼声最

11-19 123阅读
空洞骑士地图探索顺序_空洞骑士速通地图探索顺序

空洞骑士地图探索顺序_空

《空洞骑士》是一款以探索为核心的2D动

11-19 106阅读
奥特曼格斗进化0怎么放大招?奥特曼格斗进化0攻略

奥特曼格斗进化0怎么放大

《奥特曼格斗进化0》游戏中可以操控各

11-19 152阅读
原神5个战斗性隐藏成就攻略

原神5个战斗性隐藏成就攻

5个战斗性成就是原神须弥地区的隐藏任

11-19 116阅读