Together AI 的增强功能使得 AI 微调更快更便捷

3个月前 科技 22观看
摘要 Together Computer Inc. 今天推出了其 Fine-Tuning Platform(微调平台)的一项重大更新,旨在让开发者能够以更低廉且便捷的方式,随着时间的推移调整开源大语言模型。这家以 Together AI 名义运营

Together Computer Inc. 今天推出了其 Fine-Tuning Platform(微调平台)的一项重大更新,旨在让开发者能够以更低廉且便捷的方式,随着时间的推移调整开源大语言模型。HSX喜好网-记录每日喜好的科技时尚娱乐生活

这家以 Together AI 名义运营的初创公司经营着一个针对 AI 模型开发优化的公有云。新增功能支持在浏览器内进行微调,从而无需安装 Python 软件开发工具包或调用应用程序接口。HSX喜好网-记录每日喜好的科技时尚娱乐生活

公司还新增了对直接偏好优化微调的支持,以及通过单个命令从先前运行结果中启动微调作业的功能。同时,其也调整了定价以降低训练成本。HSX喜好网-记录每日喜好的科技时尚娱乐生活

Together AI 表示,这些更新反映了他们的信念: AI 模型不应是静态的,而应与所服务的应用程序共同进化。基于浏览器的界面允许开发者在无需编写任何代码的情况下启动微调作业。此前,这类任务需要额外的设置和专业技能。开发者可以上传数据集、定义训练参数并跟踪实验,从而降低持续微调的门槛。HSX喜好网-记录每日喜好的科技时尚娱乐生活

Together AI 的微调产品负责人 Anirudh Jain 表示:“虽然质量上没有固有提升,因为底层方法与通过 API 进行微调完全相同,但基于浏览器的流程消除了脚本编写的需要,并将整个过程简化为直观的无代码体验。这使得非技术用户也能轻松进行微调,并比手动使用 API 的方法节省大约 50% 的时间。”他还指出,Python SDK 和 API 仍然可用,但并非必需。HSX喜好网-记录每日喜好的科技时尚娱乐生活

Preference-based training 直接偏好优化是一种利用偏好数据训练语言模型的方法,在这种方法中,模型会针对同一提示同时展示一个较优响应与一个较差响应。模型不再仅仅模仿固定答案,而是通过对比损失函数,根据人类反馈学习偏好某些响应。该方法教会模型在其表示空间中将相似内容拉近距离,而将不相似内容推远。HSX喜好网-记录每日喜好的科技时尚娱乐生活

Jain 说:“监督微调(SFT)帮助模型学会应说什么,而直接偏好优化(DPO)则教会模型不该说什么。”在使用标注的输入/输出对时,通常采用监督微调,而当训练数据包含来自人工评分者或 A/B 测试的偏好信息时,则采用 DPO。HSX喜好网-记录每日喜好的科技时尚娱乐生活

与传统的强化学习技术不同,DPO 无需额外构建单独的奖励模型,因此其实现更为简单、迅速且稳定。开发者可以微调模型,使其更加符合用户与应用程序交互的方式,从而提升准确性和可信度。HSX喜好网-记录每日喜好的科技时尚娱乐生活

持续训练允许开发者从先前训练的模型检查点继续进行微调。此功能对于随着时间的推移不断完善模型,或运行结合指令微调与偏好优化等方法的多阶段训练工作流非常有用。调用方式是通过引用先前训练作业的任务 ID,并从上一次任务结束后继续构建。HSX喜好网-记录每日喜好的科技时尚娱乐生活

Jain 表示:“这大幅提升了效率和成本效益,使得模型迭代和改进的速度更快。”HSX喜好网-记录每日喜好的科技时尚娱乐生活

平台的另一个改进允许开发者为对话数据中的消息分配不同权重,从而在不将其完全从训练上下文中移除的前提下,对某些响应进行降低优先级或忽略。同时,全新的余弦学习率调度器为训练动态提供了更大的灵活性和更精细的控制。HSX喜好网-记录每日喜好的科技时尚娱乐生活

公司表示,对平台数据预处理引擎的更新已使大规模训练任务的性能提高最多达 32%,而小规模任务提高约 17%。HSX喜好网-记录每日喜好的科技时尚娱乐生活

为了帮助小团队及独立开发者更便捷地尝试定制的大语言模型,Together AI 现还提供按需付费的定价模式,无最低消费限制。价格会根据模型大小和训练方法而有所不同。HSX喜好网-记录每日喜好的科技时尚娱乐生活

目前,该平台支持对流行的开源模型进行微调,包括 Llama 3、Gemma 和 DeepSeek-R1 变体。公司表示未来计划支持更大规模的模型,如 Llama 4 及未来的 DeepSeek 版本。HSX喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
比亚迪成全球首家达成第1000万辆新能源汽车下线车企

比亚迪成全球首家达成第1000万辆

11月1

11-19 123阅读
大厂离职博主,卷向海外

大厂离职博主,卷向海外

离开

11-19 122阅读
大佬喊话,AI寒冬已来?

大佬喊话,AI寒冬已来?

OpenA

11-19 109阅读
93亿并购,“弟弟”成了“爹”

93亿并购,“弟弟”成了“爹”

11月1

11-19 111阅读
郎酒大战夜郎古,一个字2亿元

郎酒大战夜郎古,一个字2亿元

不是

11-19 106阅读
2012年,“非诚勿扰”女高朋王佳暴虐杀害丈夫,如今快要出狱了

2012年,“非诚勿扰”女高朋

11-19 125阅读
山东卫视《中华家庭诗词擂台赛》 共品大宋“战狼”辛弃疾的峥嵘岁月

山东卫视《中华家庭诗词擂

  “品诗词之美,传诗礼家风”,由山东

11-19 107阅读
消失三年 复出还是顶流!李子柒为何无法替代

消失三年 复出还是顶流!李

停更三年后,昨日,

11-19 130阅读
苦等七年终于来了!《白夜破晓》长丰集结海报出炉:潘粤明主演

苦等七年终于来了!《白夜破

11月17日消息,时

11-19 97阅读
《猫眼三姐妹》动画将重制!童年三女神高清归来!

《猫眼三姐妹》动画将重制

近日有报道称,北

11-19 108阅读
真人互动恋爱影游《欢迎光临!心动咖啡厅》Steam页面开放 发行日期待定

真人互动恋爱影游《欢迎光

今日(11月16日),真人互动恋爱影游《欢迎

11-19 117阅读
海龟汤恐怖题目和答案全套汇总推荐(2024)

海龟汤恐怖题目和答案全套

《海龟汤》是年轻人之间最新的热门社交

11-19 501阅读
原子之心激光模块解谜攻略

原子之心激光模块解谜攻略

原子之心游戏里面有一个被动安保激光模

11-19 116阅读
原子之心武器蓝图攻略_全武器蓝图获取方法详细介绍

原子之心武器蓝图攻略_全

原子之心游戏里面玩家可以通过获取武器

11-19 112阅读
功耗低+性能强 双十一AMD锐龙9000处理器省钱游戏套装推荐

功耗低+性能强 双十一AMD

11-19 123阅读