百川智能发布全场景深度思考模型Baichuan-M1-preview：聚齐三大推理能力，解锁医疗循证模式-喜好网-记录每日喜好的科技时尚娱乐生活

百川智能发布全场景深度思考模型Baichuan-M1-preview：聚齐三大推理能力，解锁医疗循证模式

6个月前科技 50观看

摘要 1月24日消息，据百川大模型公众号消息，百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测

1月24日消息，据百川大模型公众号消息，百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中，Baichuan-M1-preview的表现均超越了o1-preview，展现了其在多领域推理方面的独特优势。

此外，作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型，它还解锁了医疗循证模式，实现了从医疗证据检索到深度推理的完整端到端服务，能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-preview现已在百小应中正式上线，在深度思考模式下不仅能准确解答数学、代码、逻辑推理等问题，面对复杂医疗问题，还能像资深医疗专家一样，通过深度思考构建严谨的医学推理过程，为用户提供全面的疾病分析和个性化健康管理建议。

为了更好地繁荣AI医疗生态，助力医疗事业发展，百川智能还同时推出了行业首个开源医疗增强大模型Baichuan-M1-14B，其医疗能力超越了更大参数量的Qwen2.5-72B，与o1-mini相差无几。

多项能力超越o1-preview，解锁医疗循证模式

作为一个全场景深度思考模型，Baichuan-M1-preview的能力全面，具备强大的语言推理、视觉推理及搜索推理能力。语言推理方面，其在AIME和Math等数学基准测试，以及LiveCodeBench代码任务上的成绩均超越了o1-preview等模型。

视觉推理方面，在MMMU-val、MathVista等权威评测中的成绩，超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。

Baichuan-M1-preview的另一大亮点是解锁了医疗循证模式。在面对复杂医学问题时，会将专业可靠的医疗知识作为推理依据，帮助用户做出最佳的医疗决策。

为实现这一能力，百川智能自建了涵盖亿级条目的循证医学知识库，囊括了国内外海量医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容，且以天为单位进行动态更新，及时收录医疗领域的新突破、新进展。

众所周知，医学知识多样性强、因果关系复杂。因此，即使构建了庞大的医疗知识库，在调用其中的医学知识，尤其叠加了互联网上搜索到的医疗信息时依然会遇到部分医学数据、医学理论不一致的情况。

针对这一问题，医疗循证模式能运用医学知识和证据评估标准，对证据进行多层分级，并对不同权威等级的证据进行专业分析与整合，精准识别各类权威信息的来源和可信度，从而避免因信息混杂导致的误判，然后基于这些医学证据进行可靠、准确的医学推理，最终提供可信赖的医疗答案。

通过“医疗循证模式”，Baichuan-M1-preview实现了从证据检索到深度推理的完整端到端服务，能够有效地解决医疗场景中信息过载、不确定性和碎片化等痛点。无论是医生面对复杂病案，还是患者寻求权威建议，它都能通过“摆事实、讲道理”的循证方式提供言之有物、有理有据的解答。不仅能在临床场景中帮助医生提升诊疗效率，在医学科研场景中大幅缩短科研探索时间，还能帮助普通用户更好地理解自身健康状况，帮助患者科学管理生活方式，提升治疗效果。

行业首个开源医疗增强通用大模型，Baichuan-M1-14B医疗能力超越Qwen2.5-72B

为了推动AI技术在医疗领域的创新发展，增强AI医疗技术的透明度和可信性，提高医疗服务的可及性，繁荣AI医疗生态，百川智能还开源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

作为行业首个开源医疗增强通用大模型Baichuan-M1-14B的表现非常优异，不仅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct，并且与o1-mini也相差无几。

为了提升Baichuan-M1-14B的医疗能力，百川智能多管齐下：数据构建方面，面向细分医疗场景，收集了万亿级 token 的严肃医疗数据，涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例，亿级的医疗问答、医疗问诊、临床数据等，还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估，确保模型能学习到有价值且全面的医疗知识。

在此基础上，百川智能还针对病例、医学教材、医学指南等不同类别的高质量医疗数据生成了超千亿 token 的多样化数据，包含了医疗复杂决策推理链条、决策依据以及问答对等多样化形式。这些合成数据拥有丰富的知识呈现形式以及与医生一致的思维过程，进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

进入到模型训练阶段，百川智能运用行业首创的多阶段领域提升方案，将整个训练过程分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段，依次提升模型的基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO强化学习法，优化思维链路径，避免传统奖励模型偏差，有效提升了模型的生成质量与逻辑推理能力。

Baichuan-M1-preview是百川智能在AI医疗领域的又一次重要突破，为其实现“造医生、改路径、促医学”的AI医疗愿景提供了有力支撑。于此同时，Baichuan-M1-14B开源模型则为中国AI医疗健康生态建设提供了强大助力。百川智能不仅希望加速AI技术在医疗领域的广泛应用，更旨在激发更多创新力量，共同推动中国医疗健康生态的持续进步，助力实现更公平、更高效的高质量医疗服务。