天气预报大模型,谷歌DeepMind初见成效

8个月前 科技 49观看
摘要 作为谷歌DeepMind推出的一款全新AI产品,GenCast对于天气状况的预测准确度已经能够与传统天气预报比肩。根据最近发表的研究结果,在使用2019年的数据进行测试时,它的表现足以跻身领先的预报模型

作为谷歌DeepMind推出的一款全新AI产品,GenCast对于天气状况的预测准确度已经能够与传统天气预报比肩。根据最近发表的研究结果,在使用2019年的数据进行测试时,它的表现足以跻身领先的预报模型。2zF喜好网-记录每日喜好的科技时尚娱乐生活

AI虽不可能在短期之内取代传统预报系统,但却能够在天气预测和严重气象灾害预警等方面为现有工具库提供有力的支撑和充实。GenCast只是当前正在开发的多款AI天气预报模型之一,相信它们的发展成熟将带来更为准确的气象预报能力。2zF喜好网-记录每日喜好的科技时尚娱乐生活

DeepMind高级研究科学家Ilan Price指出:“我们生活中的方方面面几乎都摆脱不开天气的影响……因此天气预测也成为一项重大科学挑战。谷歌DeepMind矢志于推动AI科技造福人类。我认为天气预测既是践行这一使命的重要方式,也将为人类社会做出切实贡献。”2zF喜好网-记录每日喜好的科技时尚娱乐生活

Price和他的同事们将GenCast与ENS系统进行了对比测试。ENS系统是欧洲中期天气预报中心(ECMWF)运营的全球顶级预报模型之一。根据本周发表在《自然》杂志上的一项研究,GenCast的表现优于ENS的概率高达97.2%。2zF喜好网-记录每日喜好的科技时尚娱乐生活

GenCast则是一款机器学习天气预报模型,基于1979年至2018年间收集的天气数据训练而成。该模型学习并识别出过往四十年历史数据中的模式,并运用这些模式预测未来可能发生的情况。也就是说从原理层面,GenCast与ENS等传统模型的工作方式截然不同——后者仍然依赖超级计算机求解复杂议程来模拟大气物理。在测试中,GenCast与ENS分别生成集合预报,给出一系列可能出现的天气状况。2zF喜好网-记录每日喜好的科技时尚娱乐生活

例如在预测热带气旋路径时,GenCast平均可以提前12小时发出预警。GenCast在预测气旋轨迹、极端天气及风力等级等方面表现更好,最多可提前15天做出预测。2zF喜好网-记录每日喜好的科技时尚娱乐生活

天气预报大模型,谷歌DeepMind初见成效2zF喜好网-记录每日喜好的科技时尚娱乐生活

但需要注意的是,GenCast是针对旧版ENS进行对比测试,而目前实际运行的已经是分辨率更高的新版ENS。这项同行评审研究将GenCast的预测结果与2019年版本的ENS进行了比较,旨在了解各模型对当年真实天气状况的判断是否准确。ECMWF机器学习协调员Matt Chantry表示,ENS系统自2019年以来同样迎来显著改进,因此很难说GenCast当前的表现是否优于新版ENS。2zF喜好网-记录每日喜好的科技时尚娱乐生活

但可以肯定的是,分辨率并不是做出有力预测的唯一重要因素。ENS在2019年时的分辨率就已略高于GenCast,但仍在对比测试中落败。DeepMind方面指出,他们对2020年至2022年的数据也进行了类似的研究,得出的结果也基本相同,只是此项研究尚未经过同行评审。但由于拿不到相应数据,2023年未被纳入测试范围,而ENS系统正是在这一年开始以更高分辨率运行。2zF喜好网-记录每日喜好的科技时尚娱乐生活

GenCast将世界划分成一套复杂的网格,以0.25度的分辨率运行——也就是该网格上的每个单元格,对应四分之一纬度乘以四分之一经度的面积。相比之下,ENS在2019年时的分辨率为0.2度,目前的分辨率则进一步改进至0.1度。2zF喜好网-记录每日喜好的科技时尚娱乐生活

尽管如此,Chantry在一封电子邮件声明中宣称,GenCast的发展仍然“标志着天气预报发展道路上的一个重要里程碑”。除了ENS之外,ECMWF表示他们也在运行自己的机器学习预报系统。Chantry称该项目“从GenCast中汲取了一些灵感”。2zF喜好网-记录每日喜好的科技时尚娱乐生活

GenCast的另一个优势则体现在速度上。它可以在短短八分钟之内使用单个Google Cloud TPU v5生成一份未来15天的预报。而像ENS这样基于物理定律的模型可能需要几个小时才能完成同样的计算。GenCast绕过了ENS需要解决的所有方程式,因此能够花费更少的时间、占用更低的算力资源以生成预测结果。2zF喜好网-记录每日喜好的科技时尚娱乐生活

Price指出:“从计算角度来看,与GenCast这样的模型相比,运行传统预测的成本要高出几个数量级。”2zF喜好网-记录每日喜好的科技时尚娱乐生活

这样的效率优势,有望缓解人们对于高能耗AI数据中心对于环境影响的担忧。此类数据中心已经导致谷歌公司近年来温室气体排放量的持续攀升。但单纯着眼于预测阶段的能耗还远远不够,如果不计入机器学习模型训练期间消耗的能源,就无法判断GenCast与传统基于物理定律的预报模型间到底存在多大的可持续性差异。2zF喜好网-记录每日喜好的科技时尚娱乐生活

必须承认,GenCast仍有很大的改进空间,包括进一步扩展至更高分辨率。此外,GenCast以12小时为间隔发布预测,而传统模型往往能够匹配更短的发布间隔。这往往会影响到预测结果在现实世界中的应用方式(例如评估风力等级可能达到怎样的水平)。2zF喜好网-记录每日喜好的科技时尚娱乐生活

佛罗里达大学气象学助理教学教授Stephen Mullens(并未参与GenCast研究)表示:“我们希望了解一整天的风向走势,而不仅仅是上午6点和下午6点各检测一次。”2zF喜好网-记录每日喜好的科技时尚娱乐生活

虽然人们对于如何使用AI来改善预报越来越抱有兴趣,但AI模型仍需要更多实际表现来证明自己。Mullens表示:“人们的关注度正在升温,但我认为其暂时还无法左右整个气象界。我们都是受过专业训练的科学家,习惯于用物理学的角度来思考问题……而AI从本质上就是在总结过往经验和规律,所以我们需要认真考虑,这样的方式到底好不好,以及背后的理由。”2zF喜好网-记录每日喜好的科技时尚娱乐生活

天气预报机构可以自行体验GenCast,DeepMind已经发布了其开源模型的代码。Price表示,如今GenCast乃至更多经过改进的AI模型正与传统模型一同在现实场景下使用。“一旦这些模型被交付到从业者手中,将有助于进一步建立信任和信心。我们真心希望这能带来一波广泛且积极的社会影响。”2zF喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
智己汽车携手Momenta联合打造“一段式端到端直觉智驾大模型”

智己汽车携手Momenta联合打造“

【锋巢网】10月28日,在品牌智能驾

11-19 134阅读
董宇辉终究难逃宿命

董宇辉终究难逃宿命

直播带货业已进入到一场深度洗牌

11-19 137阅读
年轻人的失眠症,正在被包装成“熬夜经济”

年轻人的失眠症,正在被包装成“熬

最近一段时间,各大奶茶店纷纷开启

11-19 124阅读
曝iPhone 17全系首发3nm A19系列芯片:无缘台积电2nm工艺制程

曝iPhone 17全系首发3nm A19系列

11月19日

11-19 125阅读
腾讯的AI困局

腾讯的AI困局

文章来源:科技新知图片来源:由无界

11-19 128阅读
赵薇再陷风波被强制执行8488元 公司涉400余起证券纠纷案

赵薇再陷风波被强制执行84

企查查APP显示,近日,浙江祥源文旅股份

11-19 106阅读
爱尔兰移民项目身 光环 太多,一份投资,三大收获,四重身份(爱尔兰移民项目身)

爱尔兰移民项目身 光环 太

其实自英国脱欧以来,获得爱尔兰公

11-19 131阅读
浪胃仙IP创始人“游絮”犯职务侵占罪被判8年:罚100万 归还账号

浪胃仙IP创始人“游絮”犯

11月13日消息,据

11-19 105阅读
《角斗士2》横扫国际票房

《角斗士2》横扫国际票房

《角斗士2》在欧

11-19 108阅读
2024年全球票房十强!电影《毒液:最后一舞》中国票房破6亿

2024年全球票房十强!电影《

11月13日消息,根

11-19 108阅读
《人中之龙8外传 夏威夷海盗》介绍 “海盗”战斗风格及海盗主题游戏要素

《人中之龙8外传 夏威夷海

在“人中之龙”系列最新作《人中之龙8外

11-19 134阅读
斯宾塞不喜欢操纵性扩展内容:不能把本体砍掉单独卖

斯宾塞不喜欢操纵性扩展内

随着微软大力推动其游戏在首日即登陆G

11-19 134阅读
《战神:诸神黄昏》6.001补丁发布 优化手柄和显卡支持

《战神:诸神黄昏》6.001补

《战神:诸神黄昏》6.001更新版本着重解

11-19 115阅读
原子之心医院区域密码房解谜攻略

原子之心医院区域密码房解

原子之心的医院区域里面有一个密码房,需

11-19 151阅读
饥荒饥饿腰带制作方法及制作材料分享

饥荒饥饿腰带制作方法及制

饥饿腰带是饥荒游戏里面的一件魔法物品

11-19 141阅读