快讯
《通用大模型评测标准》发布
发布时间 2024-10-14 09:34 转载 阅读 52394次

记者从中国移动集团获悉,10月12日,在2024中国移动全球合作伙伴大会期间,中国移动携手工信部中国电子技术标准化研究院、中国电信、国家电网、中国石油、科大讯飞等产业各方共同发布了大模型评测体系建设的新成果——《通用大模型评测标准》,为产业界遴选优质AI大模型提供重要参考依据。

  中国移动董事长杨杰在大会上表示,当今,以数智化为主要特征的新一轮科技革命和产业变革深入发展,数据、算力、人工智能成为新质生产力的重要驱动因素。AI加速发展,为千行百业、千家万户注智赋能,将有力推动融合创新、信息消费不断跃升,引领经济社会从“互联网+”“5G+”迈向“AI+”。

  据了解,大模型评测是助力人工智能赋能行业应用的重要一环。当前众多企业已启动大模型建设,亟需建立配套的通用大模型和行业大模型评测体系。中国移动联合电子标准院、央企及产业各方初步完成通用大模型评测标准制定。

  据介绍,此次发布的评测标准基于“2-4-6”框架:“2”代表两类评测视角,以重点行业实际使用需求为导向,将评测任务划分为理解和生成两类视角;“4”代表四类评测要素,从评测全生命周期中提取出评测工具、评测数据、评测方式和评测指标四类关键要素;“6”代表六大评测维度,综合考虑大模型应用过程中的核心能力。该标准广泛吸纳产学研用各方意见,并结合行业特色场景需求,可为通用大模型全面评估提供客观依据和重要参考。

  下一步,中国移动将联合产学研用各方,深入挖掘石油、电力、交通和物流等重点行业应用需求,持续打造并完善通用及行业大模型评测体系,助力国产大模型高质量发展。(记者高亢)

【责任编辑:陈听雨】
乘“数”而上,构筑竞争新优势[原文链接]
我国成功发射太空计算卫星星座[原文链接]
警惕生成式AI商业化的伦理风险 [原文链接]
具身智能开源生态加速“长起来”[原文链接]
AI“伴侣”:新兴产业“呼叫”监管[原文链接]
每周精选查看更多 >
美国副总统《乡下人的悲歌》:我们最大的敌人是自欺欺人
美国副总统《乡下人的悲歌》:我们最大的敌人是自欺欺人
《乡下人的悲歌》是J.D.万斯通过个人成长经历对当代美国工人阶级白人群体困境的深刻反思。这部作品的核心并非仅仅讲述一个“逆袭”故事,而是以自传为框架,剖析一个群体在现代化进程中遭遇的文化断裂、经济衰败与精神迷... [详细]
王阳明思想与草根创业者
王阳明思想与草根创业者
这种思维模式能让创业者在资源约束下,将“匮乏”转化为“专注优势”,用认知升维突破物理局限。王阳明思想的真正力量,在于教会创业者:最大的资源不在银行账户,而在心智模式的升级。... [详细]
希鸥网观点:创业公司团队如何管理更有效率?
希鸥网观点:创业公司团队如何管理更有效率?
当团队中出现冲突或挑战时,积极介入并提供协助和支持。促进团队成员之间的沟通和解决问题的能力,以保持团队的凝聚力和效率。 [详细]
想升职加薪?拿着超4亿年薪的CEO给了20条建议
想升职加薪?拿着超4亿年薪的CEO给了20条建议
我们熟知的“迪士尼”,全称是华特迪士尼公司(英文简称:DISNEY),作为一家市值超过2万亿人民币(3103亿美金)的大型企业,迪士尼最为国人所熟悉的是其位于上海的迪士尼乐园和电影屏幕上的公主系列大电影,但这些只是迪士尼公司的一... [详细]
如果最近你创业不顺,不妨读一读段永平这100句话
如果最近你创业不顺,不妨读一读段永平这100句话
上市后,拼多多市值一度超过京东,在所有中国互联网企业中排名第四。因此,其“80后”CEO黄峥也被人们戏称为“杭州80后新首富”、“抛弃你的同龄人。... [详细]