快讯
用AI训练AI,可能越练越“傻”
发布时间 2024-07-26 09:34 转载 阅读 50089次

新华社北京7月25日电 对于人工智能(AI)大语言模型来说,通常给予的训练数据越多,模型就会越“聪明”。但英国《自然》杂志新发表的一项关于大模型的研究显示,如果只用AI生成的数据来训练大模型,会使模型性能下降、越练越“傻”。

  英国牛津大学、剑桥大学等机构研究人员发现,如果在训练大模型时,只用AI生成的内容,会导致大模型出现不可逆的缺陷,逐渐忘记真实数据的分布,这被称为“模型崩溃”。

  2024年4月23日,在德国汉诺威工博会上,参观者与一款智能机器人进行“石头剪子布”游戏。新华社记者任鹏飞摄

  研究人员首先使用大语言模型创建类似维基百科词条的文本,然后利用这个内容来训练该模型的新版本,并反复使用前代模型生成的文本训练更新的版本。随着AI生成的信息“污染”训练集,模型的输出逐渐失去意义。在模型的第九次迭代中,它完成了一篇关于英国教堂塔楼的文章,其中一段文字却在讲述野兔尾巴的多种颜色。

  研究发现,导致“模型崩溃”的重要原因是,由于模型只能从其训练数据中采样,一些在第一代数据中本就低频出现的词汇,在每次迭代后出现的频率变得更低,而一些常见词汇出现的频率则逐渐增加。

  这种变化的结果就是,模型逐渐无法正确模拟真实世界的复杂性。随着时间推移,这种错误会在迭代中被层层累积、逐渐放大,最终导致“模型崩溃”。这有点像生物学中“近亲繁殖”会导致后代缺陷,如果不能保证基因库的多样性,最终会导致一个物种的崩溃。

  研究人员还发现,由于训练数据被“污染”而导致“模型崩溃”的情况不止发生在大语言模型中,高斯混合模型、图片生成器等也可能出现类似情况。

  不过,应对“模型崩溃”并非束手无策。研究人员发现,如果能在模型微调过程中保留10%左右的真实数据,崩溃就会发生得更缓慢。还可使用水印技术,将AI生成的数据与真实数据区分开来,这需要大型科技公司的协作。此外,在AI生成的文本重新进入数据池之前,可由人类先筛选过滤。

【责任编辑:陈听雨】
国家超算互联网平台架设数字中国建设“高速路” [原文链接]
浙江省出台直播带货新规 进一步规范AI数字人直播[原文链接]
全球首次 AI机器人画作将拍卖[原文链接]
电商成为农民增收“加速器” [原文链接]
保险为自动驾驶系上“安全带”[原文链接]
每周精选查看更多 >
希鸥网观点:创业公司团队如何管理更有效率?
希鸥网观点:创业公司团队如何管理更有效率?
当团队中出现冲突或挑战时,积极介入并提供协助和支持。促进团队成员之间的沟通和解决问题的能力,以保持团队的凝聚力和效率。 [详细]
想升职加薪?拿着超4亿年薪的CEO给了20条建议
想升职加薪?拿着超4亿年薪的CEO给了20条建议
我们熟知的“迪士尼”,全称是华特迪士尼公司(英文简称:DISNEY),作为一家市值超过2万亿人民币(3103亿美金)的大型企业,迪士尼最为国人所熟悉的是其位于上海的迪士尼乐园和电影屏幕上的公主系列大电影,但这些只是迪士尼公司的一... [详细]
如果最近你创业不顺,不妨读一读段永平这100句话
如果最近你创业不顺,不妨读一读段永平这100句话
上市后,拼多多市值一度超过京东,在所有中国互联网企业中排名第四。因此,其“80后”CEO黄峥也被人们戏称为“杭州80后新首富”、“抛弃你的同龄人。... [详细]
希鸥网李志磊:创业5年认识的六个创业真相
希鸥网李志磊:创业5年认识的六个创业真相
2013年7月,大学毕业一周年,遭遇简短创业带来的失败以及工作不顺利,我进入了人生低谷,此后一个月,每天花20块钱买10注双色球,希望可以一夜暴富。一个月后终于中了五块钱,我意识到,翻身不能靠运气,还是要要靠自己的努力... [详细]
知乎创始人周源曾创业失败发不出工资:我哭了,因为不甘心
知乎创始人周源曾创业失败发不出工资:我哭了,因为不甘心
说起知乎,想必大家都不会陌生,但站在知乎背后的男人,大概很少有人会去了解。周源是知乎创始人兼CEO,他自称“知乎第001号员工”。2018年周源做客一档由腾讯大学自制的名为《CEO来了》的节目,谈到自己的创业经历,分享在此。... [详细]