构建大模型幻觉及其价值风险的预防治理体系

快讯

发布时间 2025-04-11 09:29 转载阅读 58191次

当前，大模型正以日新月异的速度变革人类社会，其以强大的文字、图像与视频生成能力，带给人们学习工作的效率革命与范式创新。越来越多人将大模型应用于日常实践活动，然而在此过程中，部分用户由于缺乏必要的媒介素养和信息验证习惯，很容易被表面严丝合缝的人工智能幻觉蒙蔽欺骗，无条件信任大模型输出的所有答案，进而对生活、学习或工作产生不良影响，引发决策误导、认知偏差等风险。在推动大模型广泛应用过程中，必须警惕与治理大模型幻觉问题及其价值风险，加快构建集技术优化、法律规制与伦理调适于一体的预防治理体系。

大模型幻觉的生成原因

在人工智能领域，幻觉特指大模型生成的内容看似语法正确、逻辑严谨，但实际上存在着事实错误或无法验证事实的现象，具有“一本正经胡说八道”、无法确认现实依据等特征。大模型的幻觉包括事实性幻觉与忠实性幻觉两种类型，前者指的是与事实不一致或存在事实捏造，后者指的是生成内容与用户指令不一致、上下文不一致或逻辑不一致。

在本质上，大模型的幻觉问题是其技术架构、训练和生成模式共同作用的产物，具有一般性、偶然性、随机性、难以避免或克服等特征。在生成机制上，大模型幻觉的核心成因来自概率驱动的技术架构、训练数据局限性以及人机互动生成逻辑的多重耦合。

首先是技术架构的能力短板。目前大模型主要采取基于转换器结构的GPT范式，这种技术架构确能大幅度提高自然语言处理的精度与效率，但在预训练、监督微调、推理等环节都可能存在能力短板，产生与事实、指令或上下文不一致的幻觉问题。例如在预训练阶段，大模型通过自回归生成方式，基于历史标记的概率分布逐词预测输出。这种机制天然缺乏对上下文语义一致性的把控能力，容易优先选择概率更高但与事实、逻辑不一致的词汇组合，输出形成“语法正确但内容失真”的幻觉。

其次是训练数据的天然缺陷。大模型基于互联网海量数据进行深度学习，但由于互联网语料并未经过严格检验处理，或者由于错误标注，不可避免存在事实错误或逻辑矛盾，大模型缺乏对数据真实性的鉴别能力，容易抓取或根据错误数据生成回答。例如，当要求GPT4大模型讲述“林黛玉倒拔垂杨柳”的故事时，大模型并不能辨析其中的陷阱，而是未经事实验证直接从海量文本数据中进行内容拼接，编造出一段荒谬情节。

最后是人机互动的刻板误伤。大模型采取的人类反馈强化学习，容易导致大模型在刻意逢迎人类需求过程中出现信口开河、事实伪造等问题。如加拿大航空聊天机器人在错误理解“特殊退款”概念后，连续生成虚构的退款条件与时限，最终酿成法律纠纷。大模型特有的技术架构和生成逻辑，导致幻觉具有自我强化的危险性。

大模型幻觉的价值风险

大模型幻觉的随机出现和难以避免，还存在着削弱人机信任、导向信息极化、冲击社会秩序甚至引发意识形态安全危机等价值风险，亟待加强预防与治理。

大模型幻觉最直接的危害就是对用户决策的误导，特别是在医疗、健康、金融等领域。大模型的权威性表达风格与流畅的叙事逻辑，使得错误信息具有极强的迷惑性。如果用户过于依赖大模型生成信息辅助决策，很有可能被误导进而产生严重后果。例如，相信大模型提供的错误治疗方案，可能导致疾病无法控制甚至进一步恶化。长此以往，恐将削弱人机信任关系。

更令人担忧的是，大模型幻觉引发的价值风险呈现出从个人决策误导向群体认知偏差、社会秩序冲击的扩散路径。在公共决策领域，幻觉可能扭曲政策认知，如果不加强对大模型输出信息的甄别与把关，很有可能出现误读政策、发表歧视言论等幻觉问题，不仅会削弱政府公信力，甚至会危及社会公共安全。

在意识形态安全领域，相关威胁更加隐蔽。例如，相关研究监测到，某些境外大模型带着意识形态的有色眼镜看待中国特色社会主义发展成就与制度优势，刻意混入虚假事实或错误评价，形成与主流话语不同的输出。这种经过意识形态包装的幻觉内容，通过知识问答形式进行价值渗透，其误导性远超传统虚假信息。

大模型幻觉的治理对策

预防与治理大模型幻觉，应构建技术纠偏、法律规制与伦理调适的三维治理体系，通过技术优化消除幻觉问题，借助法律规制明确责任边界，依托伦理调适培育价值理性，使大模型成为人类更可靠的合作伙伴。

构建多层次防治体系。“以技治技”是解决大模型幻觉问题的首选路径。人工智能伦理的“价值敏感设计”或价值对齐策略，也有赖于技术层面创新与突破。这不仅需要人工智能企业与专家通过提高训练数据质量、加强外部验证与事实检查、改进模型推理能力、增强透明度与可解释性等途径提升大模型性能，而且鼓励哲学社会科学专家与人工智能专家携手合作，通过知识库优化、训练语料纠错、价值对齐监测等途径，帮助大模型提高问答正确率，消除潜在的幻觉问题与价值风险。

建立适应性治理框架。面对大模型的普及化应用，敏捷、柔性、规范的立法治理势在必行。国家网信办等七部门颁布实施《生成式人工智能服务管理暂行办法》，对训练数据选择、模型生成与优化、服务提供等提出明确的法律规制与风险防范要求，有利于推动“智能向善”，促进大模型的合规应用。欧盟《人工智能法案》要求大模型履行告知义务、确保技术方案的稳健性和可靠性等规范要求，对大模型的应用形成有效的制度约束和问责框架，值得参考借鉴。

提高技术开发应用的价值基准。对大模型幻觉更有意义的治理创新在于建立技术价值观，将负责任创新、可控创造性等伦理价值融入工程师的头脑、植入大模型的代码。例如，倡导存在争议结论不生成、无法溯源的信息不生成、超出模型认知边界的内容不生成等原则，推动大模型从追求生成流畅度向确保内容可靠性转型；又如，建立大模型回答事实性问题分级置信提示制度，按照高可信、需核实、推测性结论等进行分类标注，加强输出内容的透明度与可解释性。

对用户而言，应进一步提高科学正确应用大模型的信息素养，进而成为引导内容生成的指挥官、幻觉问题的甄别者。研究表明，经过人工智能交叉验证等使用习惯培训，能够显著降低用户被幻觉误导的概率。人们需要与时俱进地提升自身辨析幻觉、掌握常识、批判思考的综合能力，在利用大模型检索信息、生成内容的过程中遵守履行事实核查、逻辑验证、专业甄别、最小必要、场景控制等价值原则，最大限度消除幻觉问题和价值风险。

人工智能的可靠性建设往往滞后于其能力扩展。治理大模型幻觉的终极目标不是完全消灭技术的不确定性，而是要建立风险可控的人机协同机制。在这场人机协同的赛博进化中，始终保持技术的谦逊与伦理的清醒，是破除大模型幻觉迷雾的应有之义。

（作者：李凌，系复旦大学马克思主义研究院副研究员）

【责任编辑:朱家齐】

上一篇：AI助推基本公共服务更普惠精准

下一篇：年报速递|世联行去年归属股东净利下降八成至8194万

快讯查看更多 >

电子信息制造业为何一马当先1天前

电子信息制造业为何一马当先[原文链接]

AI助推基本公共服务更普惠精准1天前

AI助推基本公共服务更普惠精准 [原文链接]

构建大模型幻觉及其价值风险的预防治理体系1天前

构建大模型幻觉及其价值风险的预防治理体系[原文链接]