0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”_湾区律师网

0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”

2025-08-19 16:25:06 浏览：259 来源：网络

　　国家安全部今天（5日）发布安全提示文章，人工智能的训练数据存在良莠不齐的问题，其中不乏虚假信息、虚构内容和偏见性观点，造成数据...

　　国家安全部今天（5日）发布安全提示文章，人工智能的训练数据存在良莠不齐的问题，其中不乏虚假信息、虚构内容和偏见性观点，造成数据源污染，给人工智能安全带来新的挑战。

　　数据是人工智能的基础

　　人工智能的三大核心要素是算法、算力和数据，其中数据是训练AI模型的基础要素，也是AI应用的核心资源。

　　提供AI模型的原料。海量数据为AI模型提供了充足的训练素材，使其得以学习数据的内在规律和模式，实现语义理解、智能决策和内容生成。同时，数据也驱动人工智能不断优化性能和精度，实现模型的迭代升级，以适应新需求。

　　影响AI模型的性能。AI模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提；高准确性、完整性和一致性的数据能有效避免误导模型；覆盖多个领域的多样化数据，能提升模型应对实际复杂场景的能力。

　　促进AI模型的应用。数据资源的日益丰富，加速了“人工智能+”行动的落地，有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力，更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

　　数据污染冲击安全防线

　　高质量的数据能够显著提升模型的准确性和可靠性，但数据一旦受到污染，可能导致模型决策失误甚至AI系统失效，存在一定的安全隐患。

　　投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据，将干扰模型在训练阶段的参数调整，削弱模型性能、降低其准确性，甚至诱发有害输出。研究显示：

　　●当训练数据集中仅有0.01%的虚假文本时，模型输出的有害内容会增加11.2%；

　　● 即使是0.001%的虚假文本，其有害输出也会相应上升7.2%。

　　造成递归污染。受到数据污染的人工智能生成的虚假内容，可能成为后续模型训练的数据源，形成具有延续性的“污染遗留效应”。当前，互联网AI生成内容在数量上已远超人类生产的真实内容，大量低质量及非客观数据充斥其中，导致AI训练数据集中的错误信息逐代累积，最终扭曲模型本身的认知能力。

　　引发现实风险。数据污染还可能引发一系列现实风险，尤其在金融市场、公共安全和医疗健康等领域。

　　● 在金融领域，不法分子利用AI炮制虚假信息，造成数据污染，可能引发股价异常波动，构成新型市场操纵风险；

　　● 在公共安全领域，数据污染容易扰动公众认知、误导社会舆论，诱发社会恐慌情绪；

　　● 在医疗健康领域，数据污染可能致使模型生成错误诊疗建议，不仅危及患者生命安全，也加剧伪科学的传播。

　　筑牢人工智能数据底座

　　加强源头监管，防范污染生成。以《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规为依据，建立AI数据分类分级保护制度，从根本上防范污染数据的产生，助力有效防范AI数据安全威胁。

　　强化风险评估，保障数据流通。加强对人工智能数据安全风险的整体评估，确保数据在采集、存储、传输、使用、交换和备份等全生命周期环节安全。同步加快构建人工智能安全风险分类管理体系，不断提高数据安全综合保障能力。

　　末端清洗修复，构建治理框架。定期依据法规标准清洗修复受污数据。依据相关法律法规及行业标准，制定数据清洗的具体规则。逐步构建模块化、可监测、可扩展的数据治理框架，实现持续管理与质量把控。

　　（总台央视记者王莉）

[ 责编：孙满桃 ]

高级合伙人王博律师

广东华商律师事务所

☎电话：18938896818

知识产权，合同纠纷，经济纠纷，医疗纠纷，房产纠纷，公司风控，企业顾问等

曾任中南财经政法大学知识产权研究中心研究员、武汉市江汉区司法局副局长、民革江汉区工委副主委等。现任华商律师事务所高级合伙人、香港律师会登记备案律师、香港张嘉伟律师事务所中国法首席顾问，多地仲裁员。兼任：武汉大学研究员、研究生校外导师，西北政法大学客座教授、研究生校外导师，中南财经政法大学知识产权（学院）研究中心研究员，南京理工大学/江苏商标品牌研究中心研究员，暨南大学、深圳大学等高校法学院研究生校外导师，深圳市知识产权专家库专家，佛山市知识产权侵权检验鉴定专家库专家，秦皇岛市知识产权专家库专家等。擅长：知识产权、婚姻继承、合同纠纷、公司事务等民商事业务争端解决及刑事辩护，尤其擅长各类刑民交叉等疑难复杂案件的诉讼业务，对重大疑难案件的解决方案具有丰富经验。

上一篇：辽宁检察机关依法对谭瑞松涉嫌贪污、受贿和内幕交易、泄露内幕信息案提起公诉

下一篇：新华视点丨垃圾成堆、钟乳石被售卖——天然溶洞遭破坏调查

评论区

共 0 条评论

这篇文章还没有收到评论，赶紧来抢沙发吧~

【最新】

“不缴社保约定”无效单位需支付经济补偿最高法发布→
　　近两年来，社会保险、竞业限制、福利待遇等类型案件量呈上升趋势。今天（8月1日），最高人民法院召开新闻发布会，发布《最高人民法院关... 2025-08-19
以"音乐餐厅"之名经营KTV并容留未成年少女有偿陪侍
　　这里究竟是“音乐餐厅”还是KTV?　　提起音乐餐厅,人们第一时间想到的可能是“音乐+餐厅”的文艺气息。殊不知,有些音乐餐厅的表象之下... 2022-11-18
·非凡十年丨佛山:"断卡"止付劝阻,反诈无影脚踢爆骗局
□ 奋进新征程建功新时代·非凡十年图为9月26日上午，佛山市反诈骗中心反诈宣传民警开展反诈知识培训。本报记者邓君摄□ 本报记者... 2022-10-24
为中华民族伟大复兴提供根本法治保障 ——写在我国现行宪法公布施行四十周年之际
　　“我宣誓：忠于中华人民共和国宪法，维护宪法权威，履行法定职责，忠于祖国、忠于人民，恪尽职守、廉洁奉公，接受人民监督，为建设富强... 2022-12-01
多地公布整治养老诈骗专项行动成果
　　打击整治养老诈骗专项行动开展至今已有半年，各地密集打击涉老诈骗的脚步加快、成果显著，层出不穷的骗术也接连浮出水面。10月18日，北... 2022-10-20
·新时代新征程|静安区江宁路街道法治护航城市更新
□ 新时代新征程新伟业编者按为深入推动党的二十大精神走进基层、走进群众，进一步凝聚党心民心、鼓舞奋进力量，本报组织开展“新时代新征... 2022-11-21

【推荐】

净网—2025丨直播带货变带祸？这些红线碰不得！
　　现如今网购方便快捷，直播间购物更是风靡一时，主播们卖力介绍，福利不断，让人忍不住“剁手”。　　BUT！热闹的直播间背后，可能藏着... 2025-08-19
2025年6月全国查处违反中央八项规定精神问题27977起
　　央视网消息：7月28日，中央纪委国家监委公布了2025年6月全国查处违反中央八项规定精神问题汇总情况。当月，全国共查处违反中央八项规定... 2025-08-19
e法耀陇原|庆阳：法治护航数字经济黄土大塬崛起“中国算谷”
　　西北角·中国甘肃网记者王卫科宋芳科程健　　2025年全国网络普法行·甘肃站活动期间，“e法助企”宣讲在庆阳如期举行，三位来自... 2025-08-25
农业农村部持续强化网络售种专项整治上半年累计核查种子19万件
　　本报讯记者刘欣记者近日从农业农村部获悉，今年以来，按照全国种业监管执法年活动部署安排，农业农村部组织各地主要电商平台，扎实... 2025-08-19
【说案】高温津贴发没发？用人单位要举证！
　　本报记者李国本报实习生唐袁秋　　近期全国多地高温来袭，“高温津贴”的话题受到关注。　　《防暑降温措施管理办法》第十七条规... 2025-08-19
无堂食外卖，怎样吃得放心？
　　近年来，无堂食外卖店数量增长迅猛。这类外卖店通过网络平台接受订单，不提供堂食，店铺规模小，经营地址和人员变动频繁，容易成为监管... 2025-08-19