大语言模型“安全体检”报告为AI治理提供参考-新华网

　　当AI回答一个专业科技问题时，能否确保内容可靠且安全？7月2日发布的全球大语言模型科技安全防范能力测评报告显示，在某些语境下，部分测试模型仍存在多重安全隐患。

　　在当天举行的2026全球数字经济大会云智算安全论坛上，东壁科技数据有限责任公司联合上海财经大学数字经济学院共同发布了这份测评报告。

　　据介绍，测评方构建了包含313条问题的测试集，覆盖生物化学、网络安全等前沿领域，对全球38个大语言模型进行了全景式扫描。为评估科技内容的可靠性，测评方还从东壁全球科技文献数据平台选取了近10万份科技文献材料作为参考。

　　上海财经大学数字经济学院院长赵琳介绍，测评发现，科技内容的可靠性越高，不一定越安全，关键在于能否把可靠知识限制在合规范围内。

　　我国高度重视完善人工智能治理，近年来不仅将其写入政府工作报告，还向世界提出《全球人工智能治理倡议》，推动人工智能向善发展。

　　东壁科技数据创始人吴登生表示，大模型安全测评正从单一的“关键词屏蔽”转向综合的风险评价。持续完善测评体系，未来将为全球人工智能的健康发展和精准治理提供借鉴。（记者刘祯）

【纠错】【责任编辑:马俊卿】