(二)2025年政府网站历史信息清理调查研究报告
七、主要问题分析
(一)信息更新清理不及时,失效冗余内容堆积
政府网站中各类失效、冲突、无实际价值的历史信息未按要求及时处置,导致信息滞后或冗余,具体包括三种表现。
一是失效/废止行政规范性文件未清理。政府网站中有大量阶段性、临时性的政策法规、管理办法等,这类信息仅在特定时间段生效。若未及时清理,不仅会让公众产生信息混淆,还会在被政务大模型训练后给出错误的搜索和咨询结果。
典型示例:《**市优先发展产业项目用地供应管理办法》(*府规〔2024〕3号)已于2025年10月14日废止,但相关信息依旧在网站中展示,并未清理或进行标记“废止”。

二是与中央新发政策不一致的政策文件未下线。中央及各部委每年会出台新政策文件,部分新政策与地方此前发布的政策存在冲突。按照“旧政策服从新政策、地方服从中央”的原则,地方政府网站应及时下线与中央新政策不一致的历史内容,但实际中仍有此类内容留存,易给公众和企业造成误导。
典型示例:2025年5月10日起,全国范围内办理结婚登记不再需要户口本,凭双方身份证和婚姻状况声明即可完成登记。但某区县政府网站结婚登记办事指南的申请材料依然要求提供男女双方户口本,并未修改。

三是长期无人访问的陈旧信息堆积。这类信息虽有公开访问路径,但因历史久远,除搜索引擎爬虫外基本无公众访问,性质与“下沉数据”类似。例如新闻动态类栏目中超过两年的信息通常无实际访问需求,需通过网站访问分析系统或人工判断标记此类信息,并按栏目特点设定差异化公开期限。
典型示例:某政府网站《未来几天雷雨较多麦农需防小麦倒伏》,发布时间为2012年,属于距今已有13年的陈旧信息,目前无实际指导意义,应纳入优先清理清单。
(二)隐私与敏感信息保护存在漏洞,风险隐患突出
政府网站隐私保护范围不全面、敏感信息管理标准不统一,公示时限不合理,存在泄密及权益损害风险,具体包括四种表现。
一是公民隐私保护未覆盖新型隐私范畴。传统政府网站仅重点保护公民身份证号、“人名+手机号”等基础隐私信息,但根据《中华人民共和国民法典》,个人隐私范围涵盖“人名+学校”“人名+住址”“人名+子女信息”等多种组合形式。当前部分网站仍未全面覆盖这些新型隐私保护,且像学生入学/毕业信息等公示内容,即便未公开身份证号,公开时限也远超合理范围,尤其未成年人敏感个人信息未按规定控制存储期限,引发公众不安。
典型示例:某地政府网站在招聘公示附件中,泄露100余名报考人员个人隐私信息。

二是公务员个人信息保护不足,存在信息关联及“开盒”风险。政府网站长期留存大量公务员的“人名+手机号”信息(如考试报名联系人、办公服务人员等),部分信息留存长达十年以上。随着部分人员调整或晋升至领导岗位,“人名+手机号+单位名”的长期暴露,结合互联网大数据与 AI 技术,存在信息关联和“开盒”风险,须建立针对性防护与清理机制。
典型示例:某地2016年至今人员岗位调整(调任、退休、轮岗) 频繁,时任人员电话大概率失效,建议及时清理。

三是公示时限超出合理范围。例如,政府网站对企业行政处罚信息的公示时间超出合理范围,该问题已引发社会各界和媒体的广泛关注,过长的公示周期会持续对企业的正常经营活动造成负面影响,损害企业合法权益。
典型示例:根据《市场监督管理行政处罚信息公示规定》第十三条可知,仅受到通报批评或者较低数额罚款的行政处罚信息自公示之日起届满三个月的,停止公示。但某地政府网站该行政处罚信息公示期已超过3年。

四是敏感信息认定标准前后矛盾。不少单位对哪些信息属于涉密信息、应如何处理的标准不统一,存在“新老标准不一致”的情况。例如某单位在2025年明确“机关职责涉密不予公开”,但2023年、2024年已公开过该机关职责,且未因标准调整追溯删除这些历史公开信息,存在合规与泄密风险。
(三)数据管理不规范,存在失控与超限问题
政府网站信息数据管控机制缺失或不健全,导致部分数据脱离管控,部分信息公开可能突破法定边界。具体包含以下两种表现:
一是存在大量无序“下沉数据”。部分网站信息无公开访问路径,仅能通过站内搜索引擎检索到,网站管理者难以全面掌握这类数据的范围与内容。此类数据规模庞大、种类繁杂、历史跨度大,完全脱离管理者管控,就像“埋在脚下的地雷”,存在极大安全隐患,是历史信息清理的重要目标。
二是信息超范围过度公开。政务信息公开工作中因突破法定边界、违背公开原则而产生的不当行为,核心是公开的内容、范围超出了法律法规规定的允许公开范畴,或损害了国家、社会、集体利益及公民合法权益。二者本质一致,均属于“公开行为与法定要求不匹配”的情形 。
典型示例:某网站发布的通知信息,标记有“此件不予公开”, 但该信息在网站上被主动公开了。

(四)内容发布审核不严,损害政府形象
政府网站在信息发布、栏目设置、互动回应等环节中,因内容存在错误、不当、违规或缺失等问题,导致公众对政府公信力、行政能力、服务水平产生负面认知,或对政府声誉、公共利益造成不良影响的情形 。
典型示例:某地政府网站发布的信息显示,该文章中存在一处外站域名,由于该域名失去管理,已经变为色情类非法网站。

八、下一步工作建议
针对不同政府网站表现出来的历史信息清理问题以及管理者面临的难点痛点,建议按照“精准施策、标本兼治、长效管控”原则,构建“基础准备一精准执行一长效机制一保障支撑”的闭环工作流程和内容 。
(一)基础准备:明确目标、分级分类、编制规则
第一,开展诊断、确定核心清理目标。根据政府网站历史信息清理指标及内容,全面开展网站诊断。依据网站诊断结果,制定网站差异化清理目标。例如,针对下沉数据汇聚风险等问题,制定全面排查清理并清理无公开访问路径、脱离管理者管控的下沉数据,建立跨系统数据统一台账与管控机制,防范数据过度汇聚引发的泄密风险、关联穿透风险,消除“隐形数据安全隐患”,确保政务数据与公众信息安全的核心目标。
第二,问题导向、建立信息分级体系。政府网站信息数据分级应该立足问题导向,为历史信息清理做好标注准备。具体来说,可以按共享程度划分,可以按主观判定的重要程度划分,也可以按数据实际使用情况划分,或者是几种分级形式的综合。下表是供参考的建议分级表格 。

第三,合规适配、编制信息清理规则。为确保数据清理工作规范有序、精准高效,需以国家及省级法律法规、规章和重要政策文件为依据,结合政府网站运营实际情况,科学确定数据清理判定规则与标准,系统编制《政府网站历史信息清理规则库》。该规则库需系统涵盖保留信息类别、各栏目清理时限与原则、特殊信息处理规范、信息审查要点强化、信息同源管理策略等关键内容,为后续全面梳理各单位信息清理现状、精准出具清理建议清单提供明确、统一的规则遵循。
(二)精准执行:梳理清单、AI 赋能、协同联动
第一,开展梳理、编制形成梳理清单。一方面,组织专业第三方机构,全面梳理排查网站各类信息数据,编制形成《政府网站历史信息清理梳理表》,至少包含信息来源、栏目归属、数据类型、关联关系等相关内容,精准识别并标记错误信息、误导性信息、敏感信息、重复信息、无关无效信息、无实际效用信息及无需长期保留信息,详细记录各类信息的具体详情及初步清理建议,建立信息清理初查台账,形成网站信息可视化地图。另一方面,根据形成的梳理表,量身定制网站历史信息清理建议清单,明确需清理信息的具体内容、清理优先级及操作方式等内容。
第二,引入AI 、提升信息清理质效。考虑到政府网站信息体量庞大、类型多元、格式繁杂,为实现待清理数据的精准识别、全面筛选、规范标注及关联关系挖掘,大幅提升清理工作质效,建议引入AI大模型,依托专业平台,通过检索与生成能力的深度协同,强化AI信息排查的精准性与实用性。
第三,深化协同、明确保留信息范围。政府网站历史信息清理前需要充分征询相关业务部门、法制部门的意见,对不可下线的信息范围进行充分沟通,例如,涉及重大政务决策、民生保障、公共服务的关键记录,需长期归档的历史政务活动记录(按归档规范处理后留存) 等。
(三)长效机制:清理常态化、归档规范化
一方面,建立常态化清理机制。建议构建政府网站历史信息常态化清理机制,依托专业平台,推进定期排查+定点复盘工作模式。定期排查重点评估中央政策动态更新需求、保障信息时效性与准确性、防范新增数据关联与汇聚风险、响应涉密范围动态调整、跟进信息公开政策与宣传口径变化、强化个人信息保护;定点复盘是指在一定时间范围内,汇总分析各单位清理成效和典型问题,迭代优化清理目标和清理规则。
另一方面,规范推进归档工作。为确保历史信息合规留存与可追溯,建议采用“原始风貌+元数据”双模式归档模式。其中,原始风貌归档指对抓取的网站信息经人工或自动鉴定无误后,生成正式归档文件。归档文件不仅完整保留网页全部元素,还精准留存网页间的链接关系;经水印处理后,可支持 IE、360、搜狗、谷歌等主流浏览器的原始风貌回放,从而提升归档文件的可读性与浏览体验。元数据归档指按照国家关于政府网站归档的相关标准要求开展归档工作,确保归档工作的合规性和权威性。
(四)保障支撑:强化保障、提升认知
一方面,强化组织协同保障。将政府网站历史信息清理工作作为政府网站重点工作之一,并明确各相关部门的责任分工,例如,政府网站主管部门负责统筹协调;业务部门履行信息主体责任,负责本业务部门信息的排查和确认;法制部门负责合规性审查,确保清理工作符合法律法规要求;保密部门负责敏感信息的判定和风险把控等。
另一方面,开展工作技能培训。针对政府网站管理者存在的认知误区和操作难题,组织专题培训,重点培训澄清工作人员认知误区、提升工作人员实操能力,同时通过典型案例分享,强化风险意识和责任意识。

鄂公网安备42018502007532号