构建安全可控的数据要素流通生态
可信数据空间(Trusted Data Space)是一种新型的数据流通基础设施,旨在在保障数据安全和主权的前提下,实现跨组织、跨行业、跨区域的数据可信共享与流通。本方案围绕国家数据局发布的《可信数据空间发展行动计划(2024-2028年)》战略部署,构建一套完整的可信数据空间技术体系。
总体目标
构建一个安全、可信、高效的数据流通基础设施平台,实现数据要素的合规、有序、高效流通。
多主体可信接入
建立覆盖数据提供方、数据使用方、运营方、监管方和运维方的统一身份认证与权限管控体系,实现多主体在统一信任框架下的安全接入与协作。
数据可信流通
构建基于连接器、双沙盒、样本引擎、智能合约等核心技术能力的数据可信流通体系,实现数据在"可用不可见""可控可计量"的原则下安全流通。
全流程授权审计
建立覆盖数据接入、编目、发布、发现、申请、审批、使用、审计、回收等数据流通全环节的授权审计机制。
运营监管支撑
为平台运营方和监管方提供可视化运营分析、审计监管看板、风险预警与处置等能力。
构建可信流通的信任基础
可信数据空间的基础底座由"三统一"体系构成,分别是统一身份、统一目录和统一接口,解决"你是谁""有什么""怎么用"三大核心问题。
统一身份与权限体系
面向多主体协作需求,构建覆盖"主体、用户、应用、角色、数据、服务、审计"的统一身份与权限管控体系。
-
统一身份管理主体身份、用户身份、应用身份统一管理,支持SSO、MFA、数字证书认证。
-
统一角色管理三层角色管理体系:主体角色、平台角色、空间角色,实现精细化权限控制。
-
统一授权控制RBAC+ABAC混合授权模式,支持多维度动态授权、细粒度数据权限控制。
-
统一访问控制四层控制机制:登录认证、授权审批、访问控制、权限回收,支持动态脱敏。
-
统一审计监管全流程行为留痕,支持行为分析、风险告警、合规审计、监管穿透查询。
统一目录体系
可信数据空间的"资源地图",为所有数据资源、API服务、算法模型和数据产品提供统一的登记、管理、发现和使用入口。
-
统一资源编目对数据资源、API接口、算法模型和数据产品进行统一登记和元数据管理。
-
统一检索发现全文检索、语义检索、分类导航,帮助用户快速定位目标资源。
-
统一语义标准与生命周期管理建立分类分级体系、标签体系、术语标准,覆盖资源全生命周期管理。
-
统一血缘追踪记录数据从来源、加工、流转到使用的完整链路,支持正向追踪和反向追溯。
统一接口体系
不同系统、不同主体、不同平台之间,采用统一的数据交换、服务调用和能力接入规范,实现互联互通。
-
统一接入与交换接口提供身份认证、数据目录、数据申请与授权、数据交换、连接器接入等标准化API。
-
统一接口标准与安全规范统一通信协议、数据格式、认证鉴权、错误码规范、版本管理、限流控制。
-
统一网关与调用审计统一API网关承担路由转发、流量控制、鉴权校验、调用监控、日志审计职责。
可信流通的技术基石
六大核心技术模块,支撑数据安全接入、隔离开发、样本加工、联合计算、合约管控和可信存证,保障数据"可用不可见、可控可计量、全过程留痕"。
空间管理
以"数据空间"为粒度进行数据资源管理和协作,支持提供方、使用方、运营方、监管方、运维方五类角色协同工作。
| 角色 | 核心职能 |
|---|---|
| 提供方 | 数据资源供给与管理 |
| 使用方 | 数据资源发现与使用 |
| 运营方 | 空间运营与管理 |
| 监管方 | 合规监督与审查 |
| 运维方 | 系统运维与保障 |
连接器系统
实现数据安全接入和可控流通的核心组件,支持SaaS云连接器和单机版连接器两种部署模式,保障数据不出域。
| 对比维度 | SaaS云连接器 | 单机版连接器 |
|---|---|---|
| 部署方式 | 平台托管 | 私有化部署 |
| 数据位置 | 云端存储 | 数据不出域 |
| 接入门槛 | 低,即开即用 | 中等,自备硬件 |
| 适用场景 | 快速接入 | 高安全要求 |
双沙盒架构
实现"数据可用不可见"的核心技术方案,通过生产沙盒和开发沙盒的隔离与协同,保障数据安全。
- 生产沙盒:运行在数据提供方受控环境中,直接接入真实生产数据,开发人员不可见。
- 开发沙盒:使用样本引擎生成的脱敏样本数据,供开发人员进行模型开发、接口联调、业务验证。
- 双沙盒协同:开发沙盒中的模型可一键发布到生产沙盒执行,支持验证、审核、映射、部署全流程。
样本引擎
基于隐私计算理念实现的核心方案,连接源数据与开发测试环境的数据桥梁,智能生成脱敏非掩码样本数据。
| 规则类型 | 工作机制 | 适用场景 |
|---|---|---|
| 绑定规则 | 字段与预定义样本数据集绑定 | 姓名、地址、电话等枚举字段 |
| 表达式规则 | 基于数学或逻辑表达式生成值 | 有计算逻辑的字段 |
| 随机规则 | 按指定分布生成随机值 | 数值型、日期型字段 |
| 条件规则 | 根据其他字段值决定生成规则 | 字段间有依赖关系 |
| 全量覆盖规则 | 保留原始数据全部内容 | 非敏感公共数据 |
防篡改存证系统
实现行为可信和责任认定的技术基础,通过哈希链、时间戳、多节点备份等机制保障日志完整性。
- 关键行为存证:身份认证、审批授权、数据调用、合约签署、结果输出全量存证。
- 日志防篡改:哈希链、时间戳、自动校验、多节点备份,保障日志不可篡改。
- 审计追溯:支持存证查询、标准化合规报告生成、穿透式追溯、证据链输出。
- 区块链对接:支持对接区块链技术,构建双重可信防护体系,支持DID、智能合约存证。
智能合约管理
将数据流通中的业务规则和约束条件固化为可自动执行的合约条款,实现授权自动化、计量自动化、管控自动化。
| 条款类型 | 核心内容 | 执行方式 |
|---|---|---|
| 授权范围条款 | 可访问的数据范围、字段级别、行级过滤规则 | 自动配置访问控制策略 |
| 使用期限条款 | 授权开始时间和结束时间 | 到期自动回收权限 |
| 用途约束条款 | 使用目的和场景限制 | 运行时校验调用场景 |
| 计费结算条款 | 计费方式、单价和结算周期 | 自动计量和费用结算 |
| 违约处理条款 | 违约行为和处罚措施 | 自动阻断和告警 |
全方位安全防护体系
从数据安全、系统与访问安全、合规与审计三个维度构建纵深防御体系,符合国家法律法规和监管要求。
数据安全控制
分类分级与敏感识别
参照《数据安全法》和相关国家标准,对数据资源实施分类分级管理,采取差异化保护策略。
| 敏感等级 | 保护要求 |
|---|---|
| 公开级 | 基础访问控制 |
| 内部级 | 身份认证 + 访问控制 |
| 敏感级 | 脱敏 + 审计 + 使用控制 |
| 核心级 | 加密 + 沙盒 + 全程审计 |
最小权限与用途约束
严格执行最小权限原则,通过用途约束机制限制数据使用目的、方式、范围、时间和频次。
脱敏与结果输出控制
提供动态脱敏、导出控制、结果控制、差分隐私/K-匿名等多层次安全机制。
系统与访问安全
统一认证与访问控制
支持统一身份认证、单点登录(SSO)、API鉴权、动态权限控制,确保访问安全。
网络边界与环境隔离
通过网络分区分域、防火墙访问控制、开发/生产沙盒隔离、安全域部署等措施保障安全。
日志监控与风险告警
重点监控登录行为、接口调用、数据导出、异常行为,支持多级告警机制:
- 低风险:记录日志
- 中风险:通知管理员
- 高风险:自动阻断并应急响应
合规与审计支撑
全流程留痕与可追溯
系统对数据流通全过程进行日志记录与防篡改存证,确保有记录、可核查、可回溯。
法规要求适配
全面适配国家法律法规要求,提供合规保障:
| 法律法规 | 适配措施 |
|---|---|
| 《数据安全法》 | 分类分级管理、全流程安全管控、安全审计与评估 |
| 《个人信息保护法》 | 用途约束、脱敏处理、授权审批、隐私合规审计 |
| 《网络安全法》 | 网络分区分域、安全设备防护、安全事件响应 |
监管支撑能力
提供运营分析看板、审计监管看板、监管穿透查询、风险分析、合规检查报告等监管能力。
数据全生命周期管理
数据从接入到回收的完整生命周期,共包含十个环节,实现"进、管、用、出"全流程可控。
灵活的部署架构
采用中心端分布式部署与单机版部署相结合的混合部署模式,支持多种场景需求。
中心端分布式部署
采用分布式微服务架构部署,支撑平台级运营和统一管控能力。
核心服务
- API网关集群
- 身份认证服务
- 目录服务
- 空间管理服务
- 合约引擎
- 审计存证服务
- 运营监控平台
适用场景
平台运营、统一管控、运营监管场景,支持多租户、多空间管理。
单机版部署
连接器和沙盒以单机版方式部署在用户本地环境中,保障数据不出域。
支持模式
- 完全离线模式:数据完全本地化处理,无需网络连接
- 在线协同模式:与中心端协同,数据仅在本地处理
- 混合模式:根据数据敏感程度选择不同处理方式
核心能力
具备完整的数据处理能力:数据编目、归集、治理开发、共享等功能,支持数据不出域。
适用场景
本地数据处理、数据安全隔离、高安全等级要求场景,数据不出本地环境。
网络拓扑
网络拓扑遵循安全分区原则,实现多层隔离防护。
多场景业务支撑
覆盖数据流通全流程业务场景,支撑政务、金融、医疗、能源等多行业数据共享需求。
1 使用方发起资源申请
使用方基于统一目录检索目标资源后,提交使用申请,内容包括使用目的、权限范围、使用场景、时效要求、安全承诺。
2 管理方开展审批审核
支持多种审批模式:多级审批、条件审批、按规则自动流转,可根据数据敏感级别配置不同审批流程。
3 授权结果自动联动执行
审批通过后自动执行:开通数据访问权限、配置API凭证、分配沙盒资源、初始化智能合约、启动计量和监控。
1 数据产品封装与发布
数据提供方将原始数据、API接口、算法模型、数据服务等能力封装为标准化数据产品,配置产品描述、使用场景、更新频率、交付方式、授权策略、定价策略。
2 产品运营与使用管理
支持产品浏览与发现、订购与授权、履约与调用、统计与评价全流程管理,提供产品使用监控和分析能力。
3 交易支撑与结算扩展
系统提供订单管理、合同备案、结算管理、发票管理、售后管理功能,支持对接第三方支付和结算系统。
1 运营分析看板
展示核心运营指标:资源数量、接入主体、申请量、授权量、调用量、活跃度、增长率等,支持多维度数据分析和可视化展示。
2 审计监管看板
展示登录认证统计、审批授权记录、数据调用行为、导出操作记录、合约履约状态、异常事件统计,支持全流程行为追溯。
3 风险预警与处置支持
支持识别风险场景:异常调用、越权访问、敏感操作、高风险行为,并根据风险等级采取差异化处置措施,自动触发告警和干预流程。
1 开发沙盒场景
在样本数据环境中进行模型开发、接口联调、业务验证,开发人员无法接触真实生产数据,保障数据安全。
2 生产沙盒场景
在真实数据受控环境中进行生产级计算、规则执行、合规输出,所有操作全程留痕审计,支持结果自动脱敏和安全导出。
3 开发生产协同场景
通过标准化流程实现模型开发、模型测试、安全审核、发布部署、生产执行全链路自动化,支持版本管理和回滚能力。
全功能数据处理能力
连接器作为数据接入、治理、处理、共享与安全流通的重要载体,具备支撑数据不出域、可用不可见、可控可审计的完整技术能力。
数据目录编制
- 多源异构数据库和组件接入
- 资源透视与数据预览
- 元数据管理与血缘追踪
- 自动化数据编目
- 数据库驱动动态加载
数据治理能力
- 数据标准管理
- 数据分类分级
- AI数据质量管理
- 数据质量评估与报告
- 质量问题跟踪与整改
数据开发能力
- 拖拽式可视化建模
- 丰富的开发组件库
- 用户自定义函数支持
- 机器学习组件集成
- AI开发助手对话式建模
任务调度能力
- 分布式任务调度
- 工作流可视化编排
- 定时/周期任务配置
- 任务运行监控与告警
- 任务日志与执行历史
数仓建模能力
- 维度建模支持
- 事实表/维度表设计
- 指标体系管理
- Cube上卷下钻切片
- 数据分层架构支持
数据分析能力
- 自助BI分析
- 可视化图表制作
- 仪表板设计与发布
- 图表联动与数据钻取
- 大屏展示与嵌入
数据服务能力
- API自动生成
- API服务市场
- 接口申请与授权
- 调用监控与计量
- 流量控制与安全防护
标签与画像能力
- 标签体系管理
- 标签自动生成
- 用户/主体画像分析
- 群体分群与群组分析
- 画像可视化展示
评论