可信数据空间(Ottomi-TrustFroge)

可信数据空间技术方案 - Ottomi-Nexus
可信数据空间技术方案

构建安全可控的数据要素流通生态

可信数据空间(Trusted Data Space)是一种新型的数据流通基础设施,旨在在保障数据安全和主权的前提下,实现跨组织、跨行业、跨区域的数据可信共享与流通。本方案围绕国家数据局发布的《可信数据空间发展行动计划(2024-2028年)》战略部署,构建一套完整的可信数据空间技术体系。

四大目标
多主体可信接入、数据可信流通、全流程授权审计、运营监管支撑
五大设计原则
安全性、可信性、可扩展性、标准化、合规性
五层架构体系
生态应用层
服务层
核心引擎层
数据资源治理层
基础设施层

总体目标

构建一个安全、可信、高效的数据流通基础设施平台,实现数据要素的合规、有序、高效流通。

多主体可信接入

建立覆盖数据提供方、数据使用方、运营方、监管方和运维方的统一身份认证与权限管控体系,实现多主体在统一信任框架下的安全接入与协作。

数据可信流通

构建基于连接器、双沙盒、样本引擎、智能合约等核心技术能力的数据可信流通体系,实现数据在"可用不可见""可控可计量"的原则下安全流通。

全流程授权审计

建立覆盖数据接入、编目、发布、发现、申请、审批、使用、审计、回收等数据流通全环节的授权审计机制。

运营监管支撑

为平台运营方和监管方提供可视化运营分析、审计监管看板、风险预警与处置等能力。

"三统一"基础底座

构建可信流通的信任基础

可信数据空间的基础底座由"三统一"体系构成,分别是统一身份、统一目录和统一接口,解决"你是谁""有什么""怎么用"三大核心问题。

统一身份与权限体系

面向多主体协作需求,构建覆盖"主体、用户、应用、角色、数据、服务、审计"的统一身份与权限管控体系。

  • 统一身份管理
    主体身份、用户身份、应用身份统一管理,支持SSO、MFA、数字证书认证。
  • 统一角色管理
    三层角色管理体系:主体角色、平台角色、空间角色,实现精细化权限控制。
  • 统一授权控制
    RBAC+ABAC混合授权模式,支持多维度动态授权、细粒度数据权限控制。
  • 统一访问控制
    四层控制机制:登录认证、授权审批、访问控制、权限回收,支持动态脱敏。
  • 统一审计监管
    全流程行为留痕,支持行为分析、风险告警、合规审计、监管穿透查询。

统一目录体系

可信数据空间的"资源地图",为所有数据资源、API服务、算法模型和数据产品提供统一的登记、管理、发现和使用入口。

  • 统一资源编目
    对数据资源、API接口、算法模型和数据产品进行统一登记和元数据管理。
  • 统一检索发现
    全文检索、语义检索、分类导航,帮助用户快速定位目标资源。
  • 统一语义标准与生命周期管理
    建立分类分级体系、标签体系、术语标准,覆盖资源全生命周期管理。
  • 统一血缘追踪
    记录数据从来源、加工、流转到使用的完整链路,支持正向追踪和反向追溯。

统一接口体系

不同系统、不同主体、不同平台之间,采用统一的数据交换、服务调用和能力接入规范,实现互联互通。

  • 统一接入与交换接口
    提供身份认证、数据目录、数据申请与授权、数据交换、连接器接入等标准化API。
  • 统一接口标准与安全规范
    统一通信协议、数据格式、认证鉴权、错误码规范、版本管理、限流控制。
  • 统一网关与调用审计
    统一API网关承担路由转发、流量控制、鉴权校验、调用监控、日志审计职责。
核心技术能力

可信流通的技术基石

六大核心技术模块,支撑数据安全接入、隔离开发、样本加工、联合计算、合约管控和可信存证,保障数据"可用不可见、可控可计量、全过程留痕"。

空间管理

以"数据空间"为粒度进行数据资源管理和协作,支持提供方、使用方、运营方、监管方、运维方五类角色协同工作。

角色 核心职能
提供方 数据资源供给与管理
使用方 数据资源发现与使用
运营方 空间运营与管理
监管方 合规监督与审查
运维方 系统运维与保障

连接器系统

实现数据安全接入和可控流通的核心组件,支持SaaS云连接器和单机版连接器两种部署模式,保障数据不出域。

对比维度 SaaS云连接器 单机版连接器
部署方式 平台托管 私有化部署
数据位置 云端存储 数据不出域
接入门槛 低,即开即用 中等,自备硬件
适用场景 快速接入 高安全要求

双沙盒架构

实现"数据可用不可见"的核心技术方案,通过生产沙盒和开发沙盒的隔离与协同,保障数据安全。

  • 生产沙盒:运行在数据提供方受控环境中,直接接入真实生产数据,开发人员不可见。
  • 开发沙盒:使用样本引擎生成的脱敏样本数据,供开发人员进行模型开发、接口联调、业务验证。
  • 双沙盒协同:开发沙盒中的模型可一键发布到生产沙盒执行,支持验证、审核、映射、部署全流程。

样本引擎

基于隐私计算理念实现的核心方案,连接源数据与开发测试环境的数据桥梁,智能生成脱敏非掩码样本数据。

规则类型 工作机制 适用场景
绑定规则 字段与预定义样本数据集绑定 姓名、地址、电话等枚举字段
表达式规则 基于数学或逻辑表达式生成值 有计算逻辑的字段
随机规则 按指定分布生成随机值 数值型、日期型字段
条件规则 根据其他字段值决定生成规则 字段间有依赖关系
全量覆盖规则 保留原始数据全部内容 非敏感公共数据

防篡改存证系统

实现行为可信和责任认定的技术基础,通过哈希链、时间戳、多节点备份等机制保障日志完整性。

  • 关键行为存证:身份认证、审批授权、数据调用、合约签署、结果输出全量存证。
  • 日志防篡改:哈希链、时间戳、自动校验、多节点备份,保障日志不可篡改。
  • 审计追溯:支持存证查询、标准化合规报告生成、穿透式追溯、证据链输出。
  • 区块链对接:支持对接区块链技术,构建双重可信防护体系,支持DID、智能合约存证。

智能合约管理

将数据流通中的业务规则和约束条件固化为可自动执行的合约条款,实现授权自动化、计量自动化、管控自动化。

条款类型 核心内容 执行方式
授权范围条款 可访问的数据范围、字段级别、行级过滤规则 自动配置访问控制策略
使用期限条款 授权开始时间和结束时间 到期自动回收权限
用途约束条款 使用目的和场景限制 运行时校验调用场景
计费结算条款 计费方式、单价和结算周期 自动计量和费用结算
违约处理条款 违约行为和处罚措施 自动阻断和告警
安全与合规设计

全方位安全防护体系

从数据安全、系统与访问安全、合规与审计三个维度构建纵深防御体系,符合国家法律法规和监管要求。

数据安全控制

分类分级与敏感识别

参照《数据安全法》和相关国家标准,对数据资源实施分类分级管理,采取差异化保护策略。

敏感等级 保护要求
公开级 基础访问控制
内部级 身份认证 + 访问控制
敏感级 脱敏 + 审计 + 使用控制
核心级 加密 + 沙盒 + 全程审计

最小权限与用途约束

严格执行最小权限原则,通过用途约束机制限制数据使用目的、方式、范围、时间和频次。

脱敏与结果输出控制

提供动态脱敏、导出控制、结果控制、差分隐私/K-匿名等多层次安全机制。

系统与访问安全

统一认证与访问控制

支持统一身份认证、单点登录(SSO)、API鉴权、动态权限控制,确保访问安全。

网络边界与环境隔离

通过网络分区分域、防火墙访问控制、开发/生产沙盒隔离、安全域部署等措施保障安全。

日志监控与风险告警

重点监控登录行为、接口调用、数据导出、异常行为,支持多级告警机制:

  • 低风险:记录日志
  • 中风险:通知管理员
  • 高风险:自动阻断并应急响应

合规与审计支撑

全流程留痕与可追溯

系统对数据流通全过程进行日志记录与防篡改存证,确保有记录、可核查、可回溯。

法规要求适配

全面适配国家法律法规要求,提供合规保障:

法律法规 适配措施
《数据安全法》 分类分级管理、全流程安全管控、安全审计与评估
《个人信息保护法》 用途约束、脱敏处理、授权审批、隐私合规审计
《网络安全法》 网络分区分域、安全设备防护、安全事件响应

监管支撑能力

提供运营分析看板、审计监管看板、监管穿透查询、风险分析、合规检查报告等监管能力。

数据流通闭环

数据全生命周期管理

数据从接入到回收的完整生命周期,共包含十个环节,实现"进、管、用、出"全流程可控。

1
数据接入
提供方
2
资源编目
提供方
3
目录发布
提供方、运营方
4
检索发现
使用方
5
在线申请
使用方
10
权限回收
系统自动
9
审计留痕
运营方、监管方
8
安全使用
使用方
7
合约签署
提供方、使用方
6
审批授权
提供方、运营方
部署模式

灵活的部署架构

采用中心端分布式部署与单机版部署相结合的混合部署模式,支持多种场景需求。

中心端分布式部署

采用分布式微服务架构部署,支撑平台级运营和统一管控能力。

核心服务

  • API网关集群
  • 身份认证服务
  • 目录服务
  • 空间管理服务
  • 合约引擎
  • 审计存证服务
  • 运营监控平台

适用场景

平台运营、统一管控、运营监管场景,支持多租户、多空间管理。

单机版部署

连接器和沙盒以单机版方式部署在用户本地环境中,保障数据不出域。

支持模式

  • 完全离线模式:数据完全本地化处理,无需网络连接
  • 在线协同模式:与中心端协同,数据仅在本地处理
  • 混合模式:根据数据敏感程度选择不同处理方式

核心能力

具备完整的数据处理能力:数据编目、归集、治理开发、共享等功能,支持数据不出域。

适用场景

本地数据处理、数据安全隔离、高安全等级要求场景,数据不出本地环境。

网络拓扑

网络拓扑遵循安全分区原则,实现多层隔离防护。

用户本地环境
单机版连接器部署区域
• 数据源
• 单机版连接器
• 本地沙盒环境
传输通道
加密安全传输
• 双向TLS 1.3
• 国密加密算法
• 管理/业务通道分离
中心端环境
分布式部署区域
• DMZ区:API网关
• 业务区:核心服务
• 数据区:数据库/存储
• 管理区:运维监控
核心业务场景设计

多场景业务支撑

覆盖数据流通全流程业务场景,支撑政务、金融、医疗、能源等多行业数据共享需求。

数据资源申请与审批

1 使用方发起资源申请

使用方基于统一目录检索目标资源后,提交使用申请,内容包括使用目的、权限范围、使用场景、时效要求、安全承诺。

2 管理方开展审批审核

支持多种审批模式:多级审批、条件审批、按规则自动流转,可根据数据敏感级别配置不同审批流程。

3 授权结果自动联动执行

审批通过后自动执行:开通数据访问权限、配置API凭证、分配沙盒资源、初始化智能合约、启动计量和监控。

数据产品上架与交易运营

1 数据产品封装与发布

数据提供方将原始数据、API接口、算法模型、数据服务等能力封装为标准化数据产品,配置产品描述、使用场景、更新频率、交付方式、授权策略、定价策略。

2 产品运营与使用管理

支持产品浏览与发现、订购与授权、履约与调用、统计与评价全流程管理,提供产品使用监控和分析能力。

3 交易支撑与结算扩展

系统提供订单管理、合同备案、结算管理、发票管理、售后管理功能,支持对接第三方支付和结算系统。

可视化运营与监管

1 运营分析看板

展示核心运营指标:资源数量、接入主体、申请量、授权量、调用量、活跃度、增长率等,支持多维度数据分析和可视化展示。

2 审计监管看板

展示登录认证统计、审批授权记录、数据调用行为、导出操作记录、合约履约状态、异常事件统计,支持全流程行为追溯。

3 风险预警与处置支持

支持识别风险场景:异常调用、越权访问、敏感操作、高风险行为,并根据风险等级采取差异化处置措施,自动触发告警和干预流程。

开发测试与安全使用

1 开发沙盒场景

在样本数据环境中进行模型开发、接口联调、业务验证,开发人员无法接触真实生产数据,保障数据安全。

2 生产沙盒场景

在真实数据受控环境中进行生产级计算、规则执行、合规输出,所有操作全程留痕审计,支持结果自动脱敏和安全导出。

3 开发生产协同场景

通过标准化流程实现模型开发、模型测试、安全审核、发布部署、生产执行全链路自动化,支持版本管理和回滚能力。

连接器内置功能

全功能数据处理能力

连接器作为数据接入、治理、处理、共享与安全流通的重要载体,具备支撑数据不出域、可用不可见、可控可审计的完整技术能力。

数据目录编制

  • 多源异构数据库和组件接入
  • 资源透视与数据预览
  • 元数据管理与血缘追踪
  • 自动化数据编目
  • 数据库驱动动态加载

数据治理能力

  • 数据标准管理
  • 数据分类分级
  • AI数据质量管理
  • 数据质量评估与报告
  • 质量问题跟踪与整改

数据开发能力

  • 拖拽式可视化建模
  • 丰富的开发组件库
  • 用户自定义函数支持
  • 机器学习组件集成
  • AI开发助手对话式建模

任务调度能力

  • 分布式任务调度
  • 工作流可视化编排
  • 定时/周期任务配置
  • 任务运行监控与告警
  • 任务日志与执行历史

数仓建模能力

  • 维度建模支持
  • 事实表/维度表设计
  • 指标体系管理
  • Cube上卷下钻切片
  • 数据分层架构支持

数据分析能力

  • 自助BI分析
  • 可视化图表制作
  • 仪表板设计与发布
  • 图表联动与数据钻取
  • 大屏展示与嵌入

数据服务能力

  • API自动生成
  • API服务市场
  • 接口申请与授权
  • 调用监控与计量
  • 流量控制与安全防护

标签与画像能力

  • 标签体系管理
  • 标签自动生成
  • 用户/主体画像分析
  • 群体分群与群组分析
  • 画像可视化展示

评论