为什么要使用数据水印?
大数据时代,数据共享和数据交换的需求不断增多,但由于缺乏有效的安全控制和版权保护措施,企业在数据共享使用过程可能会碰到以下问题:
1. 数据提供内部或第三方机构使用,一旦发生数据泄露,由于缺少办法,数据制造方无法查清泄漏主体,溯源定责 。
2. 数据共享交换过程存在被盗用、侵权风险,但因缺乏保护手段,数据拥有者在版权纠纷中难以证实对数据的所有权 。
针对上述问题,可以考虑使用数据水印产品来解决。
使用数据水印原因
数据泄露无法溯源定责
在目前新兴的外包数据库服务模式中,数据库服务器由非可信的第三方提供,数据库的物理文件可以轻易被第三方拷贝,数据拥有对数据库实施版权保护的需求也日益迫切。Internet的快速发展促使这些数据供应商提供远程访问数据库的服务,用户在支付一定的使用费之后便可以远程登录数据库,使用里面的数据。虽然远程登录服务能为终端用户提供极大的方便,但数据供应商也同时面临数据被的危险。如果将他从数据库里获取的大量数据转卖给他人,这些信息机构将会蒙受很大的经济损失。对于上买卖的泄露文件,也没有办法溯源其泄露源,数据过程泄露无法对事件定责追溯。
数据水印概述
数据库水印是将水印信息(数据量少)隐藏到数据库载体(数据量比较大)中,有两种隐藏方式:一种是隐藏在数据库的文件头中,另一种是隐藏在数据库包含的关系表中,通常指的是后者,本文指代也是该方式。
具体如何将水印信息隐藏到数据库(关系表)中呢?其方案框架如图1所示。它包括水印嵌入端和提取端,包括两个重要算法:水印嵌入算法和水印提取算法。水印嵌入端:企业或组织机构通过水印嵌入算法,将水印标识信息W,隐藏到原始数据库D中,得到含水印的数据库DW,为了保证安全性,该过程通常由密钥控制。水印提取端:当数据库DW发生泄露后,企业或组织机构希望查找清楚是谁泄露了该数据库,它通过水印提取算法,在获得的数据库D’W中进行水印提取或相关性检测操作,进而溯源确定的泄露主体,追究责任。
需注意的是,在数据泄露过程中,由于泄露主体可能会有意或无意对数据库进行一些操作,比如对数据库的元组进行随机抽样、选择部分列、修改数据库的某些值或对格式进行调整,这些操作通常被称为水印攻击(后续将介绍),通常会对水印信息造成一定影响,这要求设计的水印嵌入/提取算法具有一定强度的鲁棒性,即遭受攻击后同样能提取/检测到正确的水印信息。
数据水印嵌入过程
在不影响原数据使用情况下,将水印信息嵌入到表数据、文件数据中,从而解决数据在共享、分发、使用中数据泄露无法溯源的难题,进一步保障数据安全使用,释放数据价值。
1)选取主键,配置分组参数等信息;
2)配置水印嵌入的数据类型、水印算法、水印强度等信息。这一步非常关键,结合业务场景,字符型、数值型等数据类型,选择合适的算法;
3)嵌入水印信息到相应表数据、文件中,同时水印溯源系统将此次打水印的相关信息归档。
以上信息由专业从事网络数据水印公司的北京派客动力于2024/3/26 10:24:33发布
转载请注明来源:http://fzhou.mf1288.com/bjpkdl-2724276747.html