知产案件中数据同一性的判定

2024 04/23

在知识产权案件中,数据同一性的准确判定至关重要,直接影响案件的审理和判决结果。首先,它在证据保全方面起到关键作用,能确定数据完整性或篡改情况,确保证据的合法性。其次,对原、被告数据的同一性判定有助于证明侵权事实的真实性。最后,确定数据同一性可帮助确认侵权范围,影响侵权后果的认定。可见,数据同一性的判定直接支撑知识产权法律体系的有效实施,是确保司法公正和保护知识产权的重要环节。


数字文件是知识产权案件中常见的载体,软件更是常见的侵权对象。本文将介绍常见的数据同一性判定方法,重点探讨通过文件元信息和软件数据同一性判定等几个方面,与读者进行交流。


一、数据完全相同的判定方法


数据同一性有两个方面的含义。狭义上,它指的是两份数据完全相同,用于证明数据未被篡改或两份数据内容完全一致。广义上,它表示数据来自同一来源,常用于证明一份数据是另一份数据的拷贝并经过修改。


对于数据完全相同的判定,通常有哈希算法、非对称解密,直接对比等方法。


哈希算法是一种重要的数据处理工具,能够将任意长度的输入数据映射为固定长度的输出数据,通常称为哈希值或摘要。通过哈希算法,可以实现对数据相同性的判定,其中包括唯一性和无碰撞性两个重要概念。首先,哈希算法可以确保数据的唯一性。对于给定的输入数据,哈希算法始终会生成相同的哈希值,这意味着相同的数据会产生相同的哈希结果。因此,通过比较两个数据的哈希值,可以快速确定它们是否完全相同,从而实现对数据的唯一性判定。其次,利用专业的哈希算法也能够保证无碰撞性。即使输入数据差别非常微小,也能保证不同的输入数据不会产生相同或相近的哈希值,避免通过哈希值去反推或模拟输入数据。哈希算法通过唯一性和无碰撞性可以用于保证用户的取证数据在取证后是未被修改过的。


非对称解密是一种加密技术,其基本原理涉及使用一对密钥:公钥和私钥。这两个密钥是相关联的,但不同的是,公钥可以自由分发给任何人,而私钥则是保密的,只有密钥的持有者知道。如果产生数据的秘钥未被破解,侵权人依然使用该方式生产数据,那么如果用已知的公钥可以解密该数据,则证明数据来源于权利人的私钥加密成果,可以确认该数据或方法来源。这使得非对称解密成为验证数据来源有效工具,在知识产权案件等领域具有广泛应用。


此外也可通过直接对比的方式,确认两份数据是完全一样的。


二、数据同一性判定常见方法


对于广义数据同一性的判定,可以采用多种方法,包括直接观察法、关键词比对法、文件元信息比较法等。


直接观察法适用于图片、声音、文字等具有直观感受的数据材料,当事人和审理人员可通过主观感觉判断数据是否源自同一来源。当事人在这种情形下的主要证明义务在于哪个数据是先被生产出来。


关键词比对法是重要的判定手段,特别在员工泄露软件工程等情况下。一些软件商可能只是替换了原公司或项目的名称,但未替换特殊的关键词,这可能导致侵权被发现。这类关键词不是从明文上看出特殊意义的,而可能是利用哈希算法将公司或项目名称转换成肉眼无法察觉的数字串,以实现隐蔽的数据保护。这样的字串侵权者不会发现或注意到,而没有被修改,容易露出马脚。


元文件信息(Meta-info)是指与文件本身相关的附加数据,包括文件的创建时间、修改时间、文件大小、文件类型、所有者信息等。在侵权案件中,如果侵权文件在原权利方的数据进行变更,那么元文件中可能会保留与原始文件相同的数据,这足以证明侵权事实。元文件信息经常用于线上数据侵权的判断。例如,图片的EXIF信息可以提供图片的拍摄时间、地点、使用的相机设备等详细信息,为证明侵权提供了重要线索。


此外,一些数据权利人的特殊信息、特殊字体、特殊设计等也可作为辅助证据,证明数据来源。这些方法的综合运用有助于确保广义数据同一性的判定准确性和全面性。


三、利用文件元信息判别同一性


常见的元信息包括时间戳、文件系统信息(FS-info)、图片的EXIF信息以及Word文件的元信息。


时间戳记录了数据的创建或修改时间,可用于比较数据块的一致性,尤其在数据跨系统或跨网络传输时。此外,时间戳还可用于确定同一数据的生成顺序。


图片文件的EXIF(可交换图片文件格式)通常包含有关拍摄设备、拍摄时间、地理位置等信息。通过比较不同图片文件的EXIF信息,可以确定它们是否来自相同的源或设备,从而帮助判断文件的一致性。


操作系统嵌入在文件中的属性信息,如创建时间、修改时间、所有者信息等,可通过操作系统提供的文件属性查看工具或命令获取。比较不同文件的属性信息可帮助确定它们的一致性。


Word文件的元信息包括作者、标题、主题、创建日期、修改日期等描述性数据。这些信息提供了关于文件内容和属性的重要细节,对于文件管理、搜索十分有用,也为Word文件的同一性判定提供了方便的渠道。


Word文件的Meta-info通常会包含以下信息:


● 标题(Title):文件的标题或主题,通常用于简要描述文件的内容或主题。

● 主题(Subject):文件的主题或主要内容,提供了对文件更详细的描述。

● 作者(Author):文件的创建者或最初的作者。

● 公司(Company):创建文件的公司或组织。

● 创建日期(Creation Date):文件的创建日期和时间。

● 修改日期(Modification Date):文件的最后修改日期和时间。

● 版本(Version):文件的版本号或版本信息,用于跟踪文件的变更历史。

● 备注(Comments):对文件内容的附加说明或备注信息。


四、软件的数据同一性判定


软件作为常见的知识产权被侵权主体,其包含丰富的数据信息,本节针对软件产品是否存在同一性进行判定,用以证实是否存在软件拷贝性质的侵权,分别从不同的软件组成部分进行分析。


利用文件目录结构和程序文件内容进行同一性判定。文件结构包括本地的程序文件和服务端文件。本地文件比较容易下载获得并进行分析,服务器因为在对方的机器上,无司法机关介入,较难获取。可以通过文件目录结构和文件名判断两个软件是否存在拷贝或抄袭的情形。


通过数据结构、数据库结构进行同一性判定。如果软件数据库的表名,表结构和名称其它软件一样。并且这种名称还不具有普遍性的情况下,可以判断软件存在抄袭或复制。除了数据库,本地存储的文件也具备这种识别性。


通过软件的配置文件进行同一性判定。配置文件,一般用于启动时影响软件功能的重要文件。后缀为.ini或.cfg等。对于配置文件的配置段名称、配置项键名、注释等。以及配置文件的路径都可以作为同一性或相似性的对比。


通过静态库、动态库文件进行同一性判定。为了重复使用,而不泄露代码。一些核心功能会被制作到库文件中,不需要重新编译。而软件运行依赖于这些库。如果库文件通过哈希算法判断为同一文件的话,则两个软件直接存在拷贝的可能性很大。


通过软件界面、交互行为进行同一性判定。比较软件的用户界面设计,包括布局、颜色、图标、按钮等元素。如果两个软件的界面设计非常相似,可能表明它们可能有关联。注意界面的整体风格和用户体验是否相似,例如,是否使用了相同的交互设计模式、UI组件等。观察软件的交互行为,包括用户操作、响应时间、页面跳转、数据输入输出等。如果两个软件的交互行为模式非常相似,可能表明它们之间存在联系。注意软件的操作流程和功能实现方式是否相似,比如用户注册、登录、数据查询、提交表单等常见操作。


结语


本文介绍了多种数据同一性判定方法,包括哈希算法、非对称解密等技术手段,以及文件元信息、软件数据结构等方面的比对。这些方法的综合运用为知识产权案件的审理提供了重要依据。保护知识产权不仅需要法律制度的支持,更需要科技手段的不断进步与应用。希望本文能在知识产权案件司法实践中有所助益。