探寻天眼查可信元宇宙背后的技术逻辑

众所周知,技术对于科技型互联网企业而言乃立身之本 。
作为国内领先的商业查询平台天眼查的创始人,柳超博士在国际数据挖掘与知识发现大会前沿会议( KDD Pre-Conference)上阐释了技术、公开数据对于天眼查的重要性 。他表示,数据服务现实的能力,是驱动天眼查可信商业元宇宙不断前进和发展的引擎 。
在柳超看来,天眼查APP复刻了一个与现实世界平行的可信商业元宇宙 。在天眼查所打造的商业世界可信元宇宙里,数据是形成这个元宇宙最根本的要素 。
天眼查把现实世界当中的每一个商业实体进行了全面分析,把它的股权结构、经营状况、经营风险等信息投射到了互联网上 。这些信息就好比人的身高、体重、血型、肤色,通过可信的数据传输和记载方式,在互联网上对商业实体的各类信息加以保真和建模,其实就是在互联网上创造了一个又一个商业实体的分身 。这些分身通过各种不同的商业关系串联起来 。
在天眼查所创建的商业世界元宇宙里,形成了一个密如蛛网,但比蛛网更密、更复杂的关系网 。这张网,就是真实商业世界的原原本本的复刻或者说映射,也即是“数字孪生” 。
探寻天眼查可信元宇宙背后的技术逻辑
文章图片

面对海量数据(行情603138,诊股),天眼查要做得是对各类非结构化信息进行结构化抽取 。柳超表示:“准确的消歧和抽取在开放领域(Open domain)是很难的事,但由于天眼查聚焦商业场景,我们将其变为了商业领域这个闭合领域(Close domain)的数据挖掘问题,并依赖天眼查多年积累的商业垂类语料,训练了专用的领域自然语言处理模型,使得我们能够以极高的准确率进行非结构化文本的实体和关系抽取 。”
依托抽取的实体和关系,天眼查构建了一个实时更新的全维度多层商业图谱 。每层表示一种单独的关系,例如投融资、招投标、司法诉讼等,每层单独进行嵌入(embedding)后,进行多层图谱的对齐,以此可以学习到实体的精确向量表征,得到表征后可生发出多个落地场景 。
打造可信商业元宇宙中,安全是数据行业发展的根本前提 。天眼查有责任建立政府、企业、用户之间的数据可信体系 。
天眼查基于独创共识机制的区块链技术,提供高效的企业公开数据可信解决方案——天眼链;在采集公开数据后,记录数据时间戳,存储在天眼链中,保证数据真实不可篡改、具备司法效力;可用于数据存证、溯源追踪、合规监管、隐私保护等,并可与其他区块链实现跨链交互,“京津冀征信链”就是其中之一 。“京津冀征信链”利用区块链技术,实时、安全、多层次、多维度地传输与共享数据,实时实现京津冀三地涉企信用信息的互联互通 。
数据是天眼查商业元宇宙的基础和核心,在这虚拟空间中实现与真实世界实现同步和拟真,离不开数据的采集、结构化和可信传输 。天眼查商业元宇宙边际的无限扩展和持续,靠的是数据的交互和数据平台的开放,只有交互和开放,才能使这个元宇宙拥有源源不断的新生力量 。数据服务现实的能力,更是驱动天眼查可信商业元宇宙不断前进和发展的引擎 。
出于对技术和数据的重视,天眼查在自身基础上不断开拓,于今年3月推出天眼企服,这是天眼查旗下的另一个平台产品 。通过设定平台的准入、运营和交易的规则,用可信的方式,把企业服务的供需双方联系在了一起,直接服务现实社会中万千企业的日常运营、知识产权保护、采购、拓客营销以及智慧园区的管理、智慧城市的治理等等众多的场景 。使得天眼查复刻的商业实体“数字孪生”从线上又回到了线下,形成了一个闭环的经济系统 。