1997年,由吕克·贝松执导的奥斯卡金像奖电影《第五元素》上映,在这部探索未来世界的科幻电影中,每个人都在为第五元素的唤醒而奋斗。

有趣的是,在现实世界中,今日社会各界也开启了对一种新的“第五元素”的追逐,那便是“数据”。在三年前发布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中,数据被明确为继土地、劳动力、资本、技术要素后的第五要素,数据是数字经济时代中至关重要的生产力也由此成为了行业共识。

当下,人们已然洞悉数据要素的价值,企业要想创造释放数字生产力,获得增长离不开数据要素的积累与应用,但在具体的实践中,问题却来了:如何真正积累、挖掘数据并有效地释放数据的价值?

带着这一问题,在于近日举办的2023世界人工智能大会上,朋湖专访了聚焦于数据智能、引领产融数字化的数据科技企业数库科技创始人兼总裁沈鑫,在与他的交谈中,我们看到了一条有效释放数据生产力的清晰路径。

据悉,数库科技成立于2009年,长期致力于在金融及产业领域提供基于产业逻辑的智能数据产品与系统服务,助力金融机构、企业集团、政府部门解决业务场景中的数据和系统需求。

01

开采数据富矿”:自动化工业化

“第五要素”崛起的背后是企业的认知变化,沈鑫表示,在今天的数字化转型浪潮中,伴随着云计算、区块链、AI等数字化技术的演进,绝大多数企业都已经认识到只有掌握数据方能打造核心竞争力,以数据驱动的智能决策正在成为企业增长前进的最佳利器。

但数据驱动智能决策的前提条件是“高质量”数据,打个比方,如果说算力+算法架构打造的是驱动决策的引擎,数据便是驱动引擎的燃料。数据的质量没法提升,那么算力、算法再强,就像再好的汽车没有汽油没有动力之源也无法跑起来一样,智能决策也无法实现。

“算力、算法再强也无法取代数据的不够好,数据质量是发展质量,我们发现其实市场非常缺乏高质量的数据,这是我们看到的行业痛点,也是数库科技所锚定的价值点:开采数据‘富矿’,积累并应用高质量数据,从而释放数据生产力,让数据智能真正得以实现。”他强调,这一“开采”的过程一定是自动化、工业化。

具体来看,数据“富矿”如何开采?第一步,建立“制造工厂”。据朋湖了解,基于机器学习、深度学习等技术,数库科技打造了一个智能化数据工厂——DAS(Data Automation System)智能化数据工厂,旨在帮助数据部门以批量化形式高效、精准地生产数据。在这一自动化智能工厂中,银行等金融机构可以处理自身各类非结构化文档数据,也可以盘活存量数据资产,让数据流动起来,从而打破“数据孤岛”窘境。

在这一工厂的“流水线”上,从数据化文档管理到结构化数据集成再到己成数据标准体系的全流程中,数库科技构建了三大报表、财务附注、企业图谱、产业链等上百个模型,并基于此形成了行业领先的数据处理能力。据悉,数库科技拥有最全面的上市公司附注数据库(其中包括目前领先市场的上市公司图谱数据库),此外,DAS全自动化的系统运转也让数库科技的主要数据产品都能实现高效的自动化量产,目前,三大报表可实现5分钟生产交付,财务附注可做到15分钟生产交付。

数据的“制造工厂”有了,那么,第二步便是要整合、搭建连接平台,让海量的数据纳入到一个生态网络体系当中。为此,数库科技历经十余年打造了一个全面的产业链网络,名为“SAM产业链”数据体系,SAM产业链在 GICS分类标准的基础上,结合中国行业实际情况,将其四层产品分布直接扩充至十二层,形成了从广义行业到细分业务及产品的动态产业链生态网络体系。

在这一产业链平台上,数库科技实现了对全部 A 股、港股、美股、新三板、发债企业等近 40000 家头部公司全部披露产品的标准化,也将全国近 6000万家工商企业与产业图谱打通,实现了全领域的企业覆盖,这为金融领域数据多维度串联打造了坚实基础,可广泛应用于产业监控、区域产业解析、智慧招商、智能风控、资产管理、智能投研、优企追踪、产业上下游精准营销、智能资讯、量化投资等多维度业务场景。

同时,为了充分挖掘数据潜力,数库科技推出了SmarTag文本分析引擎,其旨在通过自主研发的NLP算法将市场中的高频非结构化新闻资讯转化为机器可读的结构化元数据,便于用户通过机器自动读取非结构化文本的同时将核心信息与数库科技已有的数字化金融信息深度串联。

据介绍,SmarTag可对公司、行业进行即时追踪,并与产业链体系、企业图谱深度结合,呈现下游或关联方之间事件的传导反应。自然语言处理引擎在实时资讯文本中不断抓取到的新概念可持续反哺至金融及产业知识图谱中,反向赋能数据生产引擎并提升其数据生产精准度,从而实现金融及产业知识图谱的自我进化。

我们知道,工业革命引领着社会生产方式从手工作坊式到工业生产线的升级转变,这也是工业现代化的标志。对于数据而言,在当下预计“到2025年,世界上的数据流量将比迄今人类所使用的流量总和多出三四倍”的信息爆炸时代,亦需要迎来“数据工业化”的变革演进,我们看到,这正是数库科技正在做的事情,让数据从生产、积累、保存到调取、连接、应用都远离“手工作坊”,而是进入高度自动化、工业化的世界。

沈鑫坚信,唯有低门槛、低成本且高效、可持续的获取高质量数据,才能让数字化转型的变革力量真正“飞入千万家”。

02

深耕产业土壤:产融一体化、智能化

“数据富矿”的开采,产业空间是土壤,数库科技深谙此道,沈鑫告诉朋湖,数据不仅在数字经济发展中扮演着不可或缺的角色,同时,也通过数实融合、产融结合推动着实体产业的变革与升级。

因而深深扎根于产业的土壤,以数据智能搭建金融深入实体经济的桥梁成为数库科技的发力方向。“数库科技的方向是从金融领域出发,打通各个产业,即产融结合。”他解释道,“金融行业并非是独立存在,它更像是一个连接桥梁,覆盖着所有的实体经济。”

在沈鑫看来,经济是肌体,金融是血脉,两者共生共荣,没有健康的金融就没有健康的经济。站在国家战略角度,如果一个国家的金融交易是基于小道消息而并非是精准客观的信息,那么,经济也无法得到健康发展。反之,数据驱动下的智能决策能够为金融行业的良性发展提供充沛动力,同时,不断畅通的金融血脉也能为实体产业经济的健康发展提供有力支撑。

仰望数字化蓬勃发展的星空,必须脚踏数据的产融结合。毫无疑问,产融结合是未来新经济形态的必然选择,也是企业实现数字化跃升的必由之路。

那么,产融结合如何落地?或者说,在赋能产业、实际的落地场景中,如何让数据驱动智能决策真正得以实现?

针对不同的产业场景,我们看到,数库科技决定多走一步,提供不同的解决方案。面向银行对公业务,数库科技推出了Clue对公数字化引擎。据介绍,Clue对公数字化引擎是数库科技利用已有系统能力面向银行对公业务的数字化转型解决方案。基于数库三大核心数据(SAM产业链图谱数据,企业图谱数据和SmarTag舆情及标签数据),为银行提供智能获客、智能风控、智能行研服务,赋能银行对公业务的数字化转型。

其中,作为目前的主推产品Clue智拓客,围绕国家战略产业和区域重点产业搭建产业链全景图,系统呈现区域内企业分层、分类信息,为银行提供产业链、产业园、网点周边、存客拓新、专题聚焦五大营销获客场景。

面对各地“数字政府”的建设要求,数库科技推出了产业监测大脑平台,其综合运用人工智能、大数据等手段,从产业分析、企业画像、情报收集等维度打造区域产业数字化平台大脑,数字化、智能化辅助地方政府在产业研判、招大引强、产业集聚等方面更聚焦、更智能、更科学。

面向券商资管领域,数库科技搭建了产业链知识管理和分析平台与全景知识图谱平台,深化产业链投研分析平台能力以及营销、风控等多种业务场景中的业务支撑能力。据介绍,产业链知识管理和分析平台是基于产业节点细分和产业链运维平台,构建产业链上下游关系,形成符合投研框架的产业关系图谱。数据指标通过产业链图谱平台进行融合,形成对产业链关键指标数据的持续跟踪,最终形成产业链研究知识管理平台。

知识图谱平台则通过事件和各类实体的实时解析,利用事件主体、事件要素、产业链上下游、供应链、股权关系、高管人物、担保关系等数据构建实体和关系,使用各类算法建模,进行聚类分析、路径挖掘分析、风险事件传导分析,在营销、风控等多种业务场景中构建数据平台的业务支撑能力。

在提供多重场景解决方案的同时,数库科技也在思考着如何让数据驱动的决策更加智能化,换句话说,如何让人们获得“知识”的路径更加简单?

在世界人工智能大会数库科技举办的“Smart Data · Smart Way——数据智能论坛”上,我们看到了数库科技对这一思考的新成果——统一产品图谱(UPG)。统一产品图谱(UPG)是在数库原有12层级和上下游数据维度SAM产业链数据框架体系的基础上,增加了工艺、生产环节、概念、材质、品牌等全新相关实体的引入,以及它们与公司、产品之间更为丰富的关系,进一步将产业数据网络上的每一个节点信息刻画得更深入、更全面、更精准。并且,基于UPG统一产品图谱的开放式立体框架,未来,更多各种类型的关系都将能够更好地融入到整个产业图谱体系之中,并支持叠加更加复杂的模型,在数字化转型应用的各个场景中发挥效能。

数库UPG与SAM体系的对比

并且,在世界人工智能大会展台现场,我们还看到了数库科技基于统一产品图谱(UPG)与大模型结合的概念型产品“istari”。朋湖观察到,“istari”能够提供对话式的交互体验,用户输入问题后,“istari”可以将问题经过大语言模型解析后,转化为对统一产品图谱(UPG)相关的查询,最终可将相关的专业产业知识及各个知识点间的关系呈现。

这是一次数据产品与大模型的碰撞,对于大模型的看法,沈鑫表示,大模型是提升效率的最佳工具,能够加速数据的生产,也能让数据驱动的决策更加智能化。

03

写在最后

在今天,各行各业进行数智化投入已成汪洋之势,投入的成本不计其数,人们满怀决心,高喊着要增长、要高质量发展。

而在口号漫天飞舞的背后,人们要记住的不过寥寥数语:数据质量就是发展质量,唯有高质量的数据才能驱动数智时代的真正到来!

这也是数库科技所坚信的,我们清晰地看到,数库科技正在数据智能驱动产融数字化的道路上越走越远,对于未来,我们也将看见数库科技以前沿信息科技与中国数据标准,从中国的视角搭建起数字中国与世界链接的桥梁。