当前位置: 主页 > 国内 >

平安资管李果夫:金融数据是石油,AI就是化工厂

时间:2020-03-12来源:互联网 作者:编辑 点击:
2014年,中国债券市场开启“违约元年”,到2019年,违约债券数量已飙升至179只,违约总金额高达1444亿元,而近期所爆发的新冠肺炎疫情更是让大量发债企业的信用状况充满变数。面对层出不

2014年,中国债券市场开启“违约元年”,到2019年,违约债券数量已飙升至179只,违约总金额高达1444亿元,而近期所爆发的新冠肺炎疫情更是让大量发债企业的信用状况充满变数。面对层出不穷的违约事件,每一个信用债投资人都希望能手握一只可以预见未来的“水晶球”,及早规避违约债券。

在平安资管内部,一支由AI工程师组成的团队,通过人工智能赋能,为平安资管超2万亿元的固定收益持仓打造了一套名为“KYZ Credit”的信用风险预警系统,针对有潜在信用风险的债券,平均可在违约发生前300天发出预警,这为投资经理趋利避害提供了极大便利。本期“十人谈”科技先锋系列人物专访将深度访谈这套系统的领军研发人,平安资管人工智能团队负责人李果夫博士。

数据天堂到风险预警神器

李果夫,本科毕业于复旦大学软件学院,随后赴爱尔兰都柏林大学攻读计算机与信息科学博士学位,后在上海高校任教。而之所以从学界跨界进入业界,在李果夫看来,平安资管在人工智能实践领域丰富的数据资源和庞大的应用场景,是促使他加盟平安的直接动力。

人工智能,作为过去数年最闪耀的计算机学科分支之一,从基础理论到算力再到业界应用,都处于高速成长期。但发展到当下阶段,如何找到合适人工智能的应用场景,本身就成为了一个制约人工智能普及的瓶颈。“在初期的人脸识别、文字识别等高频场景不断普及之后,下一个价值点在哪里?”此时,当李果夫了解到平安资管启动了一个名为“智能债券一体化平台”(KYZ)的项目后,很快就被吸引加盟了。

平安资管吸引李果夫的,除了基础的债券市场应用场景外,更在于平安资管持有近3万亿元固定收益头寸、超 20年的专业固收投资经验,拥有海量债券交易、信用评级数据,堪称是中国债券领域开展人工智能实践的“数据天堂”。

借助KYZ平台,平安资管首先从底层类41个数据源开始,逐层清洗、加工、抽象,形成了包括企业库、债券库、市场库、宏观库、行业库等在内五大主题库,涵盖了超600万家企业、超20万只债券的基础信息。在此基础上,数据专家们再对这些结构化和非结构化信息进行深度挖掘和深度加工,形成全直通、全口径、全流程、全方位的数据湖,真正对债券投研发挥实战意义。

有了如此强大的大数据平台,结合平安资管沉淀20年的专家经验和李果夫团队研发的前沿人工智能模型,“KYZ Credit”风险预警系统的诞生自是水到渠成。在帮助投资经理高效筛选低风险企业,关注高风险标的,实施自动化预警方面,“KYZ Credit”可谓做到了“人机互动”的极致,堪称债券领域的“风险预警神器”。

举例来说,自武汉新冠肺炎疫情爆发后,李果夫团队研发的“KYZ Credit”系统通过对大数据和舆情分析,结合历史疫情的比较,迅速定位了一组核心分析因子,指出在这一特殊时期内,除了企业所在地和所在行业外,企业自身的财务质量、经营情况、盈利能力、短期偿债能力、债务结构/负担相关的指标将比以往更为重要。在此基础上,借助“KYZ Credit”风险预警模型,系统自动进行企业风险打分,成功捕捉到了一批可能出现风险大幅上升的企业,而后再基于企业关联图谱和供应链图谱,通过风险的逐层传导,进一步排查出一批可能受到波及的风险企业,第一时间为信评分析师和投资经理给予风险提示。

图示:KYZ信用风险预警模型总览;来源:平安资管

根据系统回测数据显示,目前“KYZ Credit”已经展现出极佳的信用评级调整预见性。针对有潜在信用风险的债券,平均可以在违约发生前超300天发出预警。

在刚刚过去的2019中,“KYZ Credit”系统输出的Top10风险预警名单中,有8家在当年发生实质违约;而在所有被归为高危预警的企业中,有约六成企业在随后6到12个月时间内发生实质违约,有近三成企业遭遇外部评级下调。由此可见,“KYZ Credit”通过提供具有前瞻性的信用债违约风险信号,真正成为信评分析师和投资经理趋利避害、提升效能的实操利器。

成为平安资管的发动机

李果夫带领的平安资管人工智能团队现拥有15名成员,包括5位博士,专业背景从NLP到CV再到时间序列分析、数据挖掘等技术领域都有覆盖。更幸运的是,他们从来不是单独在战斗,而是背靠多个团队,相互赋能。

在模型构建方面,参与KYZ项目的除了李果夫的人工智能团队,还有一只金融模型团队,两者共同成为了KYZ的重要引擎。例如,人工智能团队通过其擅长的NLP(自然语言处理)方法,从大量非结构化的文档中解析抽取出各种信息,为金融模型团队的建模工作提供基础数据;与此同时,对于某些金融模型,由于底层的数学理论统计基础与人工智能极为相近,两大模型团队也会时常并肩作战,进行新的尝试和探索。

如果说人工智能团队和金融模型团队更偏向于数据思维,用数据和模型说话,那么日常工作中李果夫的人工智能团队还少不了与传统的信评分析师、风控经理、投资经理相互协作。事实上,在“KYZ Credit”风险预警系统开发中,李果夫的人工智能团队经常要做的一件事情就是借鉴当前深度学习领域非常热门的“知识蒸馏”思想,把专家的知识转移到模型中去。

“我们大量依赖于公司内业务专家的行业经验,帮助我们对具体的业务问题,特别是信用分析问题有更深入的理解,为我们对模型的输出结果进行校验”,李果夫极为感谢平安资管信评分析师团队的帮助。

当然,科技的最佳实践效果是能实现相互赋能。“金融行业的核心是信息,KYZ的核心口号也是‘先知、先觉、先行’,而这一切都依赖于对信息的快速、全面的掌握,以及深度、精细的加工。如果说数据是信息工业的石油,那么AI团队就是化工厂,我们的任务是对石油进行精细加工,其目标就是让这些数据所能产生的价值最大化。”李果夫如此定位自身团队。他相信,好的人工智能模型同样可以反哺赋能信评分析师和投资经理。

那么,到底人工智能技术在多大程度上可以提升现有的信用研究?李果夫以债券评级工作举例,“如果一个资深分析师花了大量精力去进行研究,那么人工智能模型与之相比未必能有明显优势。但即便只是与一个10年经验信评分析师相当,这一系统依然有着重大意义——培养一个优秀分析师的成本之高昂,加之市场上各类发债主体数量之庞大,使得这类系统为分析师所腾出的时间价值就已经相当可观了。”在李果夫的期待中,他希望团队设计出的人工智能模型可以帮助专业分析师去分析和过滤海量数据中的每一个细节,去帮助他们超越人类工作记忆区容量的限制,真正做到人机合一。

“人工智能团队希望是一台发动机,为平安资管的投资实践和KYZ债券生态建设提供源源动力。”李果夫透露,除了已经在平安集团内多家专业公司投入使用的“KYZ Credit”系统外,他们正在进行更多项目的深度研发,包括对权益量化策略、算法交易等资管其他业态需求的支持。“当下我们正在从投资端走向发行端,用人工智能模型对包括承揽、承做、承销、投后期管理等债券生态链上的各个环节进行赋能。”

这其中,李果夫团队目前正在投入的一项重要工作是智慧文书系统一——通过对过往数万篇债券发行募集说明书的分析,帮助发行团队从现有文本中抽取需要的数据,自动生成相对完整的发行说明书。“这项工程非常有挑战性,通过对海量文书的学习,让AI能够自动生成一篇长达200页的,结构复杂,且包含大量精确且专业信息的文书,可以说是已经进入了真正的‘无人区’。”

李果夫相信,这些研究若能出成果,将会更好地赋能平安资管和平安集团其他专业公司,乃至整个资管生态圈中更多的机构。对此,他充满信心。

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
文章导航
推荐内容