360数科首创联邦学习层级聚合体系,破解隐私性与可用性矛盾
日前,AICon智能金融技术与业务结合专场在北京举办360数科隐私保护与安全计算研究院院长沈赟受邀参会分享,并结合金融科技场景,从用户增长跟风险智能入手,就破解隐私性与可用性矛盾现场嘉宾展开了探讨
自《个人信息保护法》正式生效实施,这部围绕个人信息保护的基础性法律的影响正在逐步释放伴随着政策的有效引导及各行业的自律探索,人们隐私保护意识得到大幅提升在此背景下,联邦学习得以在金融领域广泛应用
可是,主流的联邦学习需要结合特定的隐私技术才能达到隐私保护的目的,且对服务器与传输量有着不低的要求因此,就如何解决在多种复杂场景下,联邦学习运算速度和隐私保护有机结果的问题,行业中尚没有一般化的通用解决方案
为应对以上问题,360数科首创研发了基于联邦学习的层级聚合风控模型体系,并通过三个层次的设计,凸显了该体系的应用价值。
第一,数据保护在层级聚合风控模式下,360数科建立了非常严格的数据管控规范,各类数据要素在学习过程中通过联邦学习进行交互与融合,原始数据不出库,最大限度保障了各方的数据安全在此过程中,360数科利用自研的隐私保护机器学习平台FastFL,支持多方在不传递原始明文数据的情况下,进行数据求交,特征处理,模型训练,评估等全流程合作建模
第二,联邦层级叠套正如同同手同脚游戏,通常以两人三足为基本单位进行训练,从而提升整体正确率和效率为了降低在多方联邦学习中的各方数据耦合性,避免在实际应用模型时,因一方数据无法获取而导致模型完全失效的问题,360数科创新性地将多方聚合分解为多个双方聚合,通过多次训练将稳定的单个模型板块堆叠起来,形成一个最终大模型层级叠套设计克服了联邦学习在实际执行时难以协调两方以上数据要素进行同步聚合的操作困难
第三,数据源截断设计作为科技链接属性平台,360数科需保证自身桥梁定位的稳定在这一设计下,只需做少量调整,就能应对数据源的突发性变化,保障了整个风控体系的稳定性和可靠性
沈赟表示:金融与科技的融合,如何兼顾隐私性与可用性的关系,既是企业必须面对的道德底线,也是考验企业技术是否过硬的先决条件未来,360数科将继续夯实数据流通的安全基础,与行业共进,促进隐私计算行业健康发展
360事业部首席算法科学家费浩军认为,未来的发展需要专攻三大方向:一是精细化运营能力建设;二是理解客户的能力要不断加强;三是IT基础设施和架构能力建设。