大数据解读2014年中国裁判文书公开之(二):数说借款合同纠纷
大数据与统计分析相比,最重要的区别在于对全量数据的分析,能够对大规模错综复杂的非结构化数据梳理、分析,并以结构化数据向用户展示。对于审结公开在互联网各个站点的裁判文书而言,目前的数据采集技术已经可以完成80%的全网数据采集,在某种程度上已经满足用户大部分的信息需求。但是对于风险极度敏感,以及追求极致的数据体验而言,全量采集或者说100%规模化采集分析才是真正的司法大数据运用。全量司法数据采集目标的实现,根据笔者接触的技术趋势,当下的传统技术已经出现瓶颈,采集成本极高。在数据大规模、全面、精准、实时响应的发展方向上,一定是人工智能技术才能完成的任务,各互联网公司间在数据量上的竞争,某种程度是自身人工智能技术的比拼。正如百度首席科学家吴恩达所说:“谁赢了人工智能,谁就会赢得互联网”。
随着互联网信息的快速积累,人们开始深入思考从数据中获取商业机会。在法律服务行业、金融服务业的应用场景中,公开的司法信息并不直接等同于商机,信息需要转化为知识才有可能进一步成为具体的商机,特别是法律领域的数据只是大量与法律职业相关的文本。因此大数据相关行业的竞争壁垒主要在于海量数据的处理,而非数据的积累,只有从海量庞杂数据中提炼出来的规律和知识才是黄金。通过人工智能算法实现机器学习是实现预测能力的必然途径,有了海量数据和机器预测能力之后,《大数据预测》一书中所描述的场景将不会离我们太远:“人的每个行为都将被预测,无论是消费、思考、工作、放弃、恋爱、生育、离婚、还是捣乱、撒谎、欺骗、盗窃、凶杀、死亡”。法律实践亦然,诉讼案件是否可以胜诉?什么时候出现法律需求?大数据可以给我们作出回答,这就是从数据到商业机会的分析,本文将此过程称之为“D2O”--- Data toOffline/Opportunity.
通过对全国2014年审结互联网公开裁判文书的分析,我们发现各地的民事案件进行简单的大数据分析的确为我们提供一种知识,也对2015年争议多发领域能够作出判断,但是这样的分析并没有超越法律人的经验直觉,并没有完整展示大数据分析对未知领域的预测。因此,运用人工智能算法对法律文本深度解析是获得更多知识的比用手段。仅仅对各地争议描述性的大数据分析,对于非法律专业领域的读者而言,或许可以提示矛盾多发的领域,生活中留意潜在的争议风险。本文希望从民事案件中提炼法律人有待进一步思考的法律现象,本文着重聚焦特定民事领域中的一种争议:借款合同纠纷,而非对各地的多发案件逐一描述侃侃而谈。
图一 2014年全国案件类型(案由)排序
图二 2014年上海案件类型(案由)排序
通过比较全国和上海2014全年的裁判文书案由排行,借款合同纠纷毫无悬念的排行第一。据最高院对民事案由的司法解释,借款合同类目下常见案由还有:金融借款合同纠纷、同业拆借纠纷、企业借贷纠纷、民间借贷纠纷、小额借款合同纠纷。上海作为中国的国际金融中心,上海地区金融业发达、金融借款机构完备,上海的借款合同纠纷能够反映中国借款纠纷的趋势。抱着大数据解读上海借款合同纠纷的目的,在大数据分析的基础上,本文利用国际学术研究认可的权威统计工具SPSS对88364份上海地区的借款合同的裁判文书进行交互分析。需要说明的是,本文抽样研究的金融借款机构(下称“金融机构”)主要是以下这些机构。
1、银行;
2、合作社、信用社;
3、担保有限公司/担保公司/融资担保有限公司;
4、资产管理有限公司/资产管理公司;
5、投资有限公司/投资管理有限公司;
6、租赁有限公司/国际租赁有限公司/金融租赁有限公司;
7、小额贷款有限公司/小额贷款股份有限公司;
8、消费金融有限公司;
9、金融信息服务有限公司;
10、典当行。
通过观察上海地区互联网公布的88364份借款合同纠纷裁判文书,本文从涉诉当事人的视角,对涉诉金融机构进行了类型化处理,为避免样本不足增加数据描述的可靠性,同时对数据分析量进行了扩张,数据量不仅包括2014年全部裁判文书,还包括全部在互联网公开的裁判文书。交互统计分析如下:
表三:上海法院与借款人类型间交互分析
通过分析上海地区公布在互联网上关于借款合同纠纷的裁判文书,我们发现上海市浦东新区人民法院是上海所有法院中,审理借款合同纠纷最多的法院,总的裁判文书量达到了25925件,占全部借款合同纠纷裁判文书的29.3%,此外我们留意到上海市浦东新区人民法院审理的大部分案件中的当事人同时包括机构和自然人,达到了61.4%,远比公司(机构)之间借款合同纠纷1.4%高出太多。由此可见,上海市浦东新区法院管辖范围内,借款主体同时包括自然人和公司的借款行为,相较于自然人之间、公司之间、金融机构与自然人之间、金融机构与公司之间,存在较高的借款失败风险。
通过观察数据,上海市虹口区人民法院的所有借款合同纠纷中,高达86.9%的案件包含自然人当事人,具体来讲两种情况:自然人之间、自然人与金融机构之间占据了上海市虹口区人民法院借款合同纠纷的绝大部分。因此我们推测,在上海市虹口区人民法院管辖范围内,自然人之间、自然人与金融机构之间的借款活动,相较于其他参与主体借款行为更加容易导致失败。需要指出的是,自然人参与借款活动并不是导致借款失败的原因,本文仅对案例的相关因素观察,并非对借款纠纷的原因归纳分析,至于真正的原因或许非常复杂,本文不作溯因推理研究。
考虑到上海市铁路运输法院和上海海事法院的数据量较少,不足以支持实证分析,本文将对此两家法院体现的数据情况做例外情形处理,不作为趋势预测的依据。对于涉及当事人为机构(企业)之间、机构与金融机构之间的的借款合同纠纷,通过数据我们发现上海市高级人民法院管辖范围和审级内占比较高,尽管数量只有267件但占比达到了65.1%,可见涉及机构的借款行为,更倾向于在上海市高级人民法院发生一审、二审甚至再审。
表四:借款金融机构与借款人类型间交互分析
根据金融风险控制理论及实务经验,本文抽取了涉诉金融机构的名称特征,抽取的原则是某类金融借款公司参与到借款活动中时具有一般化的交易结构,具有特定可识别的法律关系,例如p2p金融方面的争议涉及的机构,根据经验总结往往是金融信息服务有限公司、信息服务有限公司、科技有限公司、信息技术有限公司。通过全量数据交互分析,我们得出以下结论:
1、合作社、信用社在上海地区发生的借款合同争议中,与公司机构发生的借款争议占据了87.9%,说明这两类机构对于公司机构的借款争议缺乏必要控制。
2、小额贷款有限公司/小额贷款股份有限公司,是民间借贷市场比较活跃的主体,从数据上来看,小贷公司对于个人的借贷风险控制较好,在小贷公司参与的借款活动中,同时涉及自然人和公司(例如自然人借款公司提供担保)借款风险控制较差,达到了65.7%,高于涉诉自然人26.2%占比。通过观察这些裁判文书,我们发现大量的小贷公司贷款给股东或者股东关联人开的公司,进而发生借款争议时出现了大量的自然人和公司作为被告人。而根据银监会《关于小额贷款公司试点的指导意见》,明确规定:“小额贷款公司不得向股东发放贷款。”由此,小贷公司在将来借款争议风险较大,小贷公司将面临重新市场洗牌。
3、投资有限公司/投资管理有限公司、担保有限公司/担保公司/融资担保有限公司,此两类公司的情况类似,同时涉及自然人和公司的借款风险多发,分别占据借款争议案例的51.1%和64.9%,从商业经验来看,这两类金融机构在贷款业务上多与公司机构产生借款交易,交易频繁也是争议多发的一方面重要原因,因此对于涉及自然人和公司之间复杂借款关系的借款交易,在风险控制上应当全面对涉及的自然人和公司进行风险评价,担保关系、牵连关系往往与借款争议存在相关关系。
4、消费金融有限公司的借款争议情况比较纯粹,98.1%的争议与自然人发生,但数量在八万多份裁判文书中只有区区51份,说明消费金融类公司并不是借款争议多发的主要群体,其主要客户群体为自然人的小微客户,对于小微客户的信用情况,可以利用最新的大数据征信技术,在取得授权情形下对个人信用情况进行调查。
5、租赁有限公司/国际租赁有限公司/金融租赁有限公司,借款涉诉案例较少,在数据上的分布比较平均,这类主体不是借款合同纠纷的主要风险主体。
6、资产管理有限公司/资产管理公司/资本管理有限公司,在其所有涉诉案例中84.3%的案例为公司机构为诉讼当事人,自然人和公司共同涉诉的情况紧随其后,说明了资产管理类公司的主要客户是公司机构,在借款活动中更多充当担保责任,涉及公司主要是其他金融机构,例如银行。资产管理类公司在涉及公司机构的借款合同纠纷中占比过重,资产管理类公司与担保类公司相比倾向于对公司机构的债务担保,体现了资产管理类公司的对外担保与担保类公司又本质差别,担保只是整个业务链条的一个环节。
7、金融信息服务有限公司,包括各类从事金融借贷的信息科技公司就是大家平常所说的p2p金融公司,从上海的涉及此类主题的借款诉讼来看,p2p平台金融公司的涉诉案件非常少,在整个借款合同案件中可以忽略不计,仅从少量的数据来看,p2p金融公司与自然人的诉讼争议多发,在占比上达到了66%。考虑到目前p2p金融的诉讼案件较小,大量的p2p债权尚未到期,我们可以合理预期p2p金融与自然人的争议将在未来一段时间激增,p2p平台在借贷交易中的地位是否与电商c2c平台类似?p2p金融借贷平台应当承担怎样的法律责任并没有明确的法律规范,p2p金融平台的义务清单应当包含哪些内容,最新出现的这些案例或许可以给我们金融监管提供一些思路。
8、银行,是借款合同纠纷的涉诉大户,占据了八万多份借款合同纠纷的16.9%,数据上,银行与自然人的诉讼共6716份占比44.9%,银行、自然人、公司三方同时涉诉的数量占比尾随其次,占比38.7%,银行与公司机构的涉诉案例较少,仅占比16.4%。由此可见,银行是借款合同纠纷特别是金融借款合同纠纷的基础数据,银行面向自然人的借款合同争议多发,在借款风险控制上存在难度,特别是对自然人贷款后违约风险的监控,目前没有行之有效的防控方案,大数据实时监控或许是值得考虑的贷后风控方案。
结语:
运用交互分析的统计手段对裁判文书中的细节进行深度解析是本文希望倡导的方法论。根据大数据分析全量性、相关性的分析求证视角,初步尝试描述上海各法院涉诉当事人的抽象类型,对涉诉金融机构与其他当事人的类型进行抽象性描述。本文并非从数据上印证因果关系,尽管我们已经做到了全量数据分析似乎可以完成高似真性的归纳推断,而是着眼于借款风险预防的视角,观察什么时空条件下的借款主体组合存在借款失败的风险。在金融风控资源有限的条件下,避免争议实现无讼仍然是工作目标,各类金融机构加强重点风险人群的排查,做好贷后实时监控方是本文推崇的借款合同争议解决之道。
原文发布时间为:2015-05-17