经典网文分享: 别再谈AI颠覆法律了，AI只是一种做法律的新方法

前几天，有幸参加了百事通组织的一场活动，有机会向一些行业大咖请教AI+法律的问题。

但在活动过程中，我发现当前法律行业对AI的认知仍然没有脱离2017年的论调，更多是从【机器认知】的角度来谈AI，认为AI会逐步具备对法律概念的认知能力，并在认知能力的基础上自行提供法律服务，从而取代传统的法律人工服务，进而颠覆整个行业，到达科幻电影中描述的【全智能法律系统】。

实际上从我们华宇元典这几年的实践来看，这一轮的AI革命从爆发之初就与大数据、机器学习不可分割。而大数据、机器学习更多是一种【通过数据驱动方式达到智能效果的路径】，而非真正地让机器具备像人类一样的认知能力。

举个简单例子，法律人工作中常用的法律检索，可以说是当前与AI技术融合度最高的领域。

传统的法律检索（以案例检索为例），首先是通过法律人对案件情况的梳理，从案情中【提炼】关键词，而后借助【关键词】查找目标案例。这种方式找到的目标案例中一定会【包含】我们设定的关键词。如果案例中不包含关键词，也就不会被系统推送给我们，实际上运用的是【关键词再现】的操作方式。

但这种检索方式往往有两个弊端：

第一个弊端是所谓的【关键词悖论】，这点在做陌生领域的法律研究类检索中尤为明显。我们做法律检索正是因为对这个领域不熟悉，但提炼关键词又要求我们了解这个领域，可以针对这个领域的理解提炼出合适的关键词。

因为不理解去检索，但做检索的前提是理解，这就是我们面临的关键词悖论。

第二个弊端在于传统关键词检索有时候很难检索到目标案例。比如我们设定"律师"作为关键词，想检索有律师参与辩护的刑事案件。但结果输入关键词，检索平台会把所有包含"律师"这个词汇的裁判文书全部给你推送过去，我们还需要通过人工的方式做二次筛选。

换句话说检索平台并不知道我们想要什么，它只是单纯地按照【关键词再现】原则做信息汇总。

通过AI方式我们就可以克服这两个弊端。

正如刚刚提到的，目前的法律AI是一种【通过数据驱动方式达到智能效果的路径】，这也是AI优化传统法律检索所遵循的路径。

比如对上述两个检索弊端的解决，AI化的处理方式就是【知识图谱+数据标签】。

先说说知识图谱。

举个简单例子，我们做法律检索的时候，以"盗窃"作为关键词，传统的法律检索方式会把包含"盗窃"这个词的案例全部推送过来。但实际上，盗窃还可以再细分，按量刑影响细分为"一般盗窃行为、入户盗窃、多次盗窃、盗窃油气或者正在使用的油气设备"。对这些细分的因素，不了解刑事法律的人往往很难掌握，就会遇到【关键词悖论】。这个时候需要系统给予【一定的提示】，比如元典智库这款检索平台中就用【要素】的方式做提示：

而这种要素提示所依托的就是【知识图谱】。

想要实现这种效果，系统必须提前建立关于盗窃的知识图谱，将与盗窃相关联的因素做聚合，形成可以应用的知识网络。

有了这个知识图谱做基础，我们做盗窃相关的案件检索，只需要输入盗窃这个关键词，并在系统的引导下，确定盗窃的具体情形，并在这个情形之下关联更精准的裁判案例，从而解决关键词悖论的问题。

但我们要注意，知识图谱的解决方式并不是说让系统知道盗窃这个概念，而是让系统在盗窃以及与盗窃相关的因素之间建立联系，从一个因素A可以联系到因素B、因素C，甚至因素B1、C1，有需要可以进一步往下延伸。

实际上这也是一种数据驱动达到智能效果的方式，系统不知道什么是盗窃，但通过知识图谱，我们可以教会系统达到对盗窃认知的效果。

第二个关键因素是数据标签，这种数据标签实际上是【用户偏好标签】。

比如你是一个刑辩律师，你在检索系统中设定了【刑辩律师】这个用户偏好标签。这其实是告诉系统，我一般情况下需要了解的是刑事类案件而非民事类案件，系统了解这个标签后，在检索中给你优先收集并排在检索前端的就是刑事类案例。这就如同今日头条，前期一定是通过用户偏好标签对用户形成认知，而后期会通过【用户操作行为】加深对用户的认知。

这种方式的实质也是数据驱动，是通过用户和系统之间的【互动】，形成对用户数据的积累，进而通过数据+算法【预测用户偏好】，达到的效果是【让系统认知用户】，并给用户推送符合用户偏好的裁判案件或者信息。

但需要注意这里的认知仅仅是一种数据处理方式，而不是说像人一样真的认识你、了解你，只是说系统可以通过数据+算法的方式做出【更精准、更个性化】的信息收集。

这就解决了传统法律检索的第二个弊端，系统可以在一定程度上知道你想要什么。

从上述法律检索的案例，我们不难看出，这一阶段的AI实际上还只是具备通过数据驱动解决问题的能力，但所谓的【机器认知】还为时尚早。而这种方式下，AI必然会面临两个方面的困境：

1.AI只能完成某一类或者某几类任务，而无法实现通用效果，成为多面手。扫地机器人只会扫地，肯定不会叠被子；阿尔法狗蛋下围棋是天才，但下象棋未必能赢得过刚入门的新手。同样的道理，前段时间爆红网络的LawGeex可以在合同审查上完胜律师，但如果比赛的内容发生变化，让LawGeex和律师比赛法律咨询，结果可以想象，LawGeex就不是人工智能而是机器白痴了。

2.数据成为AI发展的基础。想要实现数据驱动解决问题，前提必须有海量的数据做基础。这也是为什么这一代AI会从google、Amazon、BAT等大公司兴起，原因即在于这类公司掌握了大量的数据，可以通过【简单粗暴】的方式借助数据达到智能效果。正如吴军老师在其著作《智能时代》中提到的"google的自动驾驶驾驶汽车实际上是google街景项目的延伸，是对街景项目积淀数据的再利用"。

具体到法律领域也是如此，法律AI所依托的也是数据驱动的方式，自然也需要大量数据积淀，在这个领域【谁掌握了数据，谁才能真正地胜出】。

至于法律人所担心的AI颠覆法律，说实话根本不存在什么颠覆，只是新方法与旧方法的冲突。

比如图片类内容的合规审查，采用机器识别的方式，结合具体的算法可以达到高效快速的合规审查；借助增加人员、扩大合规团队，采用人工的方式也可以完成一张一张图片的合规审查。

两种方式各有利弊，目前更多是两种方式的相互结合，所以这一阶段法律从业者真正需要思考的问题不是如何避免被AI所颠覆，而是应该想方设法和AI做融合，将AI作为一种完成工作的新的方法。

来源：知乎 www.zhihu.com
作者：元典法律智能

【知乎日报】千万用户的选择，做朋友圈里的新鲜事分享大牛。点击下载

经典网文分享

别再谈AI颠覆法律了，AI只是一种做法律的新方法

没有评论:

发表评论