司法鉴定中的法庭统计学

证据评价方法与鉴定意见表述

徐嘉烨

南开大学经济学院 数量经济研究所

背景介绍

司法鉴定标准化建设

为促进司法鉴定公信力提升,司法部2020年11月印发了《关于进一步深化改革 强化监管 提高司法鉴定质量和公信力的意见》,提到了加强标准化建设、强化科技创新支撑等多项具体改革措施。

  1. 司法鉴定意见的标准化

    司法鉴定意见是整个证据评价全流程的最终环节,是鉴定使用者(如法官)认定案件事实的依据,因此须要以科学严谨的语言描述证据的价值和证明力度,并采用标准统一的鉴定意见表述形式。

  2. 证据评价方法及其标准化:国标法 vs. 非国标法

实践中的司法鉴定意见表述

  • 现状与问题:表述不规范,结论形式不统一(郭 华 2020),表述形式包括,

    1. 文字型结论,例如,“认定”、“倾向认定”、“不排除”、“可能是”等,以及,DNA分型的检验结果。

    2. 数值型结论,例如,可能性(概率),似然比。

  • 司法鉴定意见的概率标准化表述

    • 法庭统计学对法庭科学(司法鉴定)的重要贡献之一

    • 国际上的广泛实践与标准化

法庭统计学中的证据评价与结论表述

  • 法庭统计学(forensic statistics)

    法庭统计学是统计学的一个重要应用分支,它从法庭科学(即司法鉴定)领域内的实际问题出发,以概率论为理论基础,以刑事案件物证的量化分析、证据评价方法和鉴定意见表述为核心研究对象,为提升鉴定可靠性提供日益完善的统计模型和推断方法,服务于司法裁决,支持着司法鉴定制度与标准化建设,促进司法鉴定公信力的提升。

  • 证据评价方法与结论表述

    • 鉴定意见表述:贝叶斯因子 vs. 似然比

    • 证据评价方法

      • 似然比法:DNA证据。

      • 基于相似度分数的似然比法:形态特征证据。

鉴定意见的概率表述

  • 贝叶斯因子(Bayes factor, BF) vs. 似然比 (likelihood ratio, LR)

    • 理论上的区别

      应用于”同一认定”问题的贝叶斯因子和似然比从理论上并不等价,似然比是贝叶斯因子的极限形式,且这一极限性质在 “共同(未知)来源”和”特定来源”这两种情景假设下均成立(Ommen and Saunders 2021)

    • 实践中的统称:“似然比”

  • 似然比表述的科学有效性

    • 似然比作为证据价值度量的数学证明及公理化,详见 Aitken and Stoney (1991), Crupi, Chater, and Tentori (2013)

    • 国际上广泛认可的科学有效的证据评价方法和鉴定表述形式

      • 美国国家研究委员会(NRC)的1996年《法庭DNA证据评估》,后续2004版和2009版;

      • 欧洲法庭科学研究所在《ENFSI 法庭科学评价报告指南(2015版)》;

      • 英国法庭科学管理局(UK Forensic Science Regulator)2017年版技术准则。

  • 概率表述体系:单项证据为例。

鉴定意见概率表述体系

单项证据的统计假设和似然比

单项待评价证据\(E\),此处,\(E\) 可以代表多种类别的证据,比如DNA图谱(DNA profile),玻璃碎片中的化学成分,潜在指纹、足迹、笔迹等以形态特征为主的证据(pattern evidence)。 \(E=(E_x, E_y)\),其中\(E_x\) 表示从犯罪现场采集的证据,\(E_y\) 表示采集自嫌疑人的证据。

在”来源级别的主张”(source-level proposition)语境下,进行证据评价,控辩双方分别持统计假设

\[ H_p: E_x, \ E_y \text{具有相同来源};\\ H_d: E_x, \ E_y \text{具有不同来源}。 \]

将贝叶斯定理写成”赔率”形式

\[\frac{P\left(H_p\middle| E,I\right)}{P\left(H_d\middle| E,I\right)}=\frac{P\left(E\middle| H_p,I\right)}{P\left(E\middle| H_d,I\right)}\frac{P\left(H_p\middle| I\right)}{P\left(H_d\middle| I\right)}\]

其中,\(I\) 表示可控的附加背景信息,例如物证采集所用的工具和材料。该证据价值以似然比衡量,定义为 \(\frac{P\left(E\ \middle|\ H_p,I\right)}{P\left(E\ \middle|\ H_d,I\right)}\).

数值型结论与描述型结论之间的对应

ENFSI准则中的示例:似然比数值区间与(相对)支持程度的对应关系
支持程度 LR数值区间
不支持 \(1<LR\leq 2\)
\(2<LR\leq 10\)
一般 \(10<LR\leq 100\)
较强 \(100<LR\leq 1000\)
\(1000<LR\leq 10000\)
很强 \(10^4<LR\leq 10^6\)
极强 \(LR> 10^6\)

基于相似度分数的似然比

形态特征证据价值的近似量化(高维推断问题),例如,指纹、足迹、笔迹等以形态特征为主的证据。

基于相似度分数的似然比(score-based likelihood ratios, SLRs)

\[SLR=\frac{f\left(\Delta\left(E_x,\ E_y\right)\ \middle|\ H_p,\ \ I\right)}{f\left(\Delta\left(E_x,E_y\right)\ \middle|\ H_d,\ \ I\right)}\]

其中,\(\Delta\left(E_x,\ E_y\right)\) 表示不同来源证据异同程度的相似度分数(similarity-score)。

似然比法在司法实践中的应用

多重证据分析

多重证据综合似然比,为简洁且不失一般性,考虑\(E_1\)\(E_2\)

\[LR=\frac{P\left(E_1\ \middle|\ H_p,I\right)}{P\left(E_1\ \middle|\ H_d,I\right)}\frac{P\left(E_2\ \middle|E_1,\ H_p,I\right)}{P\left(E_2\ \middle|E_1,\ H_d,I\right)}\]

多重复杂证据关系的处理方法:

  1. 尽可能以合理的独立性假设进行简化

  2. 证据链(推理链)形成

    1. 图示法

    2. 概率图模型:例如,以贝叶斯网络分析协同证据和非协同证据关系 (“Aspects of Combining Evidence” 2014)

形态特征证据的评价方法

以笔迹鉴定算法为例(Johnson and Ommen 2021)

鉴定人员能力测试方法

在教育测量(educational measurement)中的项目反应理论(item response theory, IRT)框架下(Desjardins and Bulut 2018),利用贝叶斯网络模型推断不可观测的被测人员真实能力,构建IRT-BN评价模型。

参考文献

Aitken, C. G. G., and David A. Stoney. 1991. The Use of Statistics in Forensic Science. CRC Press. https://doi.org/10.1201/b12618.
“Aspects of Combining Evidence.” 2014. In, 249–80. John Wiley & Sons, Ltd. https://doi.org/10.1002/9781118914762.ch8.
Crupi, Vincenzo, Nick Chater, and Katya Tentori. 2013. “New Axioms for Probability and Likelihood Ratio Measures.” The British Journal for the Philosophy of Science 64 (1): 189–204. https://doi.org/10.1093/bjps/axs018.
Desjardins, Christopher D., and Okan Bulut. 2018. Handbook of Educational Measurement and Psychometrics Using r. Chapman; Hall/CRC. https://doi.org/10.1201/b20498.
Johnson, Madeline Quinn, and Danica M. Ommen. 2021. “Handwriting Identification Using Random Forests and Score-Based Likelihood Ratios.” Statistical Analysis and Data Mining: The ASA Data Science Journal 15 (3): 357–75. https://doi.org/10.1002/sam.11566.
Ommen, Danica M., and Christopher P. Saunders. 2021. A Problem in Forensic Science Highlighting the Differences between the Bayes Factor and Likelihood Ratio.” Statistical Science 36 (3): 344–59. https://doi.org/10.1214/20-STS805.
郭 华. 2020. “司法鉴定结果的表述体系与建构 ——基于贝叶斯定理在鉴定中的展开.” 中国司法鉴定 110 (3): 1–7.