近日,统计学院教授赵俊龙以第一作者身份与学生刘秀敏(已毕业)、杜斌(在读)及合作者在统计学期刊 The Annals of Statistics 发表论文Approximation errors from discretizations and its applications。
随机变量离散化是统计中的常用建模手段,文献已有众多的离散化算法,但是离散化逼近误差的结果较少。文章提出了一种一般性离散化策略,并研究了相应的离散化逼近误差。对于一元变量,离散化逼近该误差受(使用和未使用离散化所导出)两个特定分布间距离以及函数的光滑度的影响。该结果被进一步推广到了多元随机变量以及其他情形。基于上述结果,本文研究了(1)回归问题中离散化估计的残差平方以及均方误差的收敛速度;给出了一个切片逆回归中切片数目的选择方法,提出了一个自适应切片逆回归算法;(2)提出了一个响应变量部分离散化的随机森林改进算法,模拟结果表明新算法优于传统的随机森林算法。
论文链接: