更新时间:作者:佚名
各位老铁们好,相信很多人对《内部审计实务》大数据统计分析方法及其应用都不是特别的了解,因此呢,今天就来为大家分享下关于《内部审计实务》大数据统计分析方法及其应用以及的问题知识,还望可以帮助大家,解决大家的一些困惑,下面一起来看看吧!

(一)构建研究指标体系
商业银行的担保结构由抵押、质押、保证金、信用、担保五种担保模式组成。根据内部审计项目工作目标,全面客观评价A银行基于担保模型的小微企业信贷创新效果,分析影响其信贷利息收入的因素。构建基于担保模型的小微企业信用投入产出指标体系。基于投入产出效率评价统计分析模型,以反映银行盈利能力的信贷利息收入作为产出变量评价信贷效率。选取的主要投入指标有:从业人员数量,反映商业银行对小微企业信贷规模的人力投入;机构数量反映商业银行营业设施和营业机构的投资情况;授信金额、收回金额和核销金额都会影响商业银行的贷款利息收入,以贷款利息收入作为产出指标。
(2)描述性统计方法
在大数据统计分析中,描述性统计是最常用的方法。它利用平均值、最小值、最大值、标准差等数据分析结果来反映大数据的分布和集中趋势。根据描述性统计分析的结果,内部审计人员可以初步了解审计目标的特征。某商业银行大数据分析平台整理出2007年至2018年小微企业客户明细数据327942条。其中,缺失关键指标数据5794条,有效数据322148条。删除缺失的关键指标数据,利用R软件获得被审计单位的描述性统计结果。为满足大数据统计分析模型后续研究需要以及商业银行经营数据的保密要求,对26项指标数据进行了初步整理和标准化预处理。其中,因变量为信贷利息收入(Y),自变量为不良贷款核销(U)、业务发展(L)、业务复苏(R)、机构数量(K)、从业人员数量(J)五个影响因素。五种担保方式分别为抵押(dy)、质押(zy)、担保(bz)、保证金(bzj)、信用(xy)。
(3)相关分析法
在商业银行内部审计中,大数据关联统计分析是一种基本的分析方法,可以探究各项指标数据之间的关系。从共线性的角度反映指标之间的相关性,可以更好地发现评价指标体系中可能出现的异常指标值,从而优化具体审计项目的价值,避免回归分析因相关性高而探讨影响因素的失真。采用R软件描述抵押担保方式核销金额等25个自变量之间的共线性。结果发现,各个变量之间存在高度共线性。数量最多的是开通信用担保模式的机构(K.
(4)效率评价方法
效率评价是对审计目标单位客观、全面的评价。基于构建的评价指标体系,对审计目标实体的有效性进行全面、综合的评价,并通过具体的效率值来体现效用价值。效率评估方法是大数据统计分析中常用的分析方法。评估效率常用的方法有两种:参数方法和非参数方法。
从表中可以看出,2007年至2018年,商业银行A整体小微企业信贷的平均Malmquist变化指数为1.71,表明样本期内商业银行A小微企业信贷整体效率较高,且处于长期增长趋势。其中,除2018年商业银行A小微企业信贷综合效率Malmquist变化指数值小于1外,2007年至2017年Malmquist变化指数值均大于1,且2014年至2015年达到最高值10.74。
从担保模式来看,各担保模式小微企业信贷效率Malmquist指数变化呈现以下特点:一是抵押、质押、担保、保证金、信用担保模式的平均Malmquist变化指数均大于1,分别为1.14和1。 53、1.34、1.49、1.96,均呈上升趋势;其次,只有信用担保模型的平均Malmquist变化指数高于信用整体效率,为1.96,比平均整体效率高出0.25。第三,各保障模型的Malmq uist变化指数值在2014-2015年期间达到最高值。 2017年以来,变化指数值开始下降,增速放缓。第四,传统“抵押+担保”担保模式的Malmquist变化指数平均值一般。小于质押、保证金和信用担保模式的指数变化值,各担保模式的Malmquist变化指数平均大小为信用(1.96)、质押(1.53)、保证金(1.49)、保证(1.34)和抵押(1.14)。
(5)回归分析法
通过大数据描述性统计分析、相关性分析、效率评价模型分析获得审计目标的客观情况后,通过回归分析方法可以更好地分析影响审计目标的主要因素,并提出有针对性的审计建议,更好地提高内部审计效果,促进商业银行稳健发展。为了提高回归分析模型的准确性,避免多重共线性问题带来的模型失真风险,采用Tibshirani(1996)提出的有偏估计算法Lasso对变量进行分析,可以有效解决多重共线性问题。同时,为了提高高维数据的模型分析效率,采用Efron(2004)提出的LAR高效变量选择方法,有效解决Lasso计算效率低的问题。