交叉熵代价函数(作用及公式推导)

news/2024/7/3 19:12:25

 交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的预测值与实际值的一种方式。与二次代价函数相比,它能更有效地促进ANN的训练。在介绍交叉熵代价函数之前,本文先简要介绍二次代价函数,以及其存在的不足。


1. 二次代价函数的不足

        ANN的设计目的之一是为了使机器可以像人一样学习知识。人在学习分析新事物时,当发现自己犯的错误越大时,改正的力度就越大。比如投篮:当运动员发现自己的投篮方向离正确方向越远,那么他调整的投篮角度就应该越大,篮球就更容易投进篮筐。同理,我们希望:ANN在训练时,如果预测值与实际值的误差越大,那么在反向传播训练的过程中,各种参数调整的幅度就要更大,从而使训练更快收敛。然而,如果使用二次代价函数训练ANN,看到的实际效果是,如果误差越大,参数调整的幅度可能更小,训练更缓慢。

        以一个神经元的二类分类训练为例,进行两次实验(ANN常用的激活函数为sigmoid函数,该实验也采用该函数):输入一个相同的样本数据x=1.0(该样本对应的实际分类y=0);两次实验各自随机初始化参数,从而在各自的第一次前向传播后得到不同的输出值,形成不同的代价(误差):

实验1:第一次输出值为0.82

     

实验2:第一次输出值为0.98

        

        在实验1中,随机初始化参数,使得第一次输出值为0.82(该样本对应的实际值为0);经过300次迭代训练后,输出值由0.82降到0.09,逼近实际值。而在实验2中,第一次输出值为0.98,同样经过300迭代训练,输出值只降到了0.20。

        从两次实验的代价曲线中可以看出:实验1的代价随着训练次数增加而快速降低,但实验2的代价在一开始下降得非常缓慢;直观上看,初始的误差越大,收敛得越缓慢

        其实,误差大导致训练缓慢的原因在于使用了二次代价函数。二次代价函数的公式如下:



        其中,C表示代价,x表示样本,y表示实际值,a表示输出值,n表示样本的总数。为简单起见,同样一个样本为例进行说明,此时二次代价函数为:



        目前训练ANN最有效的算法是反向传播算法。简而言之,训练ANN就是通过反向传播代价,以减少代价为导向,调整参数。参数主要有:神经元之间的连接权重w,以及每个神经元本身的偏置b。调参的方式是采用梯度下降算法(Gradient descent),沿着梯度方向调整参数大小。w和b的梯度推导如下:



        其中,z表示神经元的输入,表示激活函数。从以上公式可以看出,w和b的梯度跟激活函数的梯度成正比,激活函数的梯度越大,w和b的大小调整得越快,训练收敛得就越快。而神经网络常用的激活函数为sigmoid函数,该函数的曲线如下所示:



        如图所示,实验2的初始输出值(0.98)对应的梯度明显小于实验1的输出值(0.82),因此实验2的参数梯度下降得比实验1慢。这就是初始的代价(误差)越大,导致训练越慢的原因。与我们的期望不符,即:不能像人一样,错误越大,改正的幅度越大,从而学习得越快。

        可能有人会说,那就选择一个梯度不变化或变化不明显的激活函数不就解决问题了吗?图样图森破,那样虽然简单粗暴地解决了这个问题,但可能会引起其他更多更麻烦的问题。而且,类似sigmoid这样的函数(比如tanh函数)有很多优点,非常适合用来做激活函数,具体请自行google之。



2. 交叉熵代价函数

        换个思路,我们不换激活函数,而是换掉二次代价函数,改用交叉熵代价函数:



        其中,x表示样本,n表示样本的总数。那么,重新计算参数w的梯度:



        其中(具体证明见附录):


        因此,w的梯度公式中原来的被消掉了;另外,该梯度公式中的表示输出值与实际值之间的误差。所以,当误差越大,梯度就越大,参数w调整得越快,训练速度也就越快。同理可得,b的梯度为:



        实际情况证明,交叉熵代价函数带来的训练效果往往比二次代价函数要好。



3. 交叉熵代价函数是如何产生的?

        以偏置b的梯度计算为例,推导出交叉熵代价函数:



        在第1小节中,由二次代价函数推导出来的b的梯度公式为:



        为了消掉该公式中的,我们想找到一个代价函数使得:



        即:



        对两侧求积分,可得:



        而这就是前面介绍的交叉熵代价函数。




附录:

        sigmoid函数为:


        可证:

转载于:https://www.cnblogs.com/muyangshaonian/p/9650480.html


http://www.niftyadmin.cn/n/1998495.html

相关文章

你应该知道的Windows XP的小秘密

自从微软发布Windows XP以来,Windows XP已经得到人们越来越广泛的应用,微软也宣称它是迄今为止最好的操作系统。Windows XP到底有什么出色的地方?让我先来告诉你其中的一些小秘密吧! ● 关闭自动播放功能 一旦您将媒体插入驱动器&…

精通Java设计模式从初见到相爱全集(1-23)

为什么80%的码农都做不了架构师?>>> 1、如何使用? 设计模式是为了解决问题产生的,一种解决方案,你的问题是什么决定你用什么设计模式, 你没有问题却偏要生搬硬套一个设计模式上去, 这就是没事找事,你的问题就像: 自己…

Windows XP深入问答

1、我使用Windows XP系统,请问使用什么方法可以提高启动速度? 使用微软提供的“Bootvis”软件可以有效的提高Windows XP启动速度。这个工具是微软内部提供的,专门用于提升 Windows XP启动速度。下载后解压缩到一个文件夹下,并在“…

android 音频合成_文字怎样转语音,语音怎样合成,视频剪辑怎样配音,语音转文字?...

文字怎样转语音,语音怎样合成,视频剪辑怎样配音,语音怎样转文字?林力早大家好,上一节我们介绍了如何一键分发、怎样录制视频、视频怎样剪辑,这一节我们聊一聊怎样给视频配置声音。想必大家都会遇到这样的问…

java aop做一个接口耗时的计算

看代码: Aspect Component public class TimeCostAspect {private static Logger logger LoggerFactory.getLogger(TimeCostAspect.class);private static final String POINT "execution (* com.ming..*.controller..*.*(..))";Pointcut(POINT)public …

Windows XP 控制台命令详解 - 目录和文件操作命令

编者语:   Windows XP(包括 Windows 2000)的控制台命令是在系统出现一些意外情况下的一种非常有效的诊断和测试以及恢复 系统功能的工具。小编的确一直都想把这方面的命令做个总结,这次辛苦老范给我们整理了这份实用的秘笈。 A…

Unity CommandBuffer的一些学习整理

1.前言 近期在整理CommandBuffer这块资料,之前的了解一直较为混乱。 算不上新东西了,但个人觉得有些时候要比加一个摄像机再转RT廉价一些,至少省了深度排序这些操作。 本文使用两个例子讲解CommandBuffer如何使用,但在此之前稍稍总…

参考文献要不要首行缩进_每一个程序员要遵守的一些优秀编程风格

无论你是业余的还是专业的程序员,正确的编程风格,不但有助于提升软件产品的功能,还可以明显减少软件灾难的产生。今天,我们就来探讨一下有助于我们获取更佳编程风格的一些最好的规则。代码的可读性至上代码要能可阅读和可理解&…