深度学习的数学-需要了解的函数

2020年02月25日机器学习约1.1k字预计需要4分钟

前言

本篇博客主要介绍深度学习中需要掌握的函数，包括一次函数、二次函数、单位阶跃函数、指数函数、sigmoid函数等概念

正文

一次函数及多元一次函数

首先时最基础的一次函数，中学数学告诉我们，一次函数满足表达式 y = a*x + b，其中 a 是斜率表示直线的倾斜程度，b是截距表示x=0时直线与y轴交点的y值在之前的章节中，提到了神经单元会根据多个输入乘以权重，根据是否到达临界值 θ ，从而判断自身是否兴奋，其数学表达式可以表现为如下形式： z = w1*x1+w2*x2+w3*x3 + ...wn*xn + b 书中提到，由于一次函数的特性，x1,x2,x3…xn 为确认值的时候，输入z，w1,w2,w3…wn,b 是一次函数关系，使用『误差反向传播法』推导时，会相对简单

误差反向传播法自从40年代赫布(D.O. Hebb)提出的学习规则以来，人们相继提出了各种各样的学习算法。其中以在1986年Rumelhart等提出的误差反向传播法，即BP(error BackPropagation)法影响最为广泛。　BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。　　1）正向传播：输入样本－>输入层－>各隐层（处理）－>输出层　　注1：若输出层实际输出与期望输出（教师信号）不符，则转入2）（误差反向传播过程）。　　2）误差反向传播：输出误差（某种形式）－>隐层（逐层）－>输入层其主要目的是通过将输出误差反传，将误差分摊给各层所有单元，从而获得各层单元的误差信号，进而修正各单元的权值（其过程，是一个权值调整的过程）。　　注2：权值调整的过程，也就是网络的学习训练过程（学习也就是这么的由来，权值调整）。

二次函数及多元二次函数

根据中学的数学知识可知，一元二次函数表达式为 y = a*x^2 + b*x + c (a!=0)，函数图像如下，特点是存在一个全局最小值(或最大值) 而拥有两个变量的二次函数，数学表达式就是这样 y = a*x1^2 + b*x2^2 + c*x1*x2 + p*x1 + q*x2 + r 画在三维坐标系上，就会是这样，依旧能找到y的全局最低点/最高点