人工智能 (AI): 如果 机器 能够通过 学习 掌握某种 技能 , 就称其具备了 AI 的 能力。
所以人工智能又叫 机器学习: 研究如何让计算机具备学习能力。
人工智能首先由图灵提出。
图灵测试 : 让计算机和人对话 , 如果人不能判断出他是计算机 , 那么其就通过了图灵测试。
人工智能的两个学派 :
统计学派 ( 基于数学 ): 从机器出发 , 主要是算法 , 但是都不能通过图灵测试。【传统机器学习】
仿生学派 ( 基于仿生学 ): 从学习出发 , 主要是神经网络 , 发现神经网络越大越深 , 效果越好 , 因此提出了深度学习。【深度学习】
深度学习 : 深层次的神经网络的学习过程。
传统机器学习能完成的任务深度学习都可以完成。
从仿生学的角度 , 先来看看神经元是如何工作的。
神经元 : 树突 ( 多个 ) 用来接收信号 , 细胞体用来处理信息 , 轴突 ( 一个 ) 用来发送信号 , 但是目前我们还不知道细胞体怎么处理信息。
人工神经元 ( 感知机 ) 就是类比于人类的神经元提出的。
树突的长短粗细不一样 , 所以我们的感知机有很多不同的输入和很多不同的权重。
由于计算机是数学计算 , 所以我们要把感知机抽象为数学。
如何抽象 ? 使用矩阵。将一堆 x 看为行向量 , 一堆 w 看为列向量。
将矩阵相乘 , 得到 X *W=h
最后 , 让我们来聊聊什么是学习 ?
学习 : 以结果为导向 , 做完这个行为之后你是否掌握了新的技能。
模型得到 h 的过程称为前向计算 ( 推理过程 )
首先 , 你要能听懂问题 , 可以自己得到一个答案 , 然后拿到别人的答案 , 将别人的答案和自己的答案进行比较再不断调整 , 这个调整过程就叫学习。
自己得到的结果越错越好 , 这样代表你的提升空间很大。
总而言之 , 学习就是 发现问题 和解决问题 的过程。
发现问题 ( 考试 ):loss=(y-h)2
解决问题 ( 改错 ): 损失越小越好
从 w1 到 w2 的过程就是学习
模型根据损失 , 反向求导 , 更新 w 参数的过程称为模型的学习过程。
BP 算法 : 梯度下降 + 链式法则来更新参数的过程
梯度下降 : 梯度就是斜率 , 我们通过计算梯度来确定 w 的前进方向 , 以 w1 为例 , 通过偏导求出梯度大于 0 , 应该向右移动 , 但是我们的 w2 在左边 , 所以我们还需要给所求的梯度加上一个负号。之后我们再确定步长 , 如果步长设为 1 , 那么 w 就会按照对称轴在两个点不断地左右移动 , 如果步长大于 1 , 那么 w 就会往上走 , 所以步长必须小于 1。
原文链接:https://blog.csdn.net/m0_73010573/article/details/128053145