01-十分简单的神经网络
第7章 十分简单的神经网络
21世纪10年代末期一说起人工智能方面所取得的进步,我们通常关注的是名为机器学习(machine learning)的特定的子学科。所谓机器学习是指不用被明确告知,计算机就会学习一些新的知识。这些进步往往是由名为神经网络(neural network)的机器学习技术驱动的。虽然神经网络在几十年前就被发明了,但因为改良的硬件和新发现的研究导向的软件技术开启了一种名为深度学习(deep learning)的新范式,使神经网络已经经历了某种程度的复兴。
深度学习已被证明是一种具备广泛适应性的技术。从对冲基金算法到生物信息学,到处都有它的用武之地。消费者熟悉的两种深度学习应用是图像识别和语音识别。例如,向教字助理提问天气状况,或者用拍照程序进行人脸识别,这里面就可能有某些深度学习算法在运行。
深度学习技术使用的构建模块与较简单的神经网络一样。在本章中,我们将通过构建一个简单的神经网络来探讨这些模块。这里的实现不会是最先进的,但它将是理解深度学习的基础,深度学习基于的神经网络将比我们要构建的神经网络更为复杂。大多数机器学习的业界人士不会从头开始构建神经网络,他们会利用流行的、高度优化的、现成的框架来完成繁重的任务。虽然本章无助于学习某种特定框架的使用方式,即将构建的神经网络对实际应用也没什么意义,但仍将有助于我们了解那些框架底层的工作方式。