当前位置:嗨网首页>书籍在线阅读

15-分类问题

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

7.5 分类问题

在第6章中,用k均值聚类进行了数据集的分类,那时对每个单独数据的归属没有预先的设定。在聚类过程中,我们知道需要找到数据的一些类别,但事先不知道这些类别是什么。在分类问题中,我们仍然要尝试对数据集进行分类,但是会有预设的类别。例如,假设要对一组动物图片进行分类,我们可能会提前确定哺乳动物、爬行动物、两栖动物、鱼类和鸟类等类别。

可用于解决分类问题的机器学习技术有很多。或许你听说过支持向量机(support vector machine)、决策树(decision tree)或朴素贝叶斯分类算法(naive Bayes classifier)。其他还有很多。近来,神经网络已经在分类领域中得到广泛应用。与其他的一些分类算法相比,神经网络的计算更为密集,但它能够对表面看不出是什么类型的数据进行分类,这使其成为一种强大的技术。很多有趣的图像分类程序在为现代的图片软件赋能,这些程序背后都用到了神经网络分类算法。

为什么对分类问题应用神经网络出现了复兴现象呢?因为硬件的运行速度已经变得足够快了,与其他算法相比,神经网络需要的额外计算量相对于获得的收益而言变得划算起来了。