计算机视觉与TensorFlow系列01丨深度学习与CV介绍

一.深度学习介绍

20211111104731

1.深度学习与机器学习的区别

(1)特征提取方面

  • 机器学习

机器学习的特征工程要靠手动完成,而且需要大量领域专业知识。

  • 深度学习

通常由多个层组成,它们通常将更简单的模型组合在一起,通过将数据从一层传递到另一层来构建更复杂的模型。通过大量数据的训练自动得到模型,不需要人工设计特征提取环节。

(2)数据量

  • 机器学习

参数较少,执行时间短

  • 深度学习

参数庞大,执行时间长,需要通过大量数据的多次优化来训练参数

第一、它们需要大量的训练数据集

第二、是训练深度神经网络需要大量的算力

可能要花费数天、甚至数周的时间,才能使用数百万张图像的数据集训练出一个深度网络。所以

需要强大的GPU服务器来进行计算

全面管理的分布式训练与预测服务——比如谷歌 TensorFlow 云机器学习平台,可能会解决这些问题

2.各自的算法代表

  • 机器学习

朴素贝叶斯、决策树

  • 深度学习

神经网络

3.应用场景

  • 图像识别领域:包括物体识别、场景识别、车型识别、人脸检测跟踪、人脸关键点定位、人脸身份认证等

  • 自然语言处理:机器翻译、文本识别、聊天对话等

  • 语音技术:语音识别

二.计算机视觉介绍

1.常见任务

计算机视觉基于大量不同任务,并组合在一起实现高度复杂的应用。计算机视觉中最常见的任务是图像和视频识别,涉及确定图像包含的不同对象。

四大主要任务:

  • 图像分类

计算机视觉中最知名的任务可能就是图像分类了,它对给定图像进行分类

  • 目标检测

目标检测通常是从图像中输出单个目标的Bounding Box(边框)以及标签

  • 目标分割

我们可以把实例分割看作是目标检测的下一步。它不仅涉及从图像中找出对象,还需要为检测到的每个对象创建一个尽可能准确的掩码。

  • 目标追踪

目标追踪旨在追踪随着时间不断移动的对象,它使用连续视频帧作为输入

2.应用场景

人脸、辅助驾驶、图片检测等