视频图像技术是人工智能、计算机科学、光学、电子信息等领域的基础技术,相关的原理知识涉及面较广,应用性很强。本书基于视频图像技术的基本原理、相关设备、算法和应用等内容编写,主要分为三部分。第一部分为视频图像技术原理与设备操作,主要介绍视频信号“采-传-存-显-控”的基本原理;第二部分为视频图像智能化分析算法与工程实践,涵盖经典算法和基于深度学习的主流算法,包括视频图像数据预处理、图像增强、图像分割、图像分类、运动目标检测、目标检测与识别、运动目标跟踪、双目视觉测距、图像无缝拼接、图像三维重建,其中不乏计算机视觉技术的应用;第三部分为视频图像技术基础开发环境的搭建,主要介绍视频图像技术常用的编程语言,为读者实现各种视频图像技术提供快速的编程指导和环境配置方法,包括MATLAB编程基础、OpenCV编程基础、Python编程基础和面向深度学习的智能化图像处理环境搭建。本书每章都按照“学习目的、实践内容、准备材料、预备知识、实践步骤”的结构进行编写,旨在使读者快速掌握并应用视频图像技术,能够围绕实际应用场景,循序渐进地使用本书中介绍的方法解决部分实际问题,从而具备面向工程应用的综合分析与实践能力。本书可作为高等学校本科生、研究生视频图像处理相关课程的教材和参考书,也可为相关领域的工程技术人员提供参考。
李熙莹,中山大学智能工程学院副教授,硕士生导师,现为视频图像智能分析与应用技术公安部重点实验室目标识别与行为分析研究室主任、视频图像智能分析与应用技术公安部重点实验室学术委员会委员。主要研究视频图像车辆检测与识别、视频交通信息采集、视频目标跟踪与行为分析、视频大数据处理与分析等技术及其在交通管理、公共安全领域的应用。目前已在车辆识别监控、交通流参数获取、视频智能识别与分析等方面取得实质性成果,与企业合作开发多个软件产品和应用系统,应用覆盖上万路视频,服务于多个警种,出口到国外,用户评价很高。主持有综合交通、计算机视觉、公共安全等领域的国家科技专项、国家自然科学基金重点和面上、国际合作、省部级项目十余项,经费近千万。目前已在国内外期刊和会议发表论文60余篇;申请发明专利30多项,其中11项国内专利与2项美国专利获得授权。2017年获公安部科学技术奖一等奖, 2014年获得中国智能交通协会科学技术奖二等奖(排名第一)。
第一部分 视频图像技术原理与设备操作
第1章 视频采集 2
1.1 学习目的 2
1.2 实践内容 2
1.3 准备材料 2
1.4 预备知识 3
1.4.1 视频图像技术概述 3
1.4.2 光源 7
1.4.3 镜头 10
1.4.4 图像补偿与降噪 11
1.4.5 摄像机类型 13
1.4.6 数字示波器 14
1.5 实施步骤 15
1.5.1 观察摄像机的外观、形状、接口,了解其功能 15
1.5.2 连接设备,采集视频 15
1.5.3 观察镜头参数变化的成像效果 16
1.5.4 观察光照条件变化的成像效果 16
1.5.5 观察不同类型摄像机的成像效果 16
1.5.6 调整摄像机参数,观察视频效果 16
1.5.7 利用示波器观察视频信号 17
第2章 视频传输 18
2.1 学习目的 18
2.2 实践内容 18
2.3 准备材料 18
2.4 预备知识 19
2.4.1 传输介质 19
2.4.2 视频双绞线传输器 21
2.4.3 视频光端机 22
2.4.4 交换机和网络视频适配器 22
2.4.5 无线网桥 23
2.4.6 PoE供电 23
2.4.7 网络损伤仪 24
2.5 实施步骤 24
2.5.1 同轴电缆和双绞器传输 24
2.5.2 交换机传输 24
2.5.3 无线网桥传输 27
2.5.4 网络损伤环境下不同编码方式的传输 28
第3章 视频存储 30
3.1 学习目的 30
3.2 实践内容 30
3.3 准备材料 30
3.4 预备知识 31
3.4.1 数字存储技术 31
3.4.2 RAID技术 34
3.4.3 云存储 39
3.5 实施步骤 40
3.5.1 高清硬盘录像机多路视频输入 40
3.5.2 高清硬盘录像机抓拍画面 41
3.5.3 高清硬盘录像机录像存储 41
3.5.4 高清硬盘录像机录像回放 42
3.5.5 高清硬盘录像机录像文件导出 43
3.5.6 远程登录网络录像机 44
3.5.7 设置RAID功能 45
3.5.8 云存储设备的基本操作 46
第4章 视频显示 47
4.1 学习目的 47
4.2 实践内容 47
4.3 准备材料 47
4.4 预备知识 48
4.4.1 显示器的类型 48
4.4.2 液晶显示器 49
4.4.3 显示器的技术参数 51
4.4.4 显示器的常用接口 52
4.4.5 分辨率 54
4.5 实施步骤 56
4.5.1 观察多种显示器的外观 56
4.5.2 熟悉信号输入接口 56
4.5.3 更改液晶显示器的参数 57
第5章 中心与云台控制 58
5.1 学习目的 58
5.2 实践内容 58
5.3 准备材料 58
5.4 预备知识 59
5.4.1 中心控制设备 59
5.4.2 云台 60
5.4.3 云台控制协议 62
5.5 实施步骤 63
5.5.1 将多种视频设备接入监控中心,并控制视频信号上电视墙 63
5.5.2 观察摄像机云台及接口 65
5.5.3 利用视频监控设备实现云台控制 65
5.5.4 编程实现云台控制(选做) 68
第6章 视频监控系统 69
6.1 学习目的 69
6.2 实践内容 69
6.3 准备材料 69
6.4 预备知识 69
6.4.1 视频监控系统介绍 69
6.4.2 视频监控系统方案选型指导 72
6.5 实施步骤 76
6.5.1 不同视频监控系统的对比 76
6.5.2 室内视频监控系统方案设计 76
6.5.3 室内视频监控系统方案实现 76
6.5.4 室外视频监控系统方案设计 76
6.5.5 室外视频监控系统方案实现 77
第7章 机器视觉 78
7.1 学习目的 78
7.2 实践内容 78
7.3 准备材料 78
7.4 预备知识 79
7.4.1 机器视觉系统简介 79
7.4.2 机器视觉系统的组成 80
7.4.3 机器视觉系统设备选型 85
7.5 实施步骤 86
7.5.1 观察、熟悉工业相机 86
7.5.2 工业相机视频数据的存储和处理 86
7.5.3 选用合适的工业相机和镜头 90
7.5.4 对比成像效果 91
7.5.5 手机屏幕坏点检测 92
第二部分 视频图像智能化分析算法与工程实践
第8章 视频图像数据预处理:数据增强与标注 94
8.1 学习目的 94
8.2 实践内容 94
8.3 准备材料 94
8.4 预备知识 94
8.4.1 常用的数据增强方法 95
8.4.2 图像标注工具VGG Image Annotator的使用 100
8.5 实施步骤 104
8.5.1 编程实现批量图像的预处理 104
8.5.2 对批量图像进行在线标注 104
第9章 图像增强 105
9.1 学习目的 105
9.2 实践内容 105
9.3 准备材料 105
9.4 预备知识 105
9.4.1 灰度变换增强 106
9.4.2 直方图增强 107
9.4.3 图像平滑 108
9.4.4 图像锐化 108
9.4.5 暗通道先验去雾算法 109
9.4.6 图像质量评价指标 110
9.5 实施步骤 111
9.5.1 编程实现不同的图像增强方法 111
9.5.2 编程实现暗通道先验去雾算法 111
第10章 图像分割 112
10.1 学习目的 112
10.2 实践内容 112
10.3 准备材料 112
10.4 预备知识 112
10.4.1 图像分割算法的研究现状 112
10.4.2 基于阈值的图像分割算法 113
10.4.3 基于图论的图像分割算法 116
10.4.4 选择性搜索算法 117
10.5 实施步骤 119
10.5.1 采集并标注数据 119
10.5.2 编程实现基于阈值的图像分割算法 119
10.5.3 编程实现选择性搜索算法并进行图像分割测试 120
第11章 图像分类 121
11.1 学习目的 121
11.2 实践内容 121
11.3 准备材料 121
11.4 预备知识 121
11.4.1 CIFAR-10简介 122
11.4.2 卷积神经网络简介 122
11.4.3 经典的网络模型 124
11.4.4 利用PyTorch构建卷积神经网络对CIFAR-10进行分类 132
11.5 实施步骤 136
第12章 运动目标检测 137
12.1 学习目的 137
12.2 实践内容 137
12.3 实验准备 137
12.4 预备知识 137
12.4.1 常用的运动目标检测方法——背景差法 138
12.4.2 常用的运动目标检测方法——帧差法 140
12.4.3 运动目标检测的优化策略——形态学处理 141
12.4.4 运动目标检测的评价指标1——IoU 145
12.4.5 运动目标检测的评价指标2——检出率、漏检率和多检率 147
12.4.6 运动目标检测算法流程示例 149
12.5 实施步骤 150
12.5.1 编程实现背景差法 150
12.5.2 编程实现帧差法 150
12.5.3 编程实现目标检测IoU的计算 150
12.5.4 编程实现目标检测评价指标的计算 150
第13章 目标检测与识别 151
13.1 学习目的 151
13.2 实践内容 151
13.3 准备材料 151
13.4 预备知识 151
13.4.1 传统目标检测与识别算法 151
13.4.2 滑动窗口(Sliding Window)法 152
13.4.3 基于深度神经网络的目标检测与识别算法 154
13.5 实施步骤 159
13.5.1 训练集准备 159
13.5.2 将KITTI格式转化为VOC格式 160
13.5.3 利用PyTorch搭建一个基于YOLO v3的目标检测与识别网络 160
13.5.4 利用已有网络模型及参数实现在线交通目标的检测与识别 162
第14章 运动目标跟踪 165
14.1 学习目的 165
14.2 实践内容 165
14.3 准备材料 165
14.4 预备知识 165
14.4.1 运动目标跟踪算法 165
14.4.2 运动目标跟踪数据集 171
14.4.3 运动目标跟踪算法的评价准则与方法 171
14.5 实施步骤(任意选择一个算法实现) 173
14.5.1 实现卡尔曼滤波器 173
14.5.2 实现DeepSORT算法 173
第15章 视频图像双目视觉测距 174
15.1 学习目的 174
15.2 实践内容 174
15.3 准备材料 174
15.4 预备知识 174
15.4.1 双目立体视觉的成像原理 175
15.4.2 双目立体视觉的标定和矫正 175
15.4.3 立体匹配算法 179
15.4.4 深度图计算 181
15.4.5 双目视觉测距流程 181
15.4.6 Kinect 182
15.5 实施步骤 183
15.5.1 双目图像获取 183
15.5.2 标定 183
15.5.3 编程实现双目视觉测距算法 183
第16章 图像无缝拼接 184
16.1 学习目的 184
16.2 实践内容 184
16.3 准备材料 184
16.4 预备知识 184
16.4.1 图像拼接的基本原理 184
16.4.2 基于单应性变换的图像拼接算法 185
16.4.3 APAP算法 192
16.5 实施步骤(任意选择一个算法实现) 194
16.5.1 采集图像 194
16.5.2 编程实现基于单应性变换的图像拼接算法 194
16.5.3 编程实现APAP算法 194
第17章 图像三维重建 195
17.1 学习目的 195
17.2 实践内容 195
17.3 准备材料 195
17.4 预备知识 195
17.4.1 图像三维重建技术 195
17.4.2 基于运动的三维重建算法中关键帧的筛选 196
17.4.3 图像三维重建的基本流程 197
17.4.4 图像三维重建软件 203
17.5 实施步骤 205
17.5.1 使用无人机采集视频并提取关键帧 205
17.5.2 编程实现图像三维重建 206
17.5.3 使用Pix4D Mapper软件实现图像三维重建 206
第三部分 视频图像技术基础开发环境的搭建
第18章 MATLAB编程基础 210
18.1 学习目的 210
18.2 实践内容 210
18.3 准备材料 210
18.4 预备知识 210
18.4.1 MATLAB简介 210
18.4.2 MATLAB安装 211
18.4.3 MATLAB的基本使用 215
18.4.4 MATLAB图像处理基本操作 218
18.5 实施步骤 219
18.5.1 使用MATLAB 219
18.5.2 MATLAB图像处理 220
18.5.3 总结 221
第19章 OpenCV编程基础 222
19.1 学习目的 222
19.2 实践内容 222
19.3 准备材料 222
19.4 预备知识 222
19.4.1 OpenCV简介 222
19.4.2 OpenCV安装 222
19.5 实施步骤 225
19.5.1 图像直方图处理 225
19.5.2 空间域滤波与频域变换 226
第20章 Python编程基础 230
20.1 学习目的 230
20.2 实践内容 230
20.3 准备材料 230
20.4 预备知识 230
20.4.1 Python 3.7.3安装 230
20.4.2 Python常用函数 232
20.5 实施步骤 232
20.5.1 用Python创建一个csv文件 232
20.5.2 用Python写一个脚本 233
20.5.3 多边形面积求解 233
20.5.4 ?的计算 233
20.5.5 下载图像、分类保存并拼接 234
第21章 面向深度学习的智能化图像处理环境搭建 235
21.1 学习目的 235
21.2 项目内容 235
21.3 准备材料 235
21.4 预备知识 235
21.4.1 Windows 10环境下PyTorch的安装 235
21.4.2 Ubuntu 18.04环境下PyTorch的安装 239
21.5 实施步骤 240
21.5.1 编程测试是否有GPU 240
21.5.2 编程实现梯度计算 241
21.5.3 搭建基本的分类神经网络 241
致 谢 244
参考文献 245
附录A 实验报告 250
附录B 实验记录表 251