因在数博会上对GOOGLE推出的Tensorflow颇感到兴趣,又从朋友听到深度学习及应用前景非常广。打算深度学习进行了解并对过程进行笔记。 主要使用tensorflow结合opencv对视频图像进行深度学习,对物品进行分析学习。例如识别车辆品牌及型号,物体快速识别。
深度学习
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
开发套件准备
开发环境工具
anaconda 指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 官网 下载 windows 下载 macos 下载 linux
官方提供了通过Graphical 和Command Line 两种方式,本文选择通过Graphical安装. 因本人MAC系统,选择下载最新基于Mac OS系统的Python 3.6进行安装。
深度学习工具
tensorflow 是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。TensorFlow可被用于语音识别或图像识别等多项机器学习和深度学习领域。 官网 中文社区
视频分析工具
opencv 是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。 官网
语言开发工具
vscode Microsoft Visual Studio(简称VS)是美国微软公司的开发工具包系列产品。VS是一个基本完整的开发工具集,它包括了整个软件生命周期中所需要的大部分工具,如UML工具、代码管控工具、集成开发环境(IDE)等等。所写的目标代码适用于微软支持的所有平台,包括Microsoft Windows、Windows Mobile、Windows CE、.NET Framework、.NET Compact Framework和Microsoft Silverlight 及Windows Phone。 官网
开发语言
python 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议。Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。 官网
环境安装
- 安装anaconda,选择下载安装包,直接安装完成。没有特殊选择项。安装anaconda主要目的是适应多版本python环境搭建及可进行包管理,后续大多数包都可在该系统下进行安装。创建现有环境, 创建环境分为命令行和图形创建: (1). 命令行 创建开发环境命名为tensorflow的环境,适用3.6版本python的
- 安装tensorflow。分为两种安装方式, 一种选择anaconda包管理方式进行下载。选择对应开发环境,选择all中,搜索tensorflow. 另一种功能适用pip进行下载。
- 安装opencv。安装方法类似。
开发调试
-
安装vscode。可以选择从官网下载,也可以从conda中按照默认提供下载。
-
下载vscode插件 安装python插件 配置python路径 如果通过官网下载vscode,还另需要安装conda插件
测试程序
- hello word
通过tensorflow 打印 hello word 以及输出opencv 输出版本。