我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 语义检查 >

深度学习下的分类目标检测、语义分割这三个方向具体的概念及其应

归档日期:06-06       文本归类:语义检查      文章编辑:爱尚语录

  随着Halcon新版本的更新,截止2019年5月1号。Halcon的最新版本为halcon18.11.这次新版本最大的更新在于完整的加入了在视觉应用的三个重要部分,即目标分类分类、目标检测、语义分割这三个内容。与此同时超人视觉即将向大家简介Halcon软件这三个方向的应用示例,帮助大家进一步认识到

  在开始内容前我们先明确一下前面提到的三个重要概念即深度学习下的分类,目标检测、语义分割这三个方向具体的概念及其应用场景是什么?帮助大家理解其技术的产生背景以及形成自己的理解。

  图像分类这一类问题常用与区分不同的物品,图像分类,顾名思义,是一个输入图像,输出对该图像内容分类的描述的问题。它是视觉方向的其中一个核心,实际应用广泛。许多同学在学习计算机视觉中有一个练习题是练习如何区分猫狗如图1所示:

  我们观察一下这些图片的特点,这些图片各种各样,分辨率也各不相同。图片中的猫和狗形状、所处位置、体表颜色各不一样。它们的姿态不同,有的在坐着而有的则不是,它们的情绪可能是开心的也可能是伤心的,猫可能在睡觉,而狗可能在汪汪地叫着。照片可能以任一焦距从任意角度拍下。

  总而言之这些图片有着无限种可能,对于我们人类来说在一系列不同种类的照片中识别出一个场景中的宠物自然是毫不费力的事情,然而这对于一台机器来说可不是一件小事。实际上,如果要机器实现自动分类,那么我们需要知道如何强有力地描绘出猫和狗的特征,也就是说为什么我们认为这张图片中的是猫,而那张图片中的却是狗。这个需要描绘每个动物的内在特征。

  1. 在传统的分类方法下图像分类是特征描述及检测,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况非常复杂,传统的分类方法不堪重负。深度学习下的神经网络在图像分类任务上效果很好的原因是,它们有着能够自动学习多重抽象层的能力,神经网络可以识别极端变化的模式,在扭曲的图像和经过简单的几何变换的图像上也有着很好的鲁棒性。

  图像分类是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同物体并且给出边界框。目标检测在很多场景有用,如无人驾驶和安防系统。

  传统的目标检测的算法多用模板匹配完成,但是模板匹配针对复杂场景下下的识别并不良好,特别是在光照情况不稳定物体有遮挡的情况下算法的鲁棒性如何确保一直是传统视觉算法的一个难题。

  由上图所示,我们可以总结出来目标检测要解决的核心问题是:1)目标可能出现在图像的任何位置,2)目标有各种不同的大小,3)目标可能有各种不同的形状。深度学习在这方面的处理已经部分超越了传统算法的上限,目前较为先进的深度卷积神经网络结构,通过其具有局部连接权,值共享及池化操作等功能,有效降低了网络的复杂度,减少了训练参数的数目。使模型对于平移、扭曲、缩放具有一定程度不变性并具有较强的鲁棒性和容错能力,且易于训练与优化的网络结构。

  语义分割方法在处理图像时,具体到像素级别,也就是说,该方法会将图像中每个像素分配到某个对象类别。语义分割是一种典型的计算机视觉问题,其涉及将一些原始数据(例如,平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。

  许多人使用术语全像素语义分割,其中图像中的每个像素根据其所属的感兴趣对象被分配类别ID。 早期的计算机视觉问题只发现边缘(线条和曲线)或渐变等元素,但它们从未完全按照人类感知的方式提供像素级别的图像理解。语义分割将属于同一目标的图像部分聚集在一起来解决这个问题,从而扩展了其应用领域。如图所示。

  语义分割问题也可以被认为是分类问题,其中每个像素被分类为来自一系列对象类中的某一个。因此一个使用案例是利用土地的卫星影像制图。土地覆盖信息是重要的各种应用,如监测地区的森林砍伐和城市化等。 为了识别卫星图像上每个像素的土地覆盖类型(例如,城市、农业、水等区域),土地覆盖分类可以被视为多级语义分割任务。道路和建筑物检测也是交通管理,城市规划和道路监测的重要研究课题。

  以上介绍的三个方向是目前深度学习在计算机视觉领域非常火热的三个研究方。市面上许多网络教程通过使用开源的视觉开发软件OpenCV结合Caffe/tensorflow进行发开,但是对于初学者,这一套开发与部署流程对于刚刚接触深度学习的同学非常不友好,学习周期漫长并且部署流程繁琐。德国著名视觉算法软件开发公司MVtec开发的Halcon算法工具包集成了开发环境。后期将会带大家了解如何通过Halcon软件开发包快速上手玩转当前最火的深度学习三大方向应用。

  文章出处:【微信号:chaorenshijue,微信公众号:超人Halcon机器视觉】欢迎添加关注!文章转载请注明出处。

  David,加州大学物理博士,美国著名电商数据科学家。本课程介绍什么是深度学习, 深度学习与机器学习的关系,几种神经网络

  David,加州大学物理博士,美国著名电商数据科学家。本课程介绍什么是深度学习, 深度学习与机器学习的关系,几种神经网络

  近年来,深度强化学习(Deep reinforcement learning)方法在人工智能方面取得....

  机器学习(深度学习为其中一分支)技术成为各产业智慧化的核心能力,但是算法的设计复杂,需要专业知识与经....

  i.MX 8开发工具从相机获取数据并使用一个GPU并应用图像分割算法。然后将该信息馈送到专用于识别交通标志的神经网络推理引擎...

  除了自动驾驶、人脸识别、理解语言外,机器学习还将帮助人类创造更加清洁的能源未来。

  作为ICT的从业人员,大家都知道有两个公司是有点臭名昭著,因为他们和SUN Micro公司不一样,好....

  在张钹院士看来,目前全世界的企业界和部分学界对于深度学习技术的判断过于乐观,人工智能迫切需要推动到新....

  谷歌近日推出了在计算机视觉领域模拟重建人类视觉的新模型,与以往方法不同的是,新模型利用AI,通过普通....

  在Alphago与韩国围棋选手李世石对战获胜三年过后,一些迹象逐渐显现,张钹院士认为到了一个合适的时....

  手写数字识别技术是近年来研究的热点,具有广泛的应用前景,同时也是一个非常具有挑战性的课题。人工神经网....

  Geoffrey Hinton是深度学习的创始人之一,2019年图灵奖得主,谷歌工程研究员。 在津....

  自1956年人工智能这个概念在第一次人工智能研讨会上被麦肯锡提出以来,人工智能已经走过了63个春....

  机器视觉是通过计算机来模拟人类视觉功能,以让机器获得相关视觉信息和加以理解。可分为“视”和“觉”两部....

  为了弥补空间精度的损失,研究者们在分类卷积神经网络结构的基础上,通过引入上采样操作和/或组合空洞卷积....

  彼时,他正与林健、白小龙合作撰写《深入理解 TensorFlow:架构设计与实现原理》这本书。抱着希....

  Facebook全新开源深度学习框架Pythia,即插即用快速构建AI模型

  Pythia加入了最近的人工智能竞赛(2018年VQA挑战赛和2018年Vizwiz挑战赛)中获奖作....

  我们将网络的核心命名为”CP模块“,其结构如下,大致分为两个部分。输入和输出都是一个THW x C的....

  研究团队提出了一种新的持续学习框架,称为“学习成长”(Learn to Grow),它将网络结构学习....

  深度压缩感知(DCS)框架通过联合训练生成器和通过元学习优化重建过程,显著提高了信号恢复的性能和速度....

  当摄像头和场景中的物体都在自由移动时,是实现重建的最困难的情况。这种情况混淆了基于三角测量的传统3D....

  是的,《哈利·波特》世界中”会动的画“魔法实现了!来自三星AI中心(Samsung AI Cente....

  在超算领域,中美之间无声的竞争还在进行中,2018年美国凭借橡树岭国家实验室的Sumiit超算夺回了....

  针对永磁无刷直流电动机驱动系统的低转矩脉动,提出了一种基于人工神经网络的转矩控制方法。传统的无刷直流....

  MIT的三位科学家首次用大脑视觉神经网络模型,实现了控制动物大脑的神经元活动。

  宝马集团自动驾驶研发中心成立于2017年,位于德国慕尼黑下施莱斯海姆(Unterschleißhei....

  还记得从什么时候开始,你学会了看图识数,什么时候开始明白1和2的含义么?

  莱迪思新版sensAI实现10倍的性能提升,助力网络边缘低功耗、智能IoT设备

  莱迪思半导体公司低功耗、可编程器件的领先供应商,今日宣布其屡获殊荣的Lattice sensAITM....

  近年来,我国建筑在规模和层次上都发展到了一个新的高度,同时建筑施工安全管理也越发受到人们重视。

  总的来说,对于数学公式的识别,主要是将识别出的独立的字符组织成计算机能够理解的数学公式(这里的数学公....

  虽然机器学习领域涵盖了各种各样的重要主题,但为了简洁起见,同时也是由于目前某些方法缺乏足够坚实的理论....

  很多同学入门机器学习之后,直接用TensorFlow调包实现神经网络,对于神经网络内在机理知之甚少。

  随着AI的广泛应用,深度学习已成为当前AI研究和运用的主流方式。面对海量数据的并行运算,AI对于算力....

  针对现有的地图更新方法,在室内地图环境下的效果并不理想的问题,提出了一种分层式的室内地图更新方法。首....

  在5月 9日的北京智源人工智能研究院主办的“智源论坛——人工智能的数理基础”系列报告中,北京⼤学的张....

  今年愚人节当天,阿里宣布了一项新技术被称为“AI谣言粉碎机”。这项技术的算法模型通过深度学习和神经网....

  对于图像分类问题,Dense层可能是不够的。但我们也可以另辟蹊径!有完整的卷积神经网络可供下载。我们....

  开源的特斯拉线圈项目,基本上,特斯拉线圈由空气耦合变压器组成,具有非常高的匝数比。

  PA利用Tesla V100 GPU Tensor核心的强大计算力缩短模型训练时间、提升模型迭代速度

  阿里巴巴PAI团队的自动混合精度转换在PAI平台深度定制的Tensorflow框架PAI-Tenso....

  在材料学领域,对分子或晶体结构的特征描述需要满足平移,转动,镜面不变性,以及对整体结构特异信息的表征....

  我们提出在基础的迭代式攻击方法上加入动量项,避免在迭代过程中可能出现的更新震荡和落入较差的局部极值,....

  英伟达公司,恐怕每一个电脑用户都知道是个伟大的公司,按理说在2018年公布的Xavier Drive....

  人类和部分动物都具有一种数量感知能力,不需要刻意数数,就能凭借视觉对数量多少得出一个基本判断,甚至直....

  【Elecfans社区精华帖】(190507):快上车!32年老司机教你优化模拟集成!

  电子发烧友总结了以“神经网络”为主题的精选干货,今后每天一个主题为一期,希望对各位有所帮助!(点击标题即可进入页面下载相...

  NNoM (Neural Network on Microcontroller) 是一个轻量化,纯C实现的一个机器学习和神经网络包。AIoT那么火,为...

本文链接:http://furymagazine.com/yuyijiancha/30.html