AI和工业4.0之间,差距不是那一星半点?

2019年01月30日 作者:糖悦之果飞

行业级最先进的计算机视觉技术摘要

如今,人工智能在工业领域有着蓬勃发展趋势,因为自动化以及优化仍是数字革命的主要焦点。在本文中,我们将回顾近几年在AI社区中那些令人兴奋的最先进的计算机视觉技术,这些技术被认为是工业就绪的,而且对工业用例产生重大而又实际的影响。其中一些技术对性能的提升达到了令人难以置信的程度,超越了人类能达到的性能水平,从而超出了大多数行业所期望的精度和可靠性标准。在基本的计算机视觉任务(例如图像分类)中取得的惊人进步,使得可靠地结合多种技术来创建新的复合技术从而实现之前从未在工业环境中探索过的全新用例成为可能。

话虽如此,这些新技术已经证明其结果可与那些只能通过非常密集的硬件专用系统才能获得的精度和可靠性结果相媲美。虽然在实现这些专用系统和安装与之相关的硬件方面存在实际的困难和限制,但相机是很容易买到的,从而极大地扩大了用例范围。AI赋能的计算机视觉系统使得有可能跨入到一个新的领域,加速了工业4.0,真正数字化和物理现实增强的进程。

在我们深入了解计算机视觉领域的最新进展之前,让我们先介绍一些基本概念以及深度学习和计算机视觉这方面的历史事件。

计算机视觉简介

计算机视觉是一门科学,旨在使计算机能够理解并从图形和视频中洞悉信息。计算机视觉,即自动执行视觉任务的能力,例如从图形或视频中提取和分析有用的信息。

机器学习和深度学习简介

机器学习是算法和统计模型的科学研究,它依赖于数据驱动的方法来做决策而不是基于规则的方法。给定大量高质量数据并通过改进算法,机器学习系统能够逐步提高其在特定任务上的性能。深度学习是机器学习的子类,完全侧重于一组可描述为网络的数学算法。它们起初受到人脑中发现的生物神经网络的启发,同样,人工神经网络具有数百万个人工突触,数学上由数百万个简单的线性代数方程表示。

深度学习驱动计算机视觉

自2012年深度学习神经网络一直是计算机视觉的主要关注点是有理由的。由深度学习驱动的计算机视觉系统的优点是它们具有更高准确性,更灵活,且对大量的光线条件变化,视点,尺度,方向,与背景融合,类内差异,变形以及视觉遮挡等情况具有更高容忍度。但最重要的是,它们启发了新的用例。

早期的计算机视觉模型依赖于原始像素数据作为机器学习模型的输入。然而,单独的原始像素数据不足以包含图像中对象的千变万化。

深度学习驱动的计算机视觉基于深度神经网络可在训练阶段自动提取和创建特定任务的特征,然后将其用于执行计算机视觉任务。

下图突出了深度学习和计算机视觉近6年历史中最重要的一些事件。

  • 2012年引入深度神经网络所带来的突破使得图像分类误差减少了约10%(从2011年的25.8%降至2012年的16.4%)。
  • 2015年最先进的算法在图像分类方面的表现超过了人类水平(5.1%,Russakovsky et al.),准确率为3.57%。
  • 总体而言,深度神经网络的引入导致图像分类误差减少10倍(从2011年的25.8%将至2017年的2.3%)。

值得注意的是,上述结果是在ImageNet数据集上实现的,其中20,000个类别具有典型类别,例如“气球”或“草莓”,由数百个低分辨率469x387像素图像组成。计算机视觉系统应用于具有较少类别,较少变化和较多数量的较高分辨率图像的特定任务时,其准确度可以高达99.9%。这使得完全独立自信地运行一个系统成为可能。

现在我们已经介绍了基础知识,我们可以更详细地了解这些技术了。

图像分类

在本节中,我们将介绍图像分类,这是将一组固定类别中的一个标签分配给图像的任务。这是计算机视觉中的核心问题之一,尽管其简单,但其具有各种各样的实际应用。许多其它看似不同的计算机视觉任务(例如图像 字幕,目标检测,关键点检测和分割)可以简化为图像分类,其它任务利用全新的神经网络架构。以下视频片段说明了一个非常简单的分类事例。

Simple Image Classification using Convolutional Neural Network (Venkatesh Tata Dec 2017)

1 2 3

相关文章