深度学习:教计算机预测未来

子轸 2019年11月7日10:51:27 评论

深度学习:教计算机预测未来

Atlas机器人是麻省理工学院计算机科学与人工智能实验室的众多实验之一,于2013年4月6日在马萨诸塞州波士顿进行。

麻省理工学院的研究人员使用部分模拟在人脑上的算法,使计算机能够通过检查照片来预测不久的将来。

麻省理工学院计算机科学与人工智能实验室(CSAIL)创建的一个程序实际上观看了200万个在线视频,并观察了不同类型的场景通常如何发展:人们走过高尔夫球场,海浪冲上岸等等。现在,当它看到一个新的静止图像时,它可以生成一个简短的视频剪辑(大约1.5秒长),以显示其对近期的愿景。

CSAIL研究生,本月在《神经信息处理系统》上发表的相关研究论文的主要作者卡尔·沃恩德里克(Carl Vondrick)说:“这是一个试图学习什么是看似视频的系统,您可能会看到哪些是看似运动的系统。”巴塞罗那会议。该小组的目标是在将来制作具有更复杂场景的更长视频。

但是沃恩德里克说,应用程序有一天可能不仅限于将照片转换为计算机生成的GIF。他说,该系统预测正常行为的能力可以帮助发现安全镜头中的异常事件,或提高自动驾驶汽车的可靠性。

如果系统发现不寻常的东西,例如撞上道路之前从未见过的那种动物,Vondrick解释说,车辆“可以检测到并说,'好吧,我以前从未见过这种情况-我可以例如,停下来让驾驶员接管。”

深度学习:教计算机预测未来

CNN生成视频模型

为了创建该程序,麻省理工学院的团队依靠一种称为深度学习的科学技术,该技术已成为现代人工智能研究的核心。这种方法使苹果公司的Siri和亚马逊公司的Alexa等数字助理了解用户的需求,并推动了Facebook和Google的图像搜索和面部识别技术的发展。

专家说,深度学习使用称为神经网络的数学结构从大量数据中提取模式,可以让计算机很快根据医学图像进行诊断,检测银行欺诈,预测客户订单模式以及至少与人一样操作车辆。

旧金山初创公司Skymind的首席执行官Chris Nicholson说:“深度神经网络在各种重大问题(例如图像识别)上的表现都优于人类,”该公司开发了深度学习软件并提供咨询服务。“没有自动驾驶汽车,我认为自动驾驶汽车将是道路上的危险,但是有了它们,自动驾驶汽车比人类驾驶员更安全。”

神经网络接受低级输入(例如图像的像素或音频片段),并通过一系列虚拟层来运行它们,这些虚拟层在解释输入时为每个单独的数据分配相对权重。深度学习中的“深度”是指使用这些层的高堆栈来共同发现数据中更复杂的模式,从而将其理解范围从像素扩展到基本形状,再到停车标志和刹车灯等功能。为了训练网络,程序员会在大量数据上对其进行反复测试,并自动调整权重,以使网络随着时间的推移会犯越来越少的错误。

深度学习:教计算机预测未来

2014年9月19日,在中国香港的iPhone 6和iPhone 6 Plus上市销售期间,客户在苹果公司的铜锣湾商店尝试使用Apple Inc. iPhone 6 Plus的Siri语音识别功能。

Nicholson表示,虽然对神经网络的研究(松散地基于人脑)可以追溯到几十年前,但在过去的大约十年中,进展尤其明显。著名的计算机科学家杰弗里·欣顿(Geoffrey Hinton)于2006年发表了一组论文,他现在将自己的时间分配给Google和多伦多大学,这为深度学习的快速发展铺平了道路。

2012年,包括Hinton在内的团队率先使用深度学习赢得了著名的计算机科学竞赛,即ImageNet大规模视觉识别挑战赛。该团队的程序在将照片中的对象归类到类别中的表现远远超过了竞争对手,其错误率是15.3%,而第二名的错误率是26.2%。

今年,一台由谷歌设计的经过深度学习训练的计算机击败了世界顶级围棋选手,这是古代亚洲棋盘游戏的许多专家此前认为可能还需要数十年的壮举。这个叫做AlphaGo的系统部分是通过与自己对战而进行的数百万模拟游戏而获得的。尽管人类象棋玩家长期以来一直被数字竞争对手击败,但许多专家认为,Go(有效动作序列明显更多)对于计算机而言可能更难掌握。

11月初,牛津大学的一个小组推出了一种基于深度学习的口语阅读系统,该系统的性能优于人类专家。本周,包括Google研究人员在内的一个团队在《美国医学会杂志》上发表了一篇论文,该文章表明深度学习可以大致识别糖尿病性视网膜病以及训练有素的眼科医生。这种眼疾会导致糖尿病患者失明,特别是如果他们无法获得测试和治疗。

彭丽丽博士说:“很多人都无法获得可以访问这些(诊断)胶片的专家,尤其是在糖尿病发病率不断上升且眼保健专业人员人数持平的服务不足的人群中,” Google的产品经理,论文的主要作者。

像许多深度学习的成功一样,视网膜病变研究依赖于大量的训练数据,包括大约128,000张已经由眼科医生分类的图像。深度学习从根本上说是互联网时代的一种技术,它要求仅几年前就已经太大而无法容纳在硬盘上的数据集。

冯德里克说:“在没有可用数据的情况下,它没有那么有用。” “如果很难获取数据,那么深度学习可能无法帮助您。”

深度学习:教计算机预测未来

2016年9月22日,宾夕法尼亚州匹兹堡,Uber无人驾驶福特Fusion沿着Smallman Street行驶。优步在匹兹堡建立了优步技术中心,并正在开发一种自动驾驶汽车,希望它能够在无须驾驶员的情况下运送数百万的客户。

要学习相同的技能,计算机需要比人类更多的示例。ImageNet挑战赛的最新版本随着算法变得越来越复杂而增加了更复杂的对象识别和场景分析挑战,其中包括数百GB的训练数据,其大小比CD或DVD大几个数量级。Google的开发人员从该公司庞大的搜索结果和点击档案库中训练新算法,而竞相打造自动驾驶汽车的公司则从配备有大量仪器的人工驾驶汽车中收集了大量传感器读数。

湾区无人驾驶汽车初创公司Drive.ai的首席执行官Sameep Tandon说:“获取正确的数据类型实际上是最关键的部分。” “例如,在加利福尼亚州山景城沿El Camino行驶时,仅沿加利福尼亚州5号高速公路直行行驶100个小时就无济于事。”

一旦收集了所有数据,仍然需要对神经网络进行训练。专家们带着敬畏的态度说,所涉及的数学运算并不超出高中生的水平—一些巧妙的矩阵乘法可以对数据点进行加权,而一些微积分可以以最有效的方式来优化权重—但所有这些这些计算仍然相加。

“如果您拥有如此庞大的数据集,但只有一台非常弱的计算机,您将需要等待很长时间来训练该模型,”加州大学伯克利分校的研究生,Caffe首席开发人员Evan Shelhamer说。 ,一种用于深度学习的广泛使用的开源工具包。

只有现代计算机以及具有互联网功能的研究社区共享工具和数据,才使深度学习成为现实。但是研究人员说,这仍然不是每种情况的理想选择。一个局限性在于,很难理解神经网络实际上是如何解释数据的,如果将算法用于诸如驾车,评估医学图像或计算信​​用评分之类的敏感任务,可能会使监管机构暂停。

尼科尔森说:“目前,深度学习还没有足够的解释力。” “即使它以比其他任何[技术]都更高的准确度做出决定,它也不能总是告诉您为什么做出决定。”

该系统还可能具有潜在的盲点,而最初的培训和测试数据并未发现这些盲点,从而可能在异常情况下导致意外错误。也许对人类来说幸运的是,当前的深度学习系统还没有足够的智能来独自学习新技能,即使没有大量单独的培训也与他们已经可以做的事情紧密相关。

Shelhamer说:“用于识别珊瑚的网络对识别甚至从人行道上的草丛一无所知。” “ Go网络不仅会自己成为跳棋大师。”

  • A+
所属分类:UFO
子轸

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: