博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
从高性能计算到人工智能—GPU的加速能力得到广泛认同
阅读量:6703 次
发布时间:2019-06-25

本文共 2123 字,大约阅读时间需要 7 分钟。

GPU开始在超算领域崭露头角。在最新公布的2017中国高性能计算TOP 100排行榜中,已经有28套采用NVIDIA Tesla GPU,其中22套为Tesla P100。中国工程院院士廖湘科表示,今天人们借鉴GPU在超算领域的经验,已经将其引入人工智能领域。GPU的出现对人工智能新崛起起到了积极推动作用。NVIDIA副总裁暨中国区企业事业总经理沈威也表示AI现在已经变成高性能运算的一个杀手级应用。有越来越多的高性能运算中心有专属的AI超算。

 

NVIDIA副总裁暨中国区企业事业总经理沈威

从互联网图像、视频分类、语言识别、自然语言处理等服务到医疗领域癌细胞探测、药物发现再到安防领域人脸识别、视频监控、网络安全再到智慧交通领域行人识别、车道跟踪、交通信号识别。基于深度学习和人工智能的快速发展,人们对与计算能力的需求呈指数型增长,对于计算加速也呈现爆炸式增长。同时深度学习已经渗入到各个行业,沈威举例中国移动是中国最大的呼叫中心,有超过1.5万个话务员,他们也使用了深度学习和GPU技术大量了减轻了人工的负担。

在金融领域,平安科技采用GPU和深度学习的方法来协助自身业务。比如车险业务,你只要拿出手机拍个照传输过去,它马上就可以基于照片上拍出来的损坏状况来做定损,也是深度学习在传统行业应用的体现。 这些应用背后是NVIDIA的技术创新和应用落地。

NVIDIA推出世界领先的HPC 和 AI 数据中心加速平台TESLA 平台,这个平台包括端到端的产品系列,基于深度学习训练和推理Training - Tesla P100和Inference - Tesla P4 & P40,Tesla P100 with NVLink可以为数据 中心HPC and DL应用 应用可扩充到多GPUs,数据中心HPC 应用 混合的 CPU和 GPU作业,Tesla P100 with PCI-E,集成的深度学习超级计算机DGX-1。

在HPC 2017现场展示上,NVIDIA展示了最先进的产品和应用。

 

现场展示了DGX  Station超级计算机,可以说是业界唯一一款专门针对个人设计的超级计算机。它采用了工作站式的设计、采用了很多新技术。在架构上采用了最新TESLA V100 GPU + NVLink,配置了4个GPU,GPU之间用最新NVLink高速带宽连接起来,性能可高达480 TeraFlops;虽然售价为69000美元,听起来比较贵但是其服务器性能大约相当于124台的CPU服务器性能,从性价比来看,还是非常有优势。设计亮点采用了水冷设计实现静音(35分贝低噪音),这是目前业界唯一在工作站采用液冷设计的产品,非常静音,适合办公室环境。过去风冷的设计可能噪声会比较大,现在采用了水冷设计,整个机器的噪音只有35分贝,非常低,在办公室里可以很安静的工作,不会打扰我们的正常思维,这是我们设计最大的一个亮点。

而且它是专门针对深度学习这款产品不光有硬件,而且软件都预装好了,开机只要经过简单设置,就可以用Caffe、TensorFlow等做深度学习的训练,图像识别也好,语音识别也好,而无需花费大量的时间自己去配置软件、装驱动、SDK等等。

 

现场还进行可视化实时仿真的演示。Ansys公司和NVIDIA经历4年时间,利用CUDA制作了一款叫做Discovery Live的软件。目前,这个软件仍为技术预览版,预计明年的2月份会正式发布。

通过NVIDIA强大的加速能力,这款软件能够实现可视化实时仿真,即借助NVIDIA GPU的并行处理能力,实现传统计算仿真和可视化渲染的完美结合。

 简单说就是以前只能先进行仿真模拟,在进行可视化渲染,仿真模拟过程错了还需要从头修改,现在通过强大的计算处理能力能够实现仿真模拟和可视化渲染的完美结合。以前若在验证的过程中发现设计存在的缺陷再回头修改设计,是一个重复的过程;现在,计算和可视化能够在单台工作站实现,大大提升了工作效率。

如上图所示:这个测试的是车。刚才介绍的物理场,比如测试车的风阻系数,可以加入这个模拟状态,位置的改变会调整车的风阻模拟参数:比如加入导风设计,车的风阻系数就会发生改变。

DeepStream,能够实现30路高清视频解码、实时分析和元数据提取,可以时时处理30路视频的解码,解码完了以后通过深度学习的算法提取里面感兴趣的物体,在这里可以看到这些人和这些车,提取完了以后可以做一些声音的处理。大家可以看到这个应用可以把30路视频里所有的人和车都提取出来。

最后在至顶网记者看来,NVIDIA 产品大受欢迎核心就是其具有加速的能力、因为不管是高性能计算、还是人工智能以及大数据应用,更快的速度成为其必备的要求之一,具体来讲,采用GPU对于训练和推理来说其具有大的优势,一个是训练,几十亿,上万亿的操作,GPU 可以训练大的模型,加速应用走向市场。二个是数据中心推理, 每天数十亿的图像,语音,视频的查询,GPU 推理加速相应时间,使数据中心推理吞吐量最大化。 

原文发布时间为:2017年10月30日

本文作者:任新勃 

本文来自云栖社区合作伙伴“至顶网”,了解相关信息可以关注。

转载地址:http://nuzlo.baihongyu.com/

你可能感兴趣的文章
js 当数值过大相减精度丢失的一个思路
查看>>
Java杂谈
查看>>
java 现成网站源码 SSM 框架 freemaker静态引擎 springmvc
查看>>
Mac下 Ubuntu 16 04 配置http、https
查看>>
使用docker搭建gitlab以及ci平台,完整版本(使用springboot项目演示)
查看>>
前端基础25:jQuery的一些常用方法
查看>>
Django搭建个人博客:用户的注册
查看>>
正则表达解析 Markdown 语法
查看>>
使用 Kotlin 编写你的第一个 Firefox WebExtension 扩展
查看>>
源码分析 (三) Stack 源码分析
查看>>
android studio - 使用
查看>>
022-会Excel就会数据分析(Kylin2.6.1+Excel+Power BI)
查看>>
SimpleTouch:事件分发可以如此清晰
查看>>
类字面常量
查看>>
javascript实现数据的双向绑定(手动绑定)
查看>>
原型与原型链
查看>>
你不必使用Redux:比较prop钻取、Redux和React Context API
查看>>
程序员选电脑,你会不会买Mac?
查看>>
[译] Node.js 日志记录指南
查看>>
Android多屏幕尺寸适配原理
查看>>