2516
- 收藏
- 点赞
- 分享
- 举报
英伟达新产品“图灵”发布,虚拟世界还会远吗
本帖最后由 pboj 于 2018-8-15 16:42 编辑
温哥华13号当地时间PM4:00,英伟达(NVIDIA)CEO黄仁勋在计算机图形学年度会议SIGGRAPH上,放出了英伟达下一代的GPU架构“图灵(Turing)”,以及应用Turing架构的对应Quadro系列专业显卡产品,这无疑是一个重磅消息。
这绝对算是一件大事!对于英伟达来说。英伟达每一代GPU架构都会渗透、影响自家全系列产品,但你应该关注的,却远不止新产品本身。
关于全新的图灵(Turing)架构
在发布会现场,黄仁勋为了说明“图灵”的强大,专门拿它和“帕斯卡(Pascal)”架构(均为最强旗舰芯片)进行了一个对比。
从晶体管数量来看,帕斯卡有(GP102核心)118亿个晶体管,而图灵则有186亿个晶体管,增长了57.6%;
从芯片面积来看,帕斯卡芯片大小为471平方毫米,图灵为754平方毫米;
从存储性能来看,帕斯卡的容量为24GB、等效带宽为10GHz,图灵的显存容量上升到48+48GB(需要通过NVlink将双卡互联),等效带宽上升到48GHz。
就这些数字来看,尤其是在晶体管数量上,提升幅度其实还蛮大。从发布会现场了解的情况来看,“图灵”相比“帕斯卡”的14/16nm工艺已经有所提升,它将会采用12nm工艺,但芯片实际尺寸的“暴涨”依旧非常明显。这些改变,对芯片制造的良品率和之后的散热,都提出了较大的挑战。
除了上面提到的,还有另外几个对比值得细看:在CUDA处理器数上,“帕斯卡”最多拥有3840个,“图灵”对应的是4608个,提升约20%。“图灵”还拥有“帕斯卡”所没有的Tensor Core和RT Core,其中RT Core可以完成每秒十亿次的光线追踪模拟运算,Tensor Core可以输出高达125TFLOPS的深度学习运算能力、200TOPS的INT8深度学习运算能力。
最后是互联能力,这次发布的专业卡RTX 8000,能够通过NVlink技术直接在双卡之间形成一条100GB/s的传输通道,让每个GPU都能利用上96GB的显存空间。
整体对比下来,似乎都是大大的提升。但我们再拿另外一个前辈架构“伏特(Volta)”的数据和“图灵”简单去做个对比。
从晶体管数量来看,“伏特”(GV100)拥有211亿个晶体管,“图灵”为186亿个晶体管;
从芯片面积来看,“伏特”(GV100)为815平方毫米,“图灵”为754平方毫米;
从显存形式来看,“伏特”采用的是直连的4颗HBM显存,主要通过显存位宽来提升整体的显存带宽;而“图灵”采用的GDDR6显存,则主要依靠运行频率来提升整体显存带宽;
从CUDA处理器数量来看,“伏特”(GV100)拥有5376个(实际中部分被屏蔽),“图灵”为4608个;
从Tensor处理器数量来看,“伏特”为672个,“图灵”为576个;
从Tensor运算能力来看,“伏特”为125TFLOPS(深度学习运算能力),“图灵”为150TFOLPS。
从这些结果来看,其实可以非常明显看出,“图灵”其实和2017年末登场的“伏特”在一系列参数上有很高的相似度,但两者在实际形态上又相差甚远。
至少从现在来看,“图灵”所采取的一系列变化,关键词都是“实用性”,从另一方面来说就是尽可能将最高端的“伏特”架构部分能力和经验重新组合,打造更低成本的解决方案,并由此来打造最新一代的GPU基础架构。
其他一些值得关注的点
1、选择在专业显卡产品线中进行新架构首发
就英伟达自身的显卡历史而言,新架构的GPU首发都是选择在主流消费级产品之上,大部分都是旗舰产品打头。这一规律最终在“伏特”架构这一代时完全被打破。
黄仁勋在发布会接近尾声的一张PPT上其实也表达出了自己的想法:“‘图灵’架构将打开价值2500亿美元的虚拟特效工业”。
相比汽车、移动市场这些尚需要时间的市场,专业视觉应该是英伟达赢面最大、最有希望短时间见成绩的细分领域了。这一“转舵”操作的源动力,最大可能还是游戏市场的“成长天花板”愈发明显。
2、专业卡来了,游戏卡还会远么
此次“图灵”架构的首发,则基本直接坐实了英伟达将携新显卡登录德国科隆游戏展的计划。
最值得期待的或许是全新的RT Core能否直接应用到游戏开发和运行当中,从而进一步提升游戏的显示效果。但究竟专业显卡核心细节、性能在转向消费级产品时会做哪些调整,暂时仍是一个谜团。
3、英伟达正在逐渐走上产品细分道路
最近一两年间,英伟达各个领域的产品正在显示出一种自我细分的趋势:从最高端的、高制造成本的V100 GPU系列解决方案;到相对停滞的消费级显卡产品;再到开始集成多种专用处理器模块的最新自动驾驶平台新一代Xavier;最后是这次引入了全新RT Core设计的专业视觉产品。
可以看到英伟达各领域产品虽然都保留了同样的GPU运算部分,但差异部分的确越来越多,这在某种程度上也呼应了摩尔定律再次减缓的趋势。至少对英伟达来说,并不会固执地“坚持”只走通用路线,而是集中精力“解决问题”。
这也是为什么,至少在可见的未来,英伟达的这个用GPU架构将自身各个产品线“串联”起来的行为,已经在产品功能和生态打造上拥有的明显竞争优势。
温哥华13号当地时间PM4:00,英伟达(NVIDIA)CEO黄仁勋在计算机图形学年度会议SIGGRAPH上,放出了英伟达下一代的GPU架构“图灵(Turing)”,以及应用Turing架构的对应Quadro系列专业显卡产品,这无疑是一个重磅消息。
这绝对算是一件大事!对于英伟达来说。英伟达每一代GPU架构都会渗透、影响自家全系列产品,但你应该关注的,却远不止新产品本身。
关于全新的图灵(Turing)架构
在发布会现场,黄仁勋为了说明“图灵”的强大,专门拿它和“帕斯卡(Pascal)”架构(均为最强旗舰芯片)进行了一个对比。
从晶体管数量来看,帕斯卡有(GP102核心)118亿个晶体管,而图灵则有186亿个晶体管,增长了57.6%;
从芯片面积来看,帕斯卡芯片大小为471平方毫米,图灵为754平方毫米;
从存储性能来看,帕斯卡的容量为24GB、等效带宽为10GHz,图灵的显存容量上升到48+48GB(需要通过NVlink将双卡互联),等效带宽上升到48GHz。
就这些数字来看,尤其是在晶体管数量上,提升幅度其实还蛮大。从发布会现场了解的情况来看,“图灵”相比“帕斯卡”的14/16nm工艺已经有所提升,它将会采用12nm工艺,但芯片实际尺寸的“暴涨”依旧非常明显。这些改变,对芯片制造的良品率和之后的散热,都提出了较大的挑战。
除了上面提到的,还有另外几个对比值得细看:在CUDA处理器数上,“帕斯卡”最多拥有3840个,“图灵”对应的是4608个,提升约20%。“图灵”还拥有“帕斯卡”所没有的Tensor Core和RT Core,其中RT Core可以完成每秒十亿次的光线追踪模拟运算,Tensor Core可以输出高达125TFLOPS的深度学习运算能力、200TOPS的INT8深度学习运算能力。
最后是互联能力,这次发布的专业卡RTX 8000,能够通过NVlink技术直接在双卡之间形成一条100GB/s的传输通道,让每个GPU都能利用上96GB的显存空间。
整体对比下来,似乎都是大大的提升。但我们再拿另外一个前辈架构“伏特(Volta)”的数据和“图灵”简单去做个对比。
从晶体管数量来看,“伏特”(GV100)拥有211亿个晶体管,“图灵”为186亿个晶体管;
从芯片面积来看,“伏特”(GV100)为815平方毫米,“图灵”为754平方毫米;
从显存形式来看,“伏特”采用的是直连的4颗HBM显存,主要通过显存位宽来提升整体的显存带宽;而“图灵”采用的GDDR6显存,则主要依靠运行频率来提升整体显存带宽;
从CUDA处理器数量来看,“伏特”(GV100)拥有5376个(实际中部分被屏蔽),“图灵”为4608个;
从Tensor处理器数量来看,“伏特”为672个,“图灵”为576个;
从Tensor运算能力来看,“伏特”为125TFLOPS(深度学习运算能力),“图灵”为150TFOLPS。
从这些结果来看,其实可以非常明显看出,“图灵”其实和2017年末登场的“伏特”在一系列参数上有很高的相似度,但两者在实际形态上又相差甚远。
至少从现在来看,“图灵”所采取的一系列变化,关键词都是“实用性”,从另一方面来说就是尽可能将最高端的“伏特”架构部分能力和经验重新组合,打造更低成本的解决方案,并由此来打造最新一代的GPU基础架构。
其他一些值得关注的点
1、选择在专业显卡产品线中进行新架构首发
就英伟达自身的显卡历史而言,新架构的GPU首发都是选择在主流消费级产品之上,大部分都是旗舰产品打头。这一规律最终在“伏特”架构这一代时完全被打破。
黄仁勋在发布会接近尾声的一张PPT上其实也表达出了自己的想法:“‘图灵’架构将打开价值2500亿美元的虚拟特效工业”。
相比汽车、移动市场这些尚需要时间的市场,专业视觉应该是英伟达赢面最大、最有希望短时间见成绩的细分领域了。这一“转舵”操作的源动力,最大可能还是游戏市场的“成长天花板”愈发明显。
2、专业卡来了,游戏卡还会远么
此次“图灵”架构的首发,则基本直接坐实了英伟达将携新显卡登录德国科隆游戏展的计划。
最值得期待的或许是全新的RT Core能否直接应用到游戏开发和运行当中,从而进一步提升游戏的显示效果。但究竟专业显卡核心细节、性能在转向消费级产品时会做哪些调整,暂时仍是一个谜团。
3、英伟达正在逐渐走上产品细分道路
最近一两年间,英伟达各个领域的产品正在显示出一种自我细分的趋势:从最高端的、高制造成本的V100 GPU系列解决方案;到相对停滞的消费级显卡产品;再到开始集成多种专用处理器模块的最新自动驾驶平台新一代Xavier;最后是这次引入了全新RT Core设计的专业视觉产品。
可以看到英伟达各领域产品虽然都保留了同样的GPU运算部分,但差异部分的确越来越多,这在某种程度上也呼应了摩尔定律再次减缓的趋势。至少对英伟达来说,并不会固执地“坚持”只走通用路线,而是集中精力“解决问题”。
这也是为什么,至少在可见的未来,英伟达的这个用GPU架构将自身各个产品线“串联”起来的行为,已经在产品功能和生态打造上拥有的明显竞争优势。
我来回答
回答4个
时间排序
认可量排序
认可0
认可0
认可0
认可0
或将文件直接拖到这里
悬赏:
E币
网盘
* 网盘链接:
* 提取码:
悬赏:
E币
Markdown 语法
- 加粗**内容**
- 斜体*内容*
- 删除线~~内容~~
- 引用> 引用内容
- 代码`代码`
- 代码块```编程语言↵代码```
- 链接[链接标题](url)
- 无序列表- 内容
- 有序列表1. 内容
- 缩进内容
- 图片![alt](url)
相关问答
-
2018-12-17 16:10:18
-
2014-04-08 21:35:06
-
2015-06-28 11:28:27
-
2018-08-21 17:52:14
-
2013-08-25 19:27:11
-
2020-06-15 14:54:49
-
2017-11-23 13:48:14
-
2008-07-13 22:50:58
-
2013-11-19 19:16:49
-
2021-01-15 17:43:24
-
2018-06-12 20:20:00
-
2012-12-24 15:11:29
-
2012-12-01 21:55:52
-
2020-11-16 15:03:54
-
2020-09-23 16:52:26
-
2015-08-05 16:20:00
-
2012-12-05 11:21:56
-
2020-08-29 18:04:36
-
2015-03-19 09:39:48
无更多相似问答 去提问
点击登录
-- 积分
-- E币
提问
—
收益
—
被采纳
—
我要提问
切换马甲
上一页
下一页
悬赏问答
-
5Hi3516CV610 如何使用SD卡升级固件
-
5cat /dev/logmpp 报错 <3>[ vi] [func]:vi_send_frame_node [line]:99 [info]:vi pic queue is full!
-
50如何获取vpss chn的图像修改后发送至vo
-
5FPGA通过Bt1120传YUV422数据过来,vi接收不到数据——3516dv500
-
50SS928 运行PQtools 拼接 推到设备里有一半画面会异常
-
53536AV100的sample_vdec输出到CVBS显示
-
10海思板子mpp怎么在vi阶段改变视频数据尺寸
-
10HI3559AV100 多摄像头同步模式
-
9海思ss928单路摄像头vio中加入opencv处理并显示
-
10EB-RV1126-BC-191板子运行自己编码的程序
举报反馈
举报类型
- 内容涉黄/赌/毒
- 内容侵权/抄袭
- 政治相关
- 涉嫌广告
- 侮辱谩骂
- 其他
详细说明
提醒
你的问题还没有最佳答案,是否结题,结题后将扣除20%的悬赏金
取消
确认
提醒
你的问题还没有最佳答案,是否结题,结题后将根据回答情况扣除相应悬赏金(1回答=1E币)
取消
确认