体系结构顶会HPCA2017英特尔夺魁跨平台深度学习论文获最佳论文提名
- 2025-10-23 23:01:00
- aiadmin 原创
- 98
新智元日前揭橥,获6家顶级机构总额达数万万元的PreA轮融资,蓝驰创投领投,红杉血本中邦基金、高瓴智成、蓝湖血本 、蓝象血本、今日头条跟投。本轮融资将用于新智元团队范围扩充并添加新产物任事线,标的打制 To B 的人工智能全财富链任事平台。
新智元启动新一轮大任用:COO、履行总编、主编、高级编译、编缉、运营总监、客户司理、商讨总监、行政助理等 9 大岗亭周全绽放。
新智元为COO和履行总编供应最崇高百万的年薪勉励;为骨干员工供应最完全的培训编制、高于业界均匀程度的工资和奖金。
【新智元导读】IEEE 高本能打算架构聚会( HPCA 2017 )日前公告了本年度的最佳论文,英特尔摘下桂冠。本文除了对最佳论文的先容,还要点先容了另一篇来自佛罗里达大学李涛教学的跨平台深度进修论文,这篇论文被提名为最佳论文候选。中科院神经汇集架构博士王超助助下,本文还测试对编制组织查究中的中邦能力举办量化的清点。
2017年 2月4日到8日,IEEE 高本能打算架构聚会( HPCA 2017 )正在美邦的奥斯汀实行,这是打算机编制组织的邦际顶级聚会之一,一齐召开的另有编译和算法界限的CGO以及PPoPP。
中科院打算所查究员韩银和总结说, 本年大陆有3篇论文入选,不到总论文数的1/10,和其他对象比拟,编制组织仍然美邦难以撼动的上风界限,追逐的途还很长。
遵循中科大神经汇集架构查究团队的博士王超的统计,正在HPCA聚会(1995-2016)上宣告过论文的著名华人学者网罗来自UCSB的谢源教学(9篇),佛罗里达大学的李涛教学(8篇),匹兹堡大学的张有弢教学(7篇),以及UCSD的周源源教学(6篇)。
韩银和同时带来一个讯息:UCSB的谢源教学入选来岁(HPCA2018)的法式主席。这是华人学者正在编制组织编制上名望晋升的一个符号性变乱。
正在打算机编制组织的三个顶级聚会中,来自中邦大陆的团队查究论文额外少。据统计,大陆第一单元正在ISCA聚会上宣告的论文共18篇,个中陈云霁和陈天石查究员团队正在ISCA上宣告了4篇论文。而对HPCA聚会来说,大陆第一单元聚会上宣告的论文共17篇。MICRO聚会,1994年之前中邦有9篇论文,然后从2009年至今有10篇论文,共19篇。 但是总体来看,大陆第一作家的论文数目展示上升趋向。
然而值得留神的是,近年来,不单仅大陆第一作家论文数目的晋升,第一作家是华裔学生及查究职员的论文数目也大幅晋升,显示出华人查究职员正在他日编制组织查究界限的能力。比如ISCA 2016正在整个的57篇论文中,有21篇论文的第一作家是华人查究职员,HPCA 2017的一作华人论文有19篇,MICRO 2016也有19篇,大要占到了论文总数的三分之一操纵。

存储墙依然是本能的瓶颈。固然小型管芯缓存到目前为止的本能尚足以规避这个瓶颈 ,不过摩登的利用中不竭添加的占用使得如此的缓存效益越来越差。近年来,内存技艺,比方嵌入式DRAM(eDRAM)和高宽带存储(High Bandwidth Memory)的前进,使得正在 CPU 封装上集成大型存储,行动一种特地的带宽资源而不是DRR 主存储成为可以。因为容量的限度,这些存储平常都市被当成一个内存侧的缓存。受到古板思绪的动员,很众全力于晋升体系本能的优化都正在测试将内存侧的缓存的掷中率最大化。一个更高的掷中率能让人更好地应用缓存,进而被以为能带来更高本能的阐扬。
正在本论文中,咱们队这种古板的思绪举办了寻事,并提出了一个动态存取离散(Dynamic Access Partitioning)算法,也称DAP。它仙逝了缓存的掷中率,来应用主存储中未被应用的带宽。DAP 通过利用一个轻量的进修机制,只须要特地硬件的16个字节,便能正在内存侧缓存和主内存之间取得一个近似最优化的带宽。模仿的结果显示,正在一个片叠式(die-stacked)内存侧DRAM 缓存上采用DAP,能够取得13%的本能。咱们还外明了,DAP 正在分歧的完毕、带宽点和内存侧缓存的容量点上都能带来较大的本能上风,使得它对任何超越芯片上SRAM 缓存宗旨的、基于众相带宽资源确当下或者他日体系都是有价钱的。
但是,正在本届聚会中,另一篇被提名最佳论文的查究《Toward Pervasive and User Satisfactory CNN across GPU Microarchitectures》惹起了咱们的留神。这篇论文来自佛罗里达大学电子和打算机工程系的教学李涛和他的该校的同事。论文提出了 Pervasive CNN (P-CNN)——一个看重用户惬意度的CNN 推理框架。P-CNN 正在分歧的推理工作中能供应最佳的用户惬意度。

正在GPU 上加快卷积神经汇集平常蕴涵两个环节:练习和推理(Inference)。古板上,这两步收拾都正在含高端GPU设备的任事器中举办。台式机和手机GPU打算力的不竭增加,使得正在种种各样的平台长进行推理的兴会不竭地增加。与练习阶段所须要的高含糊量和高精度分歧,正在与推理联系的工作中,终端用户面对着更众样化的央求。
为了跟进这一新兴趋向,满意新的央求,咱们提出了 Pervasive CNN (P-CNN),这是一个看重用户惬意度的CNN 推理框架。P-CNN 有两个构成部门:跨平台离线编译(compilation)和运转岁月统制。遵循用户的需求,离线编译利用架构独立技艺,比方自适宜批收拾量巨细遴选(adaptive batch size selection )和协同微调(coordinated fine-tuning)来天生最佳内核(optimal kernel)。运转岁月统制阶段由切实率批改、履行和校正构成。起首,切实率批改会正在可承受的切实率下动态地确定最疾的内核。然后,运转岁月内核调动器会为每一层神经汇集分拨出最优的打算资源,调动GPU 线程。假若取得的切实率对付终端用户来说是不行承受的,校正阶段会遴选一个更慢不过越发切确的内核来晋升切实率。末了,咱们为 CNN 策画了一个用户惬意胸怀度目标,用于评估咱们的 Pervasive 策画。咱们的测试结果显示,P-CNN 正在分歧的推理工作中供应最佳的用户惬意度。

李涛是佛罗里达大学电子和打算机工程系的教学。他正在德克萨斯大学 取得打算机工程博士学位。他的查究兴会网罗打算机架构、微收拾器/回忆/存储体系策画、虚拟技艺、省俭型/可继续/可依赖数据核心、云/大数据打算平台、打算机讯息技艺与利用以及打算机体系的评估。

ASPLOS(编程说话和操作体系的编制组织增援聚会)是ACM创立的一个以编制组织为主题内容的众学科聚会,其查究界限超越硬件、编制组织、编译器、编程说话、操作体系、汇集和利用,更加合心这些学科间的交叉性查究课题。

AI 创业大赛由新智元与10 家主流 AI 创渔利构:蓝驰创投、红杉血本中邦基金、高瓴智成人工智能基金、蓝湖血本、蓝象血本、IDG血本、高榕血本、中信修投证券、明势血本、松禾远望基金联袂倡始,由新智元主办,北京市中合村科技园区统制委员会、中合村科技园区海淀园统制委员会增援,是一场会集了 AI 技艺党首和投资党首的嘉会。新智元向满怀弘愿的他日AI独角兽供应强盛的创投资源对接机遇,顶级风投 TS 等你来拿。
如有更众先容材料(比如BP等),可发送至,邮件题目请阐明公司名称。如有任何商讨题目,也迎接向该邮箱发信接洽。
| 联系人: | 王先生 |
|---|---|
| 电话: | 15640228768 |
| 微信: | 1735252255 |
| 地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255