深鉴科技:技术无边 深有所鉴

2018-04-17 10:39:26来源: 创新创业中关村 作者:

前不久闭幕的世界互联网大会上,马云、马化腾、李彦宏以及苹果CEO库克等一大批行业大佬都不约而同的提到了一件事,就是AI人工智能!

其实不论是从国内的BAT亦或者是苹果、谷歌等国际企业,各大巨头已经将人工智能视为未来发展的重中之重。未来人工智能必将向市场化落地发展。

在已经来临的人工智能“红利期”,不仅是国内外的巨头企业,国内的很多初创型企业也选择了人工智能平台“一展身手”,其中深鉴科技就是其中的佼佼者。深鉴科技联合创始人&CEO姚颂介绍说,技术无边,深鉴科技要深有所鉴,争做深度学习解决方案平台引领者。

   国内良好的发展前景 促成“不安分”的创业想法 

作为一名90后的创业者,姚颂的过往经历“十分耀眼”。作为清华大学电子系的高材生、斯坦福大学电子系统访问学者,姚颂入选福布斯2017年度亚洲30位30岁以下青年才俊排行榜。组建的深鉴科技公司成立仅两年估值就已超过数亿美元。

当问及创业最大的初心时,姚颂表示:大学期间多次出国交流学习的机会逐渐改变了他的想法。那时,很多学长学姐毕业后选择了出国就业,但是由于文化方面的差异,大多数很优秀的前辈在国外企业里的上升空间都遇到了瓶颈,个人事业发展受到了极大限制。

深鉴科技联合创始人&CEO-姚颂

而放眼国内,却大不相同!在大众创业、万众创新的时代背景下,我国政府为广大创业人士提供了良好的政策支持。另外,近些年人工智能领域兴起已是不争的事实,随着算法框架、硬件技术日新月异地进步,今后在各种生活场景中都可以依赖深度学习、人工智能进行支持。这足以证明人工智能未来的应用前景非常广阔,加之大学期间一直从事这方面的研究。姚颂说:在权衡了种种利弊之后终于选择了创业。

先进的技术 “全明星”的团队 让一切皆有可能

如果说姚颂的过往经历已经足够“耀眼”的话,那短短一年内完成A轮以及A+融资的深鉴科技发展速度只能用“开挂”来形容了。在今年年初时,深鉴科技对外宣布,获得来自赛思灵与联发科共同领投的数千万级A轮融资。而仅仅相隔数月之后,10月24日深鉴科技再次宣布,已经完成了三星风投与蚂蚁金服领投的约4000万美元A+轮融资。

问及是什么原因使得公司频频受到资本市场认可,并在一年内完成两轮融资时,姚颂告诉记者:深鉴科技曾在NIPS、ICLR、FPGA、ISCA等国际顶尖学术会议上发表了一系列研究论文,并在ICLR 2016与FPGA 2017这两个全球最顶尖的深度学习与硬件开发学术交流会上获得了最佳论文奖。因此,资本市场最先认可的就是我们的技术。

而深鉴科技的团队真可谓是“全明星阵容”,其创始团队全部是由来自斯坦福大学与清华大学的深度学习硬件加速研究者组建而成。其中,联合创始人&CTO单羿作为前百度前百度IDL异构计算方向创始成员,曾入选过IBM PhD Fellowship(IBM博士英才计划)项目。

联合创始人韩松在2016年世界顶级深度学习会议ICLR上,以一篇Deep Compression(深度神经网络压缩)论文与AlphaGo的开发者——谷歌DeepMind共同活动了最佳论文奖,同时因为其很高的研究造诣,韩松将于2018年任职MIT(麻省理工)助理教授。

另一位联合创人汪玉是清华电子系副教授,国家自然科学基金“优青”获得者,清华大学教改以来首批终身教授,汪玉从2006年就已经开始研究FPGA,并且是现任ACM FPGA技术委员会亚太地区唯一成员。

与此同时,深鉴科技在成立之初还吸引到了来自百度、360、华为、风河、Intel、Nokia等公司在内的大批行业精英,使得整个团队在具有国际学术影响力的同时又具备了资深的工业经验。

从GPU到FPGA 到底到底孰强孰弱?

谈到深度学习、人工智能领域发展现状时,姚颂告诉记者:从应用场景中看,所谓深度学习应分为训练和推理两部分,而深鉴科技主要解决的是后者-推理问题。就目前市场上很多企业的深度学习技术,都过度依赖于强大的GPU硬件。

的确,擅长训练的GPU不仅具备强大的并行处理能力,而且还具备控制数据流量和数据存储的能力。另外,GPU可以让神经网络训练的速度大幅度提升,将原本需要数周甚至数月的训练时间缩短为数天。

但是GPU也并非完美无瑕,首当其冲的就是功耗问题。通常情况下,一块GPU功耗动约为100W、200W左右,有时甚至更大。因此,姚颂以及深鉴科技其他几位联合创始人在创业之初就意识到,目前被深度学习算法领域被广泛应用的GPU,根本无法在应用层级同时满足低功耗、高性能的需求。

除了GPU以外,目前另一项主流技术就属FPGA了。和传统的GPU相比,FPGA平台的功耗更小,整体性价比也更为出色,更适用于多种应用场景。更为重要的一点,鉴于深度学习尚处于一门发展中的技术,FPGA可以通过重新匹配逻辑资源、编辑不同配置的文件进行设置,最终获得完美的解决方案。因此FPGA的灵活性优势也是GPU所不具备的。

虽然FPGA平台有着种种优势,但市场对于这项技术的接受度却不高。究其主要原因是FPGA在开发时需要使用硬件描述语言,而不是传统计算机C语言。技术人员需要在原有的编译基础上进行二次开发,这对于技术开发难度来说无疑于提高了门槛。

三种应用平台 深鉴要做深度学习解决方案提供者

正是基于此种现状,深鉴科技在业界率先提出了DPU这一理念。所谓DPU既深度学习处理器,其精髓就在于使用了深度压缩技术。这项技术不仅可以将神经网络压缩数十倍而不影响精度,还可以使用芯片存储深度学习算法模型,减少内存读取次数,大大降低运行功耗。

与此同时,基于优化协同性,深度压缩技术对于硬件本身也提出了新的要求。为此,深鉴科技推出了两种用于深度学习处理器的底层架构——亚里士多德架构和笛卡尔架构,以及面向DPU的深度神经网络开发工具包DNNDK。

姚颂告诉记者,亚里士多德架构支持主流卷积神经网络的实时处理,针对神经网络算法计算量大、并发度高、数据吞吐量大的特点,定制化的设计了高效计算阵列和灵活的数据流量控制能力。同时为了支持不同应用方向的算法,亚里士多德架构还具备易于扩展的能力。最终实现了加速比与通用性、功耗和性能的优化和平衡,能够为用户在多种平台上提供高性能、低功耗、高性价比的解决方案。

而专为处理DNN、RNN(深度神经网络算法、循环神经网络)而设计的笛卡尔架构可以对结构压缩后的稀疏神经网络进行高效的硬件加速。与NVIDIA Titan X GPU相比,应用笛卡尔架构的处理器在运算速度上提升了13倍,能效比提升了3000倍。

DNNDK则是深鉴科技面向人工智能异构计算平台DPU自主研发的具备深度学习能力的网络开发工具包。它涵盖了神经网络推理阶段模型压缩、编译优化和高效运行时支持各种功能需求的能力。与此同时,DNNDK能够极大程度上降低DPU平台深度学习应用开发门槛,大大缩短算法部署到硬件的周期,全面提升人工智能产品的研发速度。

 利用优势资源 一步一个脚印地发展

尽管深鉴科技拥有丰厚的技术资本,但在姚颂看来:技术优势并不能直接转化为商业优势,技术带来更多的是某种身位上的契机。而对于一家成熟的企业来讲,有技术不是万能的,关键是在于技术如何转化成产品,最终变为市场占有率。所以未来公司发展最重要的就是将技术尽快落实到稳定成熟的产品之中,最终实现商业落地。

姚颂介绍说:利用本年度的两轮融资,深鉴科技将继续用于安防、数据中心以及后续芯片的开发工作。随着蚂蚁金服的战略资源入驻,将大大帮助深鉴开拓金融领域的应用场景;深鉴与三星未来也将展开包括存储设备、多媒体在内的多方面合作。而早些时候赛思灵与联发科领投的A轮融资,将助力深鉴科技今后开展智能手机芯片等领域的研发工作,同时挖掘潜在的客户资源并为今后海外市场的开拓打下良好基础。

从1956人工智能概念被提出以来,经历60多年的发展,这项技术前后经历了多次跌宕起伏。随着AlphaGo打败李世石这样的典型案例出现,无论是各国政府还是资本市场,都将人工智能视为今后发展的战略中心。我国更是提出了要将人工智能与传统行业进行深度融合,这为深鉴科技等一大批企业提供了极好的发展空间。更为重要的是,“大众创业万众创新”的新时代也为广大创业者提供了良好的发展平台。

姚颂展望:深鉴科技将继续依托技术优势,沉下心来把产品做好,着力布局全国市场,让更多的人能够体验到人工智能所带来的变革。

加载更多>>
责任编辑:韩凤鸣