.

珠海诞生的GPGPU新势力清华系芯片老

作者

程茜编辑

Panken

蛰伏六年后,这家清华系AI芯片创企终于开始在国产GPGPU江湖高频出场。

今年4月,国内首款基于可重构架构的GPGPU芯片RPP-R8亮相,现已小规模量产。其背后的珠海GPU芯片创企芯动力,就此浮出水面。

▲芯动力GPGPU芯片RPP-R8

芯动力创始人、CEO李原是一位芯片连续创业者。他年本科毕业于清华大学物理系,随后任职于英特尔、德州仪器等芯片巨头。在英特尔任职期间,他曾开发至强CPU服务器系统,拥有从产品定义、量产到商用的全链条经验。

从德州仪器辞职后,李原年在美国加州创立IPGCommunications,承接通讯基站大型芯片设计项目。IPG独创的Turbo译码器被英特尔应用于其至强处理器。这家公司后来被美国老牌通信芯片商敏讯科技(MindSpeed)收购,敏讯科技的无线业务又在年被英特尔收购。

就在英伟达提出GPGPU新概念的前后脚,李原也开始琢磨类似的思路,即如何在发挥GPU并行计算能力和通用性优势的同时,通过引入其他类架构的长处,研发出能更好平衡性能、功耗、成本、延迟、部署速度的硬件。从年到年,经过长达六年的摸索,他们团队独创了一个将NPU的高效率与GPU的高通用性相结合的创新架构——可重构并行处理器架构(RPP)。

他为何早早选择进入GPGPU赛道创业?又如何组建团队,将芯动力RPP架构从图纸中的创新设想,变成了在实际应用场景中发挥价值的硬件?在这外部环境复杂多变的五年之间,他对AI芯片及GPU行业的发展脉络与方向有哪些新的感悟与思考?近日,芯东西与这位国内GPGPU领域的创业代表人物进行了深入交流。

插播一则会议预告。9月14-15日,全球AI芯片峰会将在深圳举行。清华大学魏少军教授领衔近50位演讲嘉宾,NVIDIA与AMD齐聚,15+国产AI芯片企业届时将登台交锋,国内边缘计算AI芯片代表公司亮相。珠海芯动力创始人、CEO李原将在AI芯片架构创新专场,发布主题为《RPP芯片架构给AI芯片带来的发展前景及机遇》的演讲。欢迎扫码报名~

一、清华物理系校友创业,已在半导体领域深耕19年

创立芯动力之际,李原早已是一位入局半导体行业19年之久的资深老兵。

年,他从清华大学物理系本科毕业后,接连远赴日本、加拿大进修无线通信专业。年,李原入职德州仪器,主攻通讯系统研发,在这里,他和芯动力的另一位联合创始人、当时已是德州仪器资深硬件工程师的朱建斌相识,这为多年后芯动力核心团队的组建奠定了基础。

当李原第一次筹备创业期间,朱建斌主动提出要转到芯片设计行业,并要从一位硬件工程师跨界成算法工程师,这令李原感到“有点不可思议”。朱建斌很快凭借其出色的学习能力、抗压能力证明了自己,李原的创业团队也组建就绪。

年,李原、朱建斌以及几位来自德州仪器的同事共同创业,在美国加州创办了一家无线通信芯片公司IPGCommunications。

他们的初始目标很简单,先靠创业生存下来,再换个视角观察整个半导体行业。IPG创立后不久就承接设计了休斯顿卫星GlobalStar系统的通讯芯片,自研的Turbo译码器被英特尔应用至其至强处理器,随后在年顺利被美国老牌通信芯片商敏讯科技(MindSpeed)收购。

▲芯动力发展历程

这一次创业,也让李原对半导体产业的认识更加深刻,他们发现几个特点:

半导体行业产业链绵长,芯片设计公司就是其中的灵魂。

半导体行业全球竞争激烈,中小规模的公司不停被兼并、收购,很多从业人士被迫改行。李原的观点是,不能这样,“我们要逆流而上,要去看一看不同的风景”。

竞争激烈的行业共识后,他们还意识到,一旦在半导体行业里处于领先地位,企业就能获得巨大市场。最后可能形成第一家公司供应产品,第二家公司艰难竞争,第三家公司基本不存在的现象。

因此,第二次创业,李原和团队的目标就是:“我们应该成为一家什么样的公司才有可能存活下来。”

年,他们把各种各样不同种类的芯片摆到一张图上,他们发现其中有一个很大的空缺,在常见的CPU、GPU、DSP,以及专用的通信芯片之外,还有一类芯片的位置空缺,未被发现。

在这个空白处画下的大大的问号,成为芯动力创立的起点。经过5年的探索,年他们找到了答案——可重构并行处理器架构。基于这一创新架构,李原等人先是在美国成立了公司,年转回国内,在珠海创立芯动力公司。

二、研发“六边形战士”处理器,已实现千片级小规模量产

芯动力刚刚成立,李原曾问过朱建斌一个问题:什么样的节点代表他们做的事情成功了?朱建斌的答案是:“我们只要把这颗芯片真的做出来,达到了我们预期的性能指标。”

今年他们迎来了这一时刻。4月,芯动力发布首款基于可重构架构的GPGPU芯片RPP-R8。

RPP-R8每颗芯片内含有个计算核,相比传统GPU架构在同样的算力占用更小的芯片面积,实现了低功耗和高能效的有效平衡。RPP-R8除了具备专用芯片所没有的通用编程性,面积效率比可达到同类产品的7~10倍,能效比也超过3倍,可满足高效并行计算及AI计算应用。

▲GPU和RPP架构性能比较

这颗芯片于年一次性流片成功,李原透露,RPP-R8目前实现上千片级小规模量产,并且已经进行大规模测试,之后他们会根据客户反馈进行产品修正,再继续下一个产品研发。

事实上,基于RPP架构的芯片成果做出来,在成立时的他们看来是不可能的事情。

这背后的原因可以先从现在的三大GPGPU技术流派来看,第一类较多公司采用的是在比较成熟的GPU架构之上,构建矩阵计算的能力;第二类是纯粹基于可重构技术来做;第三类是将可重构技术与GPU编程模型CUDA语言相结合。

芯动力选择的即是第三类。李原解释说,主要有两大技术原因,首先选择可重构技术是因为,采用传统GPU架构很难追齐行业头部玩家,因此他们需要寻找更好的技术;其次,与CUDA语言相结合是因为其可扩展且广为行业所接受。

走一条全新的路径,也意味着他们一定程度上需要从0开始。李原谈道,最难的地方就在于,不仅要创新,还要达到市场的需求。

RPP架构是针对并行计算设计的芯片架构,芯动力将其称作“六边形战士”。这一架构既结合了NPU的高效率与GPU的高通用性优势,还支持实时操作系统(RTOS),具备DSP的低延时,可满足高效并行计算及AI计算应用,大大提高了系统的实时性和响应速度。

芯动力同样制程下的GPGPU芯片,与英伟达相比,在一些场景下性能提高达50%,且面积为类似芯片的1/7,功耗仅为其1/2-1/3。

这背后离不开芯动力的研发团队,其核心成员有平均年限超过15年的资深半导体从业背景,且均来自英特尔、高通、德州仪器、联发科等半导体知名企业,研发人员占比超过80%。

时至今日,当李原再次问到什么是最大的成功时,朱建斌已经忘记了当初的说法,他的回答变成了:“我们把它在商业上做到成功,我们把这个事情变成一个客户喜欢的商品,这样才是真的成功。”

三、第一家客户是银行,率先落地三大应用场景

李原也一直在为做“客户喜欢的商品”而努力。

芯动力GPGPU芯片的第一家客户是一家银行。李原认为,芯片行业周期长,因此芯片设计必须按照产品需求来设计,否则芯片公司拿出的产品很容易因市场需求变化而被淘汰。

因此年以后,芯动力团队花了很长一段时间进行市场调研,调研结果与这家银行的需求不谋而合。银行希望将智能摄像头的“智能”和“摄像头”区分开,边缘算力盒子可以独立于摄像头进行升级迭代。

李原谈道,这也是他们与同类企业在市场策略上的不同之处——更加强调对于客户需求的分析。

在这个过程中,他们将客户分为三层,终端用户、软件集成商、硬件集成商。其中,


转载请注明:http://www.abachildren.com/xgyy/6270.html

  • 上一篇文章:
  • 下一篇文章: 没有了