LuminousComputing将其未来押注在硅光技术上,作为人工智能(AI)超级计算机的推动者
硅光技术现在已经足够成熟,可以用来设计完整的系统。
MichaelHochberg如是说,他已经支持了包括Luxtera和Elenion在内的四家初创企业,他们的产品使用了这项技术。Hochberg还与LukasChrostowski(不列颠哥伦比亚大学教授)合著了一本关于硅基光电子学设计的书。
(MichaelHochberg:纽约曼哈顿Coriant先进架构与战略总监,在不列颠哥伦比亚大学担任访问学者,曾任OpSIS晶圆代工厂服务总监,于年荣获美国青年科学家总统奖)
在硅光技术的第一阶段,从年到年,人们甚至怀疑他们是否能使用该技术进行设计。
Hochberg说:“几乎所有正在做的事情都必须适应现有的接口,该接口可以由其他材料系统提供服务。”
十年后,更多的情况是,不使用硅光技术就无法提供接口。他说:“硅光技术已经主导了每一个重要的收发器垂直领域:内部数据中心、数据中心互连、地铁和长途运输。”
Hochberg说,现在人们已经开始使用硅光技术来押注他们的系统,并列举了激光雷达、量子光学、共同封装光学和生物传感等例子。
几个月前,Hochberg加入了LuminousComputing担任总裁,该公司在A轮融资1.05亿美元后,最近走出了隐身模式。
Luminous将其未来押在了硅光上,作为人工智能(AI)超级计算机的推动者,它认为该计算机的性能将大大超过现有平台。
机器学习
Hochberg说,人工智能的愿景是将过去完全属于人类思维领域的任务,大规模地加以自动化。
就在过去十年里,人工智能界已经从使用机器学习(ML)做对人类来说微不足道的事情,发展到只有最杰出的专家才能完成的任务。
“我们已经达到了机器学习能力在许多方面都超越人类的地步,”Hochberg说。“他们能产出比人类更好的量化结果。”
但是取得这样的机器学习进展需要大量的数据和硬件。
“最先进的推荐引擎和自然语言模型的训练运行需要数万到数十万个GPU(图形处理单元),它们的运行时间从几个月到几年不等,”Hochberg说。
此外,与机器学习训练相关的计算需求并不像摩尔定律那样每18个月翻一番,而是每3-4个月翻一番。“对于内存需求,它甚至更快。”他说。这意味着,做这种训练运行的上限是完整的数据中心。
LuminousComputing希望开发出能够快速、简单扩展的AI硬件,而其中的一个关键因素是使用硅光技术来互联硬件。
Hochberg说:“扩大大型集群的主要挑战之一是,在CPU和内存之间有一种总线,在CPU和GPU之间有另一种总线,盒子里的GPU之间有另一种总线,盒子之间还有另一种总线——Infiniband。”
这些连接层以不同的速度和延迟运行,使规模化编程变得复杂。这样的系统也导致像GPU这样昂贵的硬件没有得到充分的利用。
“我们正在做的是在这个问题上投入大量的光学互连,我们正在围绕这个光学互连构建系统,”Hochberg说。使用足够的互连将使计算能够扩展并简化软件,“使用我们的系统将很简单,因为如果您需要内存中的任何内容,您只需去获取它,因为有可用的带宽。”
超级计算方法
Luminous还没有准备好展示其超级计算机架构。但该公司表示,它是垂直整合的,并且正在设计包括处理和互连在内的完整系统。
当该公司在年成立时,它计划使用光子处理器作为计算的基础,但它可以解决的这类问题被认为影响力不够。
随后,该公司转而开发一套围绕光学元件性能设计的ASIC。而正是这些光学器件重新架构了数据在超级计算机内的移动方式。
“这就是你获得数量级优势的地方,”Hochberg说。
该架构将处理通常由超大规模承担的各种AI任务。“如果我们能让他们运行比现在更大的模型,同时使用更小的编程团队,那将产生巨大的经济影响,”他说。
Hochberg还指出,许多组织希望在市场中使用机器学习,“他们希望有能力在非常大的数据集上进行训练,但他们没有一个庞大的分布式系统工程团队来弄清楚如何将东西扩展到大尺寸的GPU上;这就是我们想要帮助的市场。”
Luminous系统的潜在客户非常热衷于获得此类技术,以至于他们正在帮助Luminous。“这是我在光收发器领域没有经历过的事情,”Hochberg打趣道。
Luminous表示,超级计算机将是模块化的,但是它最小的模块将比一个承载8或16个GPU的平台具有更大的处理能力。
硅光技术
Luminous对使用硅光技术来实现其系统充满信心,尽管该设计将推进硅光技术迄今为止的应用方式。
“你总是在这个领域打赌,你可以做一些比其他人做的更复杂的事情,因为你将在几年后发布你的产品,”Hochberg说
Luminous之所以有信心,是因为其设计团队的经验、开发的设计工具以及对先进制造工艺的理解。
Hochberg说:“我们有懂得如何应对复杂事物的员工”
状态
Luminous的员工目前约有人,比去年翻了一番。到年底将再次翻一番。
该公司正忙于建模工作,以了解机器学习算法将如何在其系统上运行。“不仅是今天的模型,还有明天的模型,”Hochberg说。
与此同时,到年交付第一批硬件还有大量工作要做。
“我们有一堆庞大复杂的芯片需要构建,我们有软件需要在芯片之上运行,所有这些都必须整合在一起,发挥作用,”Hochberg总结道。
(参考如下文章并翻译整理,如有侵权请联系处理: