发头条

fatoutiao.com 互联网运营专业指南

Home /
首发|首轮融资估值过亿,中科驭数用全新专用计算架构让芯片也能“私人订制”

首发|首轮融资估值过亿,中科驭数用全新专用计算架构让芯片也能“私人订制”

创业邦获悉,专注于领域专用计算架构研发的中科驭数宣布已于今年8月正式完成了千万级别的天使轮融资,估值超过一亿,由中科创星领投,久友资本跟投。本轮融资将主要用于产品研发、扩大团队规模等。

中科驭数的主要业务是为各类计算密集性的应用研发专用计算架构,包括芯片、支撑软件、SDK等,现阶段主要布局计算金融、人工智能、区块链三大领域。核心创始团队均出自中科院计算所、清华、北大等研究所或高校相关专业。现有团队20余人,其中博士11人,硕士7人,团队成员60%以上来自中科院、清华、北大,基本都为核心技术人员。

专用计算架构成为趋势

自因特尔创始人戈登摩尔于1965年提出“摩尔定律”以来,“芯片的运算性能大体上按照每18个月翻一番的速率在增长”已持续了半个世纪,但随着工艺不断细化到逼近一定的物理极限,单个处理器芯核的能效比提升面临着极大的困难。数据显示,近三年来,芯片晶体管密度的年化增长率仅为3.5%。

尽管半导体芯片“摩尔定律”已经接近尾声,但“数据摩尔定律”似乎才刚刚开始。据美国发布《2016-2045年新兴科技趋势》预测,全球数据量自2015年开始每两年翻一番。以人工智能、区块链、边缘计算技术等为代表的热门领域,其算力需求的不断增强随着应用领域的不断创新和数据的指数级增长,且硬件算力的提升已成为促进其发展最重要的因素之一。同时,VPU(视频处理器)、MPU(运动增强处理器)、APU(音频处理器)等大多与多媒体的编码解码相关的协处理器,面对不同行业的数据处理特点,越发暴露出力不从心和匹配不够。显然,摩尔定律放缓的“后摩尔时代”,依靠传统的通用计算已很难有效为继,而专用计算架构则将发挥出巨大的作用。

据中科驭数创始人兼CEO鄢贵海介绍,目前,面向专用计算的体系结构研究仍然处于“百花齐放”的时代,从探讨FPGA、ASIC等具体底层实现到ISA指令集扩展等软硬件架构等均有涉及。专用加速系统的设计方法也还远没有形成统一的定式。可以看到,近几年来几乎所有的互联网巨头们都在补充自己的标准服务器——CPU,以通用处理器结合特定应用加速的协处理器来共同处理海量数据。例如Microsoft利用FPGA来加速其旗下的Bing搜索引擎,Google研发的TPU来加速神经网络推理,阿里巴巴公司也有FPGA硬件的团队来针对具体的计算负载来做加速等等。然而面对应用的多样性和数据的复杂性,“高性能”和“通用性”却始终“不可兼得”。

为不同领域“私人定制”专属计算架构解决方案

为了高效解决特定领域的海量数据处理问题,中科驭数从底层核心技术出发,以专用芯片架构为核心,创新性地采用软件定义加速器的技术路线,实现软硬件协同的高效的解决方案。其原创技术KPUTM(即核处理器,已提交备案),是专为加速特定领域核心功能计算而设计的一种协处理器。 KPUTM以功能核作为基本单元,直接对应用中的计算密集性应用进行抽象和高层综合,实现以应用为中心的架构“定制”。一颗KPUTM根据需求可以集成数十至数百个功能核。

      核处理器KPUTM

在运行机制上,KPUTM采用“数据驱动并行计算”的架构,运行过程中通过数据流来激活不同的功能核进行相应计算。从而可以实现“功能核”到运算需求的“一对一”服务,保证效率。且不同于FPGA在电路层的改造的性能牺牲,KPUTM的核心技术在功能核层,功能核来自于对于计算模式的抽象,并将其IP化。通过高层次综合,既实现了领域内硬件的统一,降低了规模限制的硬件成本和设计周期,又能通过软件编程实现不同功能的计算;特定需求只需要增删功能核的种类和数量即可。在整体计算效率提升百倍的前提下,仍然具有非常高的可扩展性和灵活性。鄢贵海表示,KPUTM的技术路线的设计初衷,即是突破传统“性能”与“通用性”不可兼得的局限。

据悉,其产品将从今年11月陆续发布。其中国际首例金融时间序列分析专用芯片“功夫1800(CONFLUX 1800)”,性能比通用GPU高两个数量级,功耗小于10瓦;国际首套实时风控系统 “锐警-A1 (RiskCop-A1)”,全面提升交易市场的风控级别,推进“事后风控”向“事中风控”演进。数据表明,相对于CPU的服务器,中科驭数基于KPUTM的系统性能可以轻易提升2-3个数量级,同时功耗只占原系统的30%。如果将数十甚至数百台的服务器集群都用KPUTM加速器来增强,将是性能的极大提升和运行成本的显著降低。

CONFLUX-I(功夫1号)

未来,中科驭数将会根据行业需求,在高性能计算、基因测序、5G等领域,落地其相关的领域专用处理器。

发表评论

邮箱地址不会被公开。 必填项已用*标注