趋动科技王鲲:让每一块GPU发挥极致价值

上证报中国证券网讯(记者 窦世平)“国内很多用户的GPU利用率低于15%,有相当一部分低于10%,即便是AWS云上的GPU用户,利用率也仅在10%至30%之间。”趋动科技创始人兼CEO王鲲近日在接受上海证券报记者专访时,给出了这样一组数据。他说,这意味着“花几百万买的服务器、花上亿建设的算力中心,很多时候只发挥出了10%的能力,90%都是浪费的”。
正是这一产业痛点催生了趋动科技的创业方向。2019年1月成立以来,这家公司专注于研发GPU池化软件,核心目标是提高算力利用率,降低用户的算力相关成本。王鲲表示,AI产业的发展终将从“make it work”“make it perform”走向“make it cheap”,而趋动科技要做的,就是加速“make it cheap”的进程。
抓住算力浪费背后的机会
王鲲本硕博均毕业于中国科学技术大学计算机系,博士毕业后先后在IBM、微软和Dell EMC工作,创业前担任Dell EMC中国研究院院长。他的两位搭档也出身IBM和Dell EMC,均为博士,有长期技术研发合作经历。
据他回忆,2019年英伟达还远没有今天这么火,从市值的角度看,英伟达当时大约只有英特尔的一半。但团队看到了三个明确趋势:一是AI势不可挡,其本质是新一次工业革命,会提高人类的劳动生产率;二是AI背后是算力,算力需求会持续高速增长;三是产业发展会经历“make it work、make it perform、make it cheap”三个阶段,成本是产业发展的关键。王鲲表示,AI产业的核心成本就是人才成本和算力成本,“趋动科技要做的事情就是make it cheap,降低用户算力相关成本”。
与英伟达通过提升芯片性能降低单位算力成本的路径不同,趋动科技选择从利用率入手。王鲲用会议室的比喻来解释空间维度的浪费和时间维度的浪费:会议室能坐20个人但只来10个,是空间维度的浪费;团队能坐满会议室,但上午开会下午不来却独占会议室,是时间维度的浪费。如果清楚大家的习惯、动态调配,“10个会议室可以当30个用,同时能让每个团队都以为拥有独享会议室”。
但让用户无感地从物理GPU切换到虚拟GPU,技术门槛极高。王鲲介绍,从CUDA 9.0到13.x版本,API总量超过3万个。即便支持了27000个,看起来做了90%,但对用户来说软件还是0分,因为在用户看来,能用是100分,不能用就是0分。团队从2016年开始做GPU池化,创业后又花了三年才把软件打磨到理想的状态。“互联网应用可以在上线时只有几个页面,剩下的挂‘敬请期待’,但我们这个软件不行,必须做到非常完备才能交付客户使用。”王鲲说。
构建独立第三方的生态位
趋动科技的软件是标品。王鲲表示,卖给银行的趋动产品,和卖给券商、运营商或者互联网公司的是完全相同的产品,这种标准化产品的毛利润率非常可观。
公司的业务分为三类:第一类,把软件卖给有GPU硬件的企业,如央国企和金融机构等,帮助企业把物理GPU变成虚拟GPU资源池,原来只能服务10个业务团队,现在可以服务20个、30个甚至更多;第二类,以自有品牌“趋动云”出租虚拟算力,以数百张GPU卡服务近20万注册用户和近万活跃用户,超卖比能达到2到5倍;第三类,为做算力租赁的合作伙伴提供软件赋能,帮助他们超卖后按营收或毛利分成。
王鲲将传统算力租赁与趋动科技的模式做了对比。传统租赁是纯硬件出租,价格透明、同质化竞争,承租方不用时别人没法用,所有成本全部由承租方承担。而趋动科技的虚拟算力租赁,租给用户的不是物理卡,而是虚拟卡,用户不用时别人可以复用。“我们给用户更低的价格,同时出租方却挣得更多。”他说。
当被问及和芯片厂商是否构成竞争,王鲲的答案是,从商业利益看,芯片厂商肯定希望客户只用自家的芯片,但是客户出于采购多元化的考虑,往往会选用多家国产芯片。“我们和芯片厂商不是竞争关系。作为独立第三方,我们会站在客户角度,支持客户选用的各家国产芯片。”王鲲说。
押注算力爆发需求
对于当前的Token经济,王鲲认为需求“真实且广阔”,但单纯卖Token难以获得超额利润。大家拿的很可能是相同的开源模型和相同的硬件,同质化严重。趋动科技的机会在于帮助Token服务商实现“挣两遍钱”,在卖Token的同时,通过软件把闲置算力复用给其他客户。
对于算力基础设施的终局,王鲲认为,任何信息的传输速度都不会超过光速,不可能存在一个算力工厂服务全国。未来将是区域性大型数据中心与边缘节点共存的格局,趋动科技的模式更像电网而非电厂,电网的价值比电厂要高很多。他将趋动科技的商业模式概括为算力抽成:只要算力硬件通过跑趋动的软件提高了效率,趋动就能收钱。
谈及国产芯片,王鲲表示,单卡性能差距可能在五年以内,但生态差距要长得多。但他也指出,在应用层、服务层做文章,绕开底层生态的直接对抗,是国产芯片的现实机会。
