精简互联网,投身硬科技,这还是那个我们熟悉的字节吗?

7月21日,据界面新闻从字节跳动内部人士获悉,CEO梁汝波将个人OKR中的一项更新为“大幅降低2022—2023年招聘计划,降低组织规模增速,并提升组织效率。”

尽管字节跳动今年一再缩招,但其芯片团队却仍维持扩张之势。

自7月以来,字节跳动在招聘网站上发布多个芯片职位,包括SoC和Core的前端设计,模型能分析,验证,底层软件和驱动开发等。

在资质方面,字节对上述岗位提出熟悉RISC-V和ARM系统架构的要求,而在系统开发、验证两个岗位上,还有熟悉X86架构的要求。

多条线索都在表明字节跳动正加速推动自研AI芯片与服务器芯片的落地。7月20日,针对自研芯片一事,字节跳动副总裁杨震原回应称,目前公司无通用芯片商业计划,也没有涉足CPU、GPU等通用芯片业务。除了主要采购 X86 芯片,字节也和芯片供应商探索 RISC 架构芯片在云端的使用。

“虽然火山引擎目前市场比较小,但还是有这方面的需求。”一位业内人士向虎嗅表示,字节自研芯片将主要用于火山引擎的云业务上。

论自研芯片,字节跳动算是后知后觉的那一个。早在2010年,百度就率先迈出了第一步,组建团队开始尝试研发云端芯片,并于8年后发布了第一款AI芯片“昆仑”。同一年,阿里达摩院发布神经网络芯片Ali—NPU,腾讯领投AI芯片公司燧原科技的3.4亿元Pre-A轮融资。

但值得一提的是,在造芯这件事上,互联网大厂们保持了相当程度上的克制。一方面,国内高制程Foundary产能十分有限,如果一股脑地“All in”芯片设计,也存在着“图纸积压成山,市场一片难求”的风险。

另一方面,虽然专用芯片不像通用芯片那样需要繁琐的配套软件生态开发,但动辄十几亿的项目投入和两至三年的研发周期,即使强如BAT,也不得不在这一问题上慎之又慎。

只不过,当下围绕云计算的市场竞争,正在迫使大厂们放弃恪守的商业模式,走上自研芯片的道路。

大厂造芯,不得已为之

纸面上说得天花乱坠,不如“降价”二字来得实在。

围绕云计算市场的价格战,已经把大厂们折腾的筋疲力尽,但字节旗下的火山引擎作为2020年才上线的公司,想要从“三朵云”的口中抢食,还是需要扯起“价比”的大旗。

国内“大厂云”的营收大头仍在IaaS层,作为一项“互联网基础设施”,IaaS云服务算是不折不扣的重资产运营模式,其本质还是服务器资源的租赁,如何降低服务器的成本也就自然而然地成为这场价格战中参与者最关心的问题。

“行业内造芯的出发点都差不多,就是为了降本增效,尽管自研芯片的前期研发投入比较高,但在规模化投产后,单片成本一定比集中采购低。”一位同属互联网大厂芯片从业者向虎嗅做出这样的解释。

这其中的量价关系并不难理解,问题是前期投入要高多少?

我们可以算这样一笔账,首先说流片,根据业内目前的行情,14nm工艺芯片,流片一次需要300万美元左右,7nm工艺芯片,流片一次的价格直接飙升到3000万美元。这还是小版图的终端芯片价格,云端芯片的流片价格通常还要高出50%左右。

需要说明的是,即使是高通、AMD这样的老牌设计厂商也不敢保证第一次流片就成功。此前业内就有小米的澎湃S2芯片连续5次流片失败,最终设计团队直接重组的先例。

对于不熟悉Foundary体系的互联网厂商而言,所需要面临的不仅仅是成本问题,还有产能与交期问题。

这还只是流片一个环节,在正式流片之前还需完成产品定义、设计、验证模拟等一系列工作,从事芯片设计的李亚林告诉虎嗅,“以字节的体量来说,后续他们至少要维持一支千人以上的芯片团队,才能保证项目组的正常运转。”

另据“投资界”的报道,为了从海思、高通挖走骨干,字节跳动期开启了“三倍薪酬”的挖人模式,而此前,字节已经挖走了高通的资深芯片人士卢山。字节在芯片团队上付出的工资成本可想而知。

“短期来看,这是一笔怎么算都会赔本的帐。”上述业内人士对字节造芯做出了这样的判断。

尽管资金投入巨大,但眼下的字节跳动,或者说互联网大厂们的“造芯运动”其实是一件“不得不做”的事情。

“大家用的都是通用型处理器,过去可以借助芯片制程和软件优化实现最终效能的提升,但现在硬件厂靠摩尔定律升级这条路被严重放缓,软件又在开源浪潮的下被高度开发,要想继续提升效能就只能从最底层的专用芯片入手。”虎嗅资深分析师李赓解释道。

他所提到的专用芯片也可以泛指AI芯片,从技术路线上,FPGA、ASIC和ASSP甚至传统的GPU,都可以被归到此列当中。与通用处理器CPU相比,专用芯片具备更多的ALU(逻辑运算单元),虽然不能像CPU那样执行复杂的指令,但在简单指令上,算力要比CPU高得多。

因此,在定制处理器的态度上,云服务厂商也大多秉承着“赶早不赶晚”的原则。

何况在这个行业中,已经有亚马逊、谷歌等公司作为先行者,且收效颇丰。自2015年亚马逊收购Annapurna开启芯片自研之路以来,AWS已经先后历经百余次降价,成为业内不折不扣的“价格杀手”。

诚然,这与IaaS行业产品高度同质化下的竞争压力有关,但能打得起价格战的前提是,自研芯片对采购成本的大幅度降低。

回到字节造芯这件事上,火山引擎自2020年6月上市后,就打出了“极致价比”的招牌,在去年的一次采访中,火山引擎总经理谭待就曾表示,实现极致价比的方式就是“全栈自研、软硬一体”。

即使不考虑商用化的问题,就字节自身业务需求来看,由于头条、抖音等庞大业务也在火山引擎上,支撑这些业务的超过百万台服务器同样面临着巨大的成本压力,自研专用芯片可能不是一个最优方案,但至少是现阶段最可行的方案。

落地场景?我们自带

除了云业务的降本问题外,字节造芯可能还有基于应用场景的考量。

“过去行业内关注的重点都落在算力上,但现在基本没人在乎这个问题,因为算力普遍虚标,投资人更关注芯片有没有经过落地场景的评估。”一位资深业内人士向虎嗅表示。

杨震原在采访中也提到,“字节的自研芯片探索主要围绕自身视频推荐业务展开,研发团队将为字节大规模视频推荐服务专用场景定制硬件优化如视频编解码、云端推理加速等。”

具体来看,视频编解码很好理解,对数字视频进行压缩或者解压缩的过程。根据字节2020年披露的数据,在这一年抖音用户每天上传的短视频数量多达6000万条以及附带的PB级别的数据量,这对字节服务器的传输能力是个不小的考验。

传统的编解码技术大致分为两种,第一种是英特尔的VAC视觉计算加速卡,它的处理器内置了图形内核和硬件编码器,第二种是选择通用处理器和软件编码技术。

这两种编辑码技术用于处理一般数据量尚可,但面对海量数据时效费比并不乐观。谷歌对此的解决方案是,直接设计一个专门用于视频编解码的芯片Argos,据谷歌统计,搭载该芯片的VCU(video coding units)将会替换下数千万个英特尔至强处理器,字节未来规划的视频编解码芯片可能与之类似。

而“云端推理加速”更像是字节为深化“精准推荐”提前做出的准备。

这里我们以抖音为例,相信大多数从业者都能认同,抖音的推荐质量代表着字节系,乃至国内互联网推荐算法能力的最高水

但这套推荐算法在抖音日渐臃肿的业务线下已开始“力不从心”。比如仅在抖音的“同城”入口下,就进一步细化为美食、休闲、游玩等等多个二级入口,如何维持短视频与本地生活、直播带货的高效联动,成为抖音当下需要面对的问题。

AI推理芯片的应用场景则很适用于抖音复杂的视频推荐机制。“AI推理芯片可以针对算法进行特殊优化,比如加强视频结构化分析。”一位智能云服务器从业人士告诉虎嗅,AI推理芯片的应用可以极大提升结构化数据库的响应能力。

当然,依靠视频解码算力配合AI推理算力实现计算加速,并非是抖音一家的专利。早在2018年,快手就领投了专注AI视觉芯片研发的博瀚半导体,这家公司在去年也不负快手所望,拿出了云端推理AI芯片。

相较于手机公司在ISP、电源管理芯片、NPU等相对“边缘化”芯片徘徊的现状不同,互联网大厂拥有着复杂的、且需要深度定制的场景需求,这些需求也促使大厂们不得不走出舒适圈,亲自下场造芯。

“硬件门外汉”的挑战

对于自研芯片这件事,字节似乎有着更大的野心,但在执行中却谨小慎微。

自去年9月开始,字节接连投资了睿思芯科、希姆计算、摩尔线程、云脉芯联、润石科技、光舟半导体等一众芯片厂商。

有些投资能够直接反映出字节在造芯上的布局,比如睿思芯科,这家公司本身就是研发基于RISC-V指令集芯片的独角兽。还有一些公司与字节的主业无关,比如开发衍射光学芯片的光舟半导体,这类芯片目前最主流的应用场景就是VR头显设备,这显然是字节在为Pico规划未来。

但截至目前,字节尚未收购任何一家芯片公司。

其中的原因不难猜测,在字节上市之前,他们有充足的理由去缩减风险较高的扩张项目,而长久以来,字节也禁止那些被投资企业打着“字节系”的名号进入市场,以规避“尾大不掉”的帽子。

可问题是,在没有任何相关从业经验,东拼西凑地组建一支团队去造芯,而且还是最底层的云端AI芯片做起,这事能成吗?

亚马逊的大神工程师James Hamilton在提出“做基于ARM架构的数据中心芯片后”的想法后,亚马逊随即收购了以色列的初创公司Annapurna Labs,并在两年后推出了第一颗自研芯片。

无独有偶,在阿里巴巴芯片项目上马之初,也是先全资收购了CPU IP Core公司中天微,后来才有了“头哥”的成立。

亚马逊和阿里大费周章地“先收购,后立项”是多此一举吗?显然不是。虽然芯片设计在工艺上没有Foundary那样繁琐,但在产品开发流程的复杂程度上完全不输于后者。

在一个完整芯片设计团队中,至少要包含四个二级团队,市场团队进行前期需求分析、架构团队负责架构设计、设计团队负责逻辑设计、实现团队完成物理实现,这还不包括验证仿真和原型验证等众多子项目。

“在物理实现阶段,如果有一步不能满足之前的要求,都要重复之前的过程,因此一般公司在操作大项目时,往往都会有多个版本的项目组同步进行,但对于没有长时间磨合的团队而言,设计、修改、论证反复循环的过程,会消耗掉大量的资金和时间成本。”在资深从业者李亚林看来,临时搭建“草台班子”的办法在芯片行业内绝非长久之计。

更重要的是,字节跳动这家公司此前几乎没有任何硬件开发经验,为数不多的如两年前面向教辅市场推出的“大力神灯”,其技术和供应链管理难度相较于芯片设计有着云泥之别。

而如今大步迈入芯片行业的字节跳动,在没有芯片公司班底且缺乏硬件开发经验的背景下,可能将面对前所未有的挑战。

推荐内容