跳动百科

字节跳动推出 AIBrix:全新开源推理系统专为大语言模型设计

蔡希堂   来源:网易

字节跳动推出AIBrix:全新开源推理系统专为大语言模型设计

字节跳动近日宣布推出AIBrix,一个专为大规模语言模型(LLM)推理设计的全新开源推理系统。AIBrix作为一个可扩展且经济高效的vLLM控制平面,直击生产化部署中的路由、弹性伸缩与容错难题。

该系统提供高密度LoRA管理、LLM网关与路由、定制化自动扩展器等功能,旨在优化大语言模型的部署、管理和扩展能力。AIBrix通过云原生解决方案,深度适配企业级需求,确保用户享受高效服务。

作为首个深度集成vLLM的Kubernetes全栈方案,AIBrix已实现90%资源利用率提升与30%推理成本下降,并已支撑字节内部多业务场景验证。谷歌GKE、Anyscale等行业巨头也对AIBrix表示了推荐和支持。

字节跳动的AIBrix团队表示,将持续通过技术演进和优化,为构建可扩展的推理基础设施提供坚实支撑。