硅基流动是一家专注于通用人工智能(AGI)基础设施的企业,以下是关于它的介绍1:
- 成立时间:2023 年 8 月 29 日正式成立。
- 创始人:袁进辉,本科毕业于西安电子科技大学,2003 年考入清华大学计算机系,是前 OneFlow(一流科技)创始人及 CEO,曾任微软亚洲研究院主管研究员。
- 融资情况:2024 年 1 月完成 5000 万元天使轮融资。2024 年 7 月完成近亿元天使 + 轮融资。2024 年底完成亿元人民币 Pre-A 轮融资,投后估值达 2 亿美元。
- 公司定位:定位于大模型时代的 AI 基础设施(AI Infra)层,专注于通过算法、系统与硬件的协同创新,降低 AI 应用的开发和使用门槛,连接着上层的 AI 应用层与下层的算力芯片层,为 AI 模型的训练与推理提供必要的软件技术设施。
- SiliconCloud 一站式大模型 API 云服务平台
- 模型资源丰富:集成阿里通义大模型 Qwen2、智谱 AI 的 GLM-4、幻方量化的 DeepSeek V2 系列开源模型,以及文生图模型 SDXL、SDXL Lightning 等众多主流模型。
- 降低开发成本:开发者无需自建服务,可直接享用高性能模型 API,如调用文生图模型 Stable Diffusion 能 1 秒出图,调用 DeepSeek V2 响应速度可达 50Tokens/s。
- 统一接入便捷:通过统一接入多厂家 API,一个 key 配置一次即可使用多个模型,提高开发效率。
- SiliconLLM 大语言模型推理引擎
- 超快速度:对内核、框架、机制和模型进行协同优化,实现最佳推理速度。
- 超级扩展:创新通信优化,可高效扩展到多机多卡场景。
- 超级易用:无需额外转换或编译,即可无缝使用各类开源模型,支持国内外主流芯片部署,实现了最高 10 倍的性能提升。
- OneDiff 高性能文生图 / 视频加速库
- 速度优势明显:全球范围内率先实现 Stable Diffusion 模型 1 秒出图,性能提升高达 3 倍。
- 功能丰富多样:可快速切换 LoRA,ControlNet,并适应任意形状的推理,具有快速加载优化实例等特点,能有效降低显存使用。