硅基流动

硅基流动是一家专注于通用人工智能（AGI）基础设施的企业，以下是关于它的介绍1：

成立时间：2023 年 8 月 29 日正式成立。
创始人：袁进辉，本科毕业于西安电子科技大学，2003 年考入清华大学计算机系，是前 OneFlow（一流科技）创始人及 CEO，曾任微软亚洲研究院主管研究员。
融资情况：2024 年 1 月完成 5000 万元天使轮融资。2024 年 7 月完成近亿元天使 + 轮融资。2024 年底完成亿元人民币 Pre-A 轮融资，投后估值达 2 亿美元。
公司定位：定位于大模型时代的 AI 基础设施（AI Infra）层，专注于通过算法、系统与硬件的协同创新，降低 AI 应用的开发和使用门槛，连接着上层的 AI 应用层与下层的算力芯片层，为 AI 模型的训练与推理提供必要的软件技术设施。

SiliconCloud 一站式大模型 API 云服务平台
- 模型资源丰富：集成阿里通义大模型 Qwen2、智谱 AI 的 GLM-4、幻方量化的 DeepSeek V2 系列开源模型，以及文生图模型 SDXL、SDXL Lightning 等众多主流模型。
- 降低开发成本：开发者无需自建服务，可直接享用高性能模型 API，如调用文生图模型 Stable Diffusion 能 1 秒出图，调用 DeepSeek V2 响应速度可达 50Tokens/s。
- 统一接入便捷：通过统一接入多厂家 API，一个 key 配置一次即可使用多个模型，提高开发效率。
SiliconLLM 大语言模型推理引擎
- 超快速度：对内核、框架、机制和模型进行协同优化，实现最佳推理速度。
- 超级扩展：创新通信优化，可高效扩展到多机多卡场景。
- 超级易用：无需额外转换或编译，即可无缝使用各类开源模型，支持国内外主流芯片部署，实现了最高 10 倍的性能提升。
OneDiff 高性能文生图 / 视频加速库
- 速度优势明显：全球范围内率先实现 Stable Diffusion 模型 1 秒出图，性能提升高达 3 倍。
- 功能丰富多样：可快速切换 LoRA，ControlNet，并适应任意形状的推理，具有快速加载优化实例等特点，能有效降低显存使用。