AI 对话聊天工具AI开发平台

硅基流动

跟华为合作,基于国产昇腾平台部署了满血版的 Deepseek R1

标签:

主要产品

硅基流动是一家专注于通用人工智能(AGI)基础设施的企业,以下是关于它的介绍1

公司概况

  • 成立时间:2023 年 8 月 29 日正式成立。
  • 创始人:袁进辉,本科毕业于西安电子科技大学,2003 年考入清华大学计算机系,是前 OneFlow(一流科技)创始人及 CEO,曾任微软亚洲研究院主管研究员。
  • 融资情况:2024 年 1 月完成 5000 万元天使轮融资。2024 年 7 月完成近亿元天使 + 轮融资。2024 年底完成亿元人民币 Pre-A 轮融资,投后估值达 2 亿美元。
  • 公司定位:定位于大模型时代的 AI 基础设施(AI Infra)层,专注于通过算法、系统与硬件的协同创新,降低 AI 应用的开发和使用门槛,连接着上层的 AI 应用层与下层的算力芯片层,为 AI 模型的训练与推理提供必要的软件技术设施。
  • SiliconCloud 一站式大模型 API 云服务平台
    • 模型资源丰富:集成阿里通义大模型 Qwen2、智谱 AI 的 GLM-4、幻方量化的 DeepSeek V2 系列开源模型,以及文生图模型 SDXL、SDXL Lightning 等众多主流模型。
    • 降低开发成本:开发者无需自建服务,可直接享用高性能模型 API,如调用文生图模型 Stable Diffusion 能 1 秒出图,调用 DeepSeek V2 响应速度可达 50Tokens/s。
    • 统一接入便捷:通过统一接入多厂家 API,一个 key 配置一次即可使用多个模型,提高开发效率。
  • SiliconLLM 大语言模型推理引擎
    • 超快速度:对内核、框架、机制和模型进行协同优化,实现最佳推理速度。
    • 超级扩展:创新通信优化,可高效扩展到多机多卡场景。
    • 超级易用:无需额外转换或编译,即可无缝使用各类开源模型,支持国内外主流芯片部署,实现了最高 10 倍的性能提升。
  • OneDiff 高性能文生图 / 视频加速库
    • 速度优势明显:全球范围内率先实现 Stable Diffusion 模型 1 秒出图,性能提升高达 3 倍。
    • 功能丰富多样:可快速切换 LoRA,ControlNet,并适应任意形状的推理,具有快速加载优化实例等特点,能有效降低显存使用。

数据统计

相关导航