平台定位
小智AI是一个开源AI硬件与语音交互平台,基于乐鑫ESP32-S3核心板开发,集成多种AI大模型(如DeepSeek、OpenAI、通义Qwen),支持语音唤醒、多语言交互、角色定制等功能,旨在为开发者、创客及企业提供低成本的智能语音机器人解决方案。其硬件设计小巧灵活,软件生态开源,适用于智能家居、教育、客服等场景。
核心功能
- 多模型语音交互
- 大模型支持:可灵活切换DeepSeek、OpenAI、通义Qwen等模型,实现智能问答与知识库调用。
- 语音识别与合成:支持普通话、粤语、英语等多语言识别(基于FunASR),以及EdgeTTS、火山引擎豆包等语音合成接口。
- 声纹识别与唤醒:通过ESP-SR技术实现离线唤醒和说话人身份识别。
- 个性化角色定制
- 用户可自定义AI角色性格、音色及提示词,例如幽默喜剧演员、学术专家等,增强交互趣味性。
- 硬件与云端协同
- 硬件开源:提供ESP32-S3开发板设计图纸及3D打印外壳方案,支持Wi-Fi/4G双网络接入。
- 服务端架构:采用模块化设计,分离语音识别(ASR)、大模型推理(LLM)、语音合成(TTS)等模块,便于扩展与维护。
技术优势
- 低成本开发:硬件成本约88元,主控芯片为ESP32-S3,功耗低且兼容USB供电。
- 全链路开源:硬件电路、固件代码、服务端架构均开放(GitHub仓库),支持二次开发。
- 多模态交互:集成语音、文本、LCD屏幕(240×240分辨率)及RGB灯光反馈,提升用户体验。
硬件配置
- 核心模块:ESP32-S3-WROOM-1-N16R8主控芯片,搭配ES8311音频编解码器、数字麦克风及1.28寸圆形显示屏。
- 电源管理:支持Type-C供电与锂电池切换,确保设备稳定运行。
- 3D打印外壳:采用防滑设计,屏幕倾角符合人体工学,优化拾音与散热。
适用场景
- 智能家居:作为语音中控,控制灯光、家电等IoT设备。
- 教育助手:提供知识问答、语言学习等交互功能(参考强智科技教育版案例)。
- 企业客服:集成至客服系统,实现多语言智能应答。
- 开发者创客:通过开源项目快速验证AI硬件原型。
使用与获取
- 硬件购买:官网提供开发板及套件(约88元),支持自行3D打印外壳。
- 代码仓库:
- 硬件与固件:https://github.com/78/xiaozhi-esp32
- 服务端源码:https://github.com/xinnan-tech/xiaozhi-esp32-server
- 部署教程:提供固件烧录指南及API对接文档,降低上手门槛。
市场表现
- 凭借高性价比与开源生态,小智AI上线2个月销量突破10万台,增速达300%,成为AI硬件领域的黑马。