这是一个由虾哥开源的ESP32项目,以 MIT 许可证发布,允许任何人免费使用,或用于商业用途。
我们希望通过这个项目,让大家的小智都能播放歌曲。
如果你有任何想法或建议,请随时提出 Issues 或加入 QQ 群:826072986
项目主要贡献者:空白泡泡糖果(B站UP),硅灵造物科技(B站UP)
音乐服务器提供者(为爱发电):一撒
进入小智后台,找到对应设备,修改角色配置
- 选择 DeepSeekV3 大语言模型
- 在人物介绍中填入
- 收到音乐相关的需求时,只使用 MPC tool
self.music.play_song工具,同时禁止使用search_music功能。
- 收到音乐相关的需求时,只使用 MPC tool
- ESP32C3芯片的开发板
- main\boards\common\music.h
- main\boards\common\esp32_music.cc
- main\boards\common\esp32_music.h
- main\mcp_server.cc
- main\boards\common\board.cc
- main\boards\common\board.h
- main\application.cc
- main\application.h
- main\display\display.cc
- main\display\display.h
- main\audio\audio_service.cc
- main\audio\audio_service.h
- main\idf_component.yml
小智 AI 聊天机器人作为一个语音交互入口,利用 Qwen / DeepSeek 等大模型的 AI 能力,通过 MCP 协议实现多端控制。
- 🎭 丰富的角色定制系统:支持**女友、土豆子、English Tutor 等多种预设角色
- 🎨 个性化配置:自定义助手昵称、对话语言、角色音色和性格介绍
- 🎵 智能音乐控制:支持
self.music.play_song工具进行音乐播放控制 - 📡 Wi-Fi / ML307 Cat.1 4G 网络连接
- 🗣️ 离线语音唤醒 ESP-SR
- 🔗 支持两种通信协议(Websocket 或 MQTT+UDP)
- 🎧 采用 OPUS 音频编解码
- 🤖 基于流式 ASR + LLM + TTS 架构的语音交互
- 👤 声纹识别,识别当前说话人的身份 3D Speaker
- 📺 OLED / LCD 显示屏,支持表情显示
- 🔋 电量显示与电源管理
- 🌍 支持多语言(中文、英文、日文)
- 💻 支持 ESP32-C3、ESP32-S3、ESP32-P4 芯片平台
- 🏠 通过设备端 MCP 实现设备控制(音量、灯光、电机、GPIO 等)
- ☁️ 通过云端 MCP 扩展大模型能力(智能家居控制、PC桌面操作、知识搜索、邮件收发等)
详见飞书文档教程:
面包板效果图如下:
- 立创·实战派 ESP32-S3 开发板
- 乐鑫 ESP32-S3-BOX3
- M5Stack CoreS3
- M5Stack AtomS3R + Echo Base
- 神奇按钮 2.4
- 微雪电子 ESP32-S3-Touch-AMOLED-1.8
- LILYGO T-Circle-S3
- 虾哥 Mini C3
- 璀璨·AI 吊坠
- 无名科技 Nologo-星智-1.54TFT
- SenseCAP Watcher
- ESP-HI 超低成本机器狗
新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。
固件默认接入 xiaozhi.me 官方服务器,个人用户注册账号可以免费使用 Qwen 实时模型。
👉 新手烧录固件教程
- Cursor 或 VSCode
- 安装 ESP-IDF 插件,选择 SDK 版本 5.4 或以上
- Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
- 本项目使用 Google C++ 代码风格,提交代码时请确保符合规范
- 自定义开发板指南 - 学习如何为小智 AI 创建自定义开发板
- MCP 协议物联网控制用法说明 - 了解如何通过 MCP 协议控制物联网设备
- MCP 协议交互流程 - 设备端 MCP 协议的实现方式
- 一份详细的 WebSocket 通信协议文档
如果你已经拥有一个的小智 AI 聊天机器人设备,并且已接入官方服务器,可以登录 xiaozhi.me 控制台进行配置。
在 xiaozhi.me 控制台中,您可以:
- 选择角色模板:从**女友、土豆子、English Tutor、好奇小男孩、汪汪队队长等预设角色中选择
- 设置助手昵称:为您的 AI 伴侣起一个专属的名字(默认:小智)
- 配置对话语言:支持普通话、英语、日语等多种语言
- 选择角色音色:清澈小何等多种音色可供选择
- 自定义角色介绍:详细描述角色的性格特点和背景设定
💡 特别功能:收到音乐相关需求时,小智会优先使用 self.music.play_song 工具,确保音乐播放体验的流畅性。
在个人电脑上部署服务器,可以参考以下第三方开源的项目:
- xinnan-tech/xiaozhi-esp32-server Python 服务器
- joey-zhou/xiaozhi-esp32-server-java Java 服务器
- AnimeAIChat/xiaozhi-server-go Golang 服务器
使用小智通信协议的第三方客户端项目:
- huangjunsen0406/py-xiaozhi Python 客户端
- TOM88812/xiaozhi-android-client Android 客户端
- 100askTeam/xiaozhi-linux 百问科技提供的 Linux 客户端
- 78/xiaozhi-sf32 思澈科技的蓝牙芯片固件
- QuecPython/solution-xiaozhiAI 移远提供的 QuecPython 固件

