小智AI硬件很火,但服务端不开源大家都玩不了。
等小智自己开源是不可能的,但总会有人去做,因为说白了,没什么太大的门槛。
华南理工大学就直接把这套功能复刻并开源了。
该有的功能基本都有了,想做调整的话也可以根据自己需求去修改。
看下列表,就知道有多少功能了。
项目简介
xiaozhi-esp32-server 是由华南理工大学刘思源教授团队研发的开源后端服务项目,基于人机共生智能理论,为 xiaozhi-esp32 开源智能硬件提供支持。它采用 Python、Java、Vue 实现,支持 MCP 接入点和声纹识别等功能,提供最简化和全模块两种部署方式,适配多种配置方案,可满足不同场景下智能终端的软硬件协同需求。
DEMO
这里我只放一个常规功能的,功能太多,其他的你们可以到链接去看。
功能模块
组件列表
LLM 语言模型
VLLM 视觉模型
TTS 语音合成
VAD 语音活动检测
ASR 语音识别
Voiceprint 声纹识别
Memory 记忆存储
Intent 意图识别
项目链接
https://github.com/xinnan-tech/xiaozhi-esp32-server
文章来自于“开源AI项目落地”,作者“开源AI”。