 主页

PY-XIAOZHI v1.1.6开源的小智AI语音客户端软件

 奥德彪

 2025-5-14

 Windows 软件仓

py-xiaozhi 是一个使用 Python 实现的小智语音客户端，旨在通过代码学习和在没有硬件条件下体验 AI 小智的语音功能。

功能特点

AI语音交互：支持语音输入与识别，实现智能人机交互，提供自然流畅的对话体验。
视觉多模态：支持图像识别和处理，提供多模态交互能力，理解图像内容。
IoT 设备集成：
- 支持智能家居设备控制，包括灯光、音量、温度传感器等
- 集成Home Assistant智能家居平台，控制灯具、开关、数值控制器和按钮设备
- 提供倒计时器功能，支持延时执行命令
- 内置多种虚拟设备和物理设备驱动，可轻松扩展
联网音乐播放：基于pygame实现的高性能音乐播放器，支持播放／暂停／停止、进度控制、歌词显示和本地缓存，提供更稳定的音乐播放体验。
语音唤醒：支持唤醒词激活交互，免去手动操作的烦恼（默认关闭需要手动开启）。
自动对话模式：实现连续对话体验，提升用户交互流畅度。
图形化界面：提供直观易用的 GUI，支持小智表情与文本显示，增强视觉体验。
命令行模式：支持 CLI 运行，适用于嵌入式设备或无 GUI 环境。
跨平台支持：兼容 Windows 10+、macOS 10.15+ 和 Linux 系统，随时随地使用。
音量控制：支持音量调节，适应不同环境需求，统一声音控制接口。
会话管理：有效管理多轮对话，保持交互的连续性。
加密音频传输：支持 WSS 协议，保障音频数据的安全性，防止信息泄露。
自动验证码处理：首次使用时，程序自动复制验证码并打开浏览器，简化用户操作。
自动获取 MAC 地址：避免 MAC 地址冲突，提高连接稳定性。
代码模块化：拆分代码并封装为类，职责分明，便于二次开发。
稳定性优化：修复多项问题，包括断线重连、跨平台兼容等。

系统要求

3.9 >= Python版本 <= 3.12
支持的操作系统：Windows 10+、macOS 10.15+、Linux
麦克风和扬声器设备

配置系统

项目使用分层配置系统，主要包括：

基础配置：设置基本运行参数，位于config/config.json
设备激活：设备身份信息，存储在config/efuse.json
唤醒词配置：语音唤醒相关设置
物联网设备：支持各种IoT设备的配置，包括温度传感器和Home Assistant集成

详细配置说明请参考配置说明文档

IoT功能

py-xiaozhi提供丰富的IoT设备控制功能：

虚拟设备：灯光控制、音量调节、倒计时器等
物理设备集成：温度传感器、摄像头等
Home Assistant集成：通过HTTP API接入智能家居系统
自定义设备扩展：提供完整的设备定义和注册框架

支持的设备类型和使用示例请参考 IoT功能说明

开源地址：https://github.com/huangjunsen0406/py-xiaozhi

下载地址：

github

密码：无

123盘

密码：无

百度云盘

密码：无

阅读剩余

网站声明

本站内容可能存在水印或引流等信息，请擦亮眼睛自行鉴别；以免上当受骗；

本站提供的内容仅限用于学习和研究目的，不得将本站内容用于商业或者非法用途；