EcoBot - Asistent Vocal AI pentru Scoala Verde

EcoBot este o aplicatie AI care ruleaza local pe calculatorul tau. Ii vorbesti, iar el iti raspunde cu voce, in timp ce un caracter animat se misca pe ecran.

Cum functioneaza

Microfon → faster-whisper (voce → text)
    → LM Studio / LLM local (generare raspuns)
        → Edge TTS / Piper TTS (text → voce)
            → Redare audio + caracter animat

Cerinte

Python 3.10+
LM Studio (sau alt server LLM compatibil OpenAI API)
Windows 10/11 (testat pe Windows 11)
Conexiune internet (doar pentru Edge TTS si prima descarcare Whisper)

Hardware recomandat

Componenta	Minim	Recomandat
RAM	8 GB	16+ GB
GPU	-	NVIDIA 4+ GB VRAM
CPU	Orice modern	6+ cores

Instalare

1. Cloneaza repo-ul

git clone https://github.com/<user>/scoala-verde.git
cd scoala-verde

2. Creeaza mediul virtual si instaleaza dependintele

python -m venv venv
venv\Scripts\activate
pip install -r backend/requirements.txt

3. Configureaza LM Studio

Deschide LM Studio
Descarca un model (recomandat: Llama 3.1 8B Instruct sau Mistral 7B Instruct)
Du-te la Local Server → incarca modelul → Start Server

4. Configureaza variabilele de mediu

copy backend\.env.example backend\.env

Editeaza backend/.env cu setarile tale (portul LM Studio, modelul Whisper, vocea TTS, etc.)

5. (Optional) Descarca vocea Piper pentru mod offline

Descarca fisierele vocii romanesti de la Piper Voices si pune .onnx + .onnx.json in backend/voices/.

Pornire

Dublu-click pe start.bat sau:

venv\Scripts\activate
cd backend
python main.py

Deschide browserul la http://localhost:8000

Utilizare

Butonul albastru — activeaza ascultarea continua. Spune "EcoBot" ca sa activezi, apoi pune intrebarea
Butonul verde — tine apasat si vorbeste direct
Butonul ⚙ — setari audio (selectie microfon/difuzor, amplificare, test)

Structura proiectului

scoala-verde/
├── backend/
│   ├── main.py              # FastAPI server (WebSocket)
│   ├── stt.py               # Speech-to-Text (faster-whisper)
│   ├── llm.py               # Comunicare LM Studio API
│   ├── tts.py               # Text-to-Speech (Edge TTS / Piper)
│   ├── voices/              # Modele voce Piper (.onnx)
│   ├── requirements.txt
│   ├── .env                 # Configuratie locala (nu se comite)
│   └── .env.example         # Template configuratie
├── frontend/
│   ├── index.html           # Pagina principala
│   ├── css/style.css
│   └── js/
│       ├── app.js           # Logica principala + WebSocket
│       ├── audio.js         # Captura microfon + redare audio
│       ├── character.js     # Caracter animat (copac)
│       └── settings.js      # Pagina setari audio
├── dev/                     # Documentatie dezvoltare
├── start.bat                # Script pornire Windows
└── README.md

Configuratie (.env)

Variabila	Default	Descriere
`LLM_BASE_URL`	`http://localhost:1234/v1`	URL-ul serverului LLM
`LLM_MODEL`	`local-model`	Numele modelului in LM Studio
`WHISPER_MODEL`	`small`	Dimensiunea modelului Whisper (tiny/small/medium)
`WHISPER_DEVICE`	`cuda`	Dispozitiv Whisper (cuda/cpu)
`TTS_ENGINE`	`edge`	Engine TTS: `edge` (online) sau `piper` (offline)
`TTS_VOICE`	`ro-RO-EmilNeural`	Vocea Edge TTS
`SERVER_PORT`	`8000`	Portul serverului

Tehnologii

faster-whisper — Speech-to-Text
LM Studio — Server LLM local
Edge TTS — Text-to-Speech (Microsoft Neural)
Piper TTS — Text-to-Speech offline
FastAPI — Backend Python

Licenta

MIT

4.1 KiB Raw Blame History