Self-hosted Ollama-Gateway mit Split-Auth. Verwaltung im Dashboard.
GET /v1/models – verfügbare Modelle (gefiltert nach Scope)POST /v1/chat/completions – Chat-Inferenz (stream + non-stream)GET /healthz – StatuscheckCoding-Modelle: x-api-key: <dein-key>
Chat-Modelle: API-Key mit scope=chat oder all, oder JWT vom Dashboard-Login.
curl https://openclaw.ze-tech.de/v1/chat/completions \
-H "x-api-key: <dein-key>" \
-H "Content-Type: application/json" \
-d '{"model":"qwen2.5-coder:14b-instruct-q4_K_M","messages":[{"role":"user","content":"Hallo"}]}'
Rate-Limit: 120 req/min · TLS via Let's Encrypt