Files
karuo-ai/运营中枢/参考资料/API网关与常用AI配置说明.md

97 lines
7.4 KiB
Markdown
Raw Permalink Normal View History

# API 网关与常用 AI 配置说明
> 官网控制台与卡若AI 主仓库对齐。控制台内 **API Key 明文显示**便于与《00_账号与API索引》对照填写密钥来源见工作台 `00_账号与API索引.md` 或网关 `.env`。
---
## 一、参与轮询 / 未参与轮询
- **参与轮询**:已填写 API Key 的网关会参与故障切换与轮流调用在控制台「API 网关」页归入「参与轮询」区块显示。
- **未参与轮询**:未填写 API Key 的网关不参与轮询;填写并保存后即参与轮询,归入「参与轮询」区块。
- **轮流/故障切换**:请求时按主用网关下已填 Key 的端点依次尝试;失败则换下一网关,直到成功或全部失败。主用网关在官网控制台通过「设为主用」选择。
- **与主仓库一致**:主仓库 `OPENAI_API_BASES` / `OPENAI_API_KEYS` 多接口排队逻辑与官网「已填 Key = 参与轮询」一致,便于卡若自动使用多个 API/模型并确保调用成功。
---
## 二、常用 AI 与 Base URL官网控制台已预填可直接使用与编辑
| 名称 | Base URL | 说明 | 卡若/规则侧密钥或文档 |
|------|----------|------|------------------------|
| KaruoGatewayPrimary | `http://localhost:8000` | 本机卡若AI 网关 | 见 `运营中枢/scripts/karuo_ai_gateway/` |
| OpenAI 官方 | `https://api.openai.com/v1` | GPT 系列 | 规则/账号索引中的 OpenAI API Key |
| OpenRouter多模型聚合 | `https://openrouter.ai/api/v1` | 可调 Claude/GPT 等,统一入口 | 需在 OpenRouter 申请 Key |
| 通义千问DashScope | `https://dashscope.aliyuncs.com/compatible-mode/v1` | 阿里百炼OpenAI 兼容 | 账号索引·阿里云 / DASHSCOPE_API_KEY |
| v0Claude | `https://api.v0.dev/v1` | v0 Model API模型选 v0-1.5-md / v0-1.5-lg / v0-1.0-md | 账号索引·v0.devURL/Secret |
| 智增增 | `https://api.zhizengzeng.com/v1` | OpenAI 兼容 | 官网 API 清单已登记 |
| Groq超快推理 | `https://api.groq.com/openai/v1` | Llama 3/Mixtral/Gemma延迟极低 | cr4hsunuomlj@sharebot.net临时邮箱注册 |
| Together AI多模型聚合 | `https://api.together.xyz/v1` | Llama 3/Qwen/DeepSeek 等 | zhiqun1984@gmail.comGoogle OAuth |
| CerebrasAI芯片加速推理 | `https://api.cerebras.ai/v1` | Llama 3.1/3.3 | Google OAuth 注册 |
| CohereNLP专家 | `https://api.cohere.com/v2` | Command A/R/Embed/Rerank非 OpenAI 兼容需特殊适配 | zhiqun1984@gmail.comGoogle OAuth |
---
## 三、当前接口队列2026-03-16 02:02 更新)
| 序号 | 平台 | Base URL | 模型 | 上下文 | 状态 |
|:---|:---|:---|:---|:---|:---|
| 1 | **Cerebras** | `https://api.cerebras.ai/v1` | **qwen-3-235b-a22b-instruct-2507** | 8K | ✅ 主力不限额度235B大模型 |
| 2 | **Cohere** | `https://api.cohere.com/compatibility/v1` | command-a-03-2025 | **128K** | ✅ 备选免费tier长上下文 |
| 3 | Cerebras | `https://api.cerebras.ai/v1` | llama3.1-8b | 8K | ✅ 快速推理备选 |
| - | ~~Groq~~ | - | - | - | ❌ 组织受限disabled |
| - | ~~Together AI~~ | - | - | - | ❌ 额度耗尽disabled |
| - | ~~v0~~ | - | - | - | ❌ 持续 500disabled |
> **重要**Cerebras 不限额度、不封号qwen-3-235b 为 235B 参数大模型。Cohere 128K 适合长对话。
> 网关已接入 Key 池(`key_pool.db`),自动从池中读取活跃 Key。
### Key 池自动管理
```bash
# Key 池管理(核心)
python3 03_卡木/木根_逆向分析/全网AI自动注册/脚本/key_pool_manager.py status # 池状态
python3 03_卡木/木根_逆向分析/全网AI自动注册/脚本/key_pool_manager.py check # 健康检查
python3 03_卡木/木根_逆向分析/全网AI自动注册/脚本/key_pool_manager.py auto-fill # 自动补充
python3 03_卡木/木根_逆向分析/全网AI自动注册/脚本/key_pool_manager.py daemon # 守护模式
# 网关健康检查
python3 运营中枢/scripts/karuo_ai_gateway/key_health_check.py
```
### Key 来源与自动补充
- **Cerebras主力**由「全网AI自动注册」SKILLM02a纯 API 自动注册mail.tm + Stytch magic linkKey 池最低水位 3 个
- **Cohere**:手动注册,免费 tier
- Key 池补充后网关自动读取,无需重启
## 四、卡若AI 规则与已有 API 对应关系
- **主仓库网关**`运营中枢/scripts/karuo_ai_gateway/`,环境变量 `OPENAI_API_BASES` / `OPENAI_API_KEYS` / `OPENAI_MODELS` 支持多接口排队与故障切换与官网「API 网关」概念一致。
- **API 稳定性规则**`.cursor/rules/api-failover-stability.mdc` 规定接口排队、故障切换与告警,与上述网关行为一致。
- **Key 健康检查**`运营中枢/scripts/karuo_ai_gateway/key_health_check.py` 定期检测各 Key 可用性、响应延迟和额度,状态存入 `key_status.json`
- **账号与 Key**`运营中枢/工作台/00_账号与API索引.md` 中 v0、阿里云、腾讯云等网关 Key 建议写在 `karuo_ai_gateway/.env.api_keys.local` 或环境变量,不提交仓库。
---
## 四、让前端跑通 API 的两种方式
- **方式一(推荐)**在卡若AI 官网 **控制台 → API 网关** 中,至少配置一个网关并填写 API Key、选择模型如 v0 的 Key 从《00_账号与API索引》v0.dev 一节复制 Secret模型选 v0-1.5-md并将该网关「设为主用」。首页对话、技能 AI 等均走该网关。
- **方式二(环境变量回退)**未配置网关或数据库不可用时官网会读取环境变量作为备用网关与卡若AI《00_账号与API索引》对齐
- **v0**`V0_API_KEY``V0_SECRET`(值为索引中的 Secret可选 `V0_BASE_URL`(默认 `https://api.v0.dev/v1`)。
- **OpenAI**`OPENAI_API_KEY``CHAT_API_KEY`,可选 `OPENAI_API_BASE``OPENAI_MODEL`(默认 gpt-4o-mini
- 在网站项目根目录配置 `.env.local` 后重启,前端即可直接使用对话等 API 而无需先打开控制台。
## 五、官网控制台使用方式
- 打开 **卡若AI 官网 → 控制台 → API 网关**可见与主仓库一致的平台列表本机网关、OpenAI、OpenRouter、通义、v0、智增增可新增、编辑、删除以及「设为主用」选择当前主用网关。
- **参与轮询 / 未参与轮询**:页面分两块——「参与轮询」(已填 API Key、「未参与轮询」未填 Key。每个网关填写 Base URL 与 API Key**明文显示**便于与《00_账号与API索引》对照填好保存后即参与轮询。
- 网关级名称、Base URL、API Key、优先级、重试、超时。Key 可从卡若AI 工作台《账号与API索引》复制控制台内明文显示便于核对不掩码。
- **模型(请求时使用)**:每个网关的「模型」下拉为**该站点实际可选的 model id**,非通用名。例如 v0 仅显示 v0-1.5-lg / v0-1.5-md / v0-1.0-mdOpenAI 显示 gpt-4o、gpt-4o-mini 等OpenRouter 显示 openai/gpt-4o、anthropic/claude-3.5-sonnet 等;通义为 qwen-turbo、qwen-plus、qwen-max 等。按 Base URL 或网关 id 自动匹配,保证可选即可用、与各站文档一致。
---
## 六、相关文档
- 主仓库网关说明:`运营中枢/scripts/karuo_ai_gateway/README.md`
- 接口排队与故障切换规则:`运营中枢/参考资料/卡若AI_API接口排队与故障切换规则.md`
- 账号与 API 索引:`运营中枢/工作台/00_账号与API索引.md`