并发限制与超时说明
并发管理
并发计算方式
- WebSocket:以活跃的
context_id
数量计算 - 同一
context_id
的多次请求视为单个并发 - HTTP 请求:每个独立请求计为一个并发
超出限制处理
当超出并发限制时,系统将返回 429 Too Many Requests
错误响应。
业务场景建议
实时对话场景
- 实际支持的并行对话数约为并发限制的 4 倍
- 示例:并发限制为 10,可支持约 40 个并行对话
- 具体支持能力取决于对话类型,建议根据实际需求联系我们进行评估
批量处理场景
- 并发限制与实际处理能力直接对应
- 示例:并发限制为 15,可同时处理 15 个语音生成任务
- 建议使用连接池控制并发数量
WebSocket 连接管理
超时机制
- 空闲连接将在 5 分钟后自动关闭
- 维持长连接方案:
- 定期发送请求保持连接活跃
- 根据业务需求设置合适的心跳间隔
最佳实践
- 合理规划并发使用
- 实现请求重试机制
- 监控连接状态
- 及时处理超时重连