-
Notifications
You must be signed in to change notification settings - Fork 146
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
bug: all balances exhausted or unavailable #215
Comments
麻烦提供一下版本号,包括apipark的版本号和apinto的版本号 |
在2月20日的时候通过docker-compsoe 安装的版本(https://docs.apipark.com/zh-Hans/docs/1.4-beta/deploy#docker-compose%E9%83%A8%E7%BD%B2) 发现在2.21有更新到v1.5.0-beta 另外,是否会更新:支持远程调用xinference提供的api呢?感谢!!! |
好的,我们排查一下最新版本,看看能否复现 |
会支持把xinference作为一种AI供应商接入,然后可以通过apipark把基于xinference部署的AI能力接口进行调用,并且正常使用apipark来进行格式统一,负载均衡,已经调用统计等功能。 |
其实想要的是类似本地部署后,可以通过类似修改base_url和apikey配置的方式连接到自己的本地模型,即不限定是vllm还是xinference还是ollama,这样可操作性会强一点点。 |
理解的,但是完全自定义的对接的话,有一个比较大的问题是如何确保接口的输入和输出格式一致。目前我们是根据不同的供应商做一层映射的,因为不同的供应商或者说渠道,他们的接口格式有差异。 |
!!谢谢答复 |
Current Behavior
确信调用通义千问官方的api调用和apikey都正常,且在容器里面curl发送chat正常。但是使用ai服务功能,返回all balances exhausted or unavailable
Expected Behavior
No response
Error Logs
No response
Steps to Reproduce
No response
Environment
uname -a
):The text was updated successfully, but these errors were encountered: