Guia de URL de servidor personalizado
Conecte o Grambo a qualquer serviço de IA local ou remoto — LM Studio, Ollama, LiteLLM, vLLM ou qualquer endpoint compatível com OpenAI
📖 Visão geral
O recurso URL de servidor personalizado do Grambo permite conectar-se a qualquer serviço de IA que expõe uma API compatível com OpenAI. Isso inclui ferramentas de IA local como LM Studio, Jan e Ollama configurado manualmente, bem como serviços auto-hospedados ou remotos como LiteLLM, vLLM e AnythingLLM. Você fornece a URL do servidor, o nome do modelo e uma chave de API opcional — o Grambo faz o resto.
📡 Formato OpenAI necessário: O servidor ao qual você se conecta deve retornar respostas no formato de completações de chat OpenAI. A maioria das ferramentas de IA local modernas suporta isso nativamente.
⚙️ Como configurar a URL de servidor personalizado
Siga estas etapas para conectar o Grambo ao seu servidor de IA personalizado:
- Abra as configurações do Grambo: Inicie o Grambo no seu Mac e clique no botão "Configurações".
- Escolha "Traga sua própria chave (BYOK)" em "Tipo de serviço".
- Selecione "URL de servidor personalizado" das opções de modelo/provedor.
-
Insira sua URL de servidor: Cole a URL base do seu servidor de IA, incluindo o caminho (ex.
/v1):http://localhost:1234/v1 -
Insira o nome do modelo: Digite o nome exato do modelo que seu servidor está executando (ex.
llama3,mistral,phi3):llama3 -
Insira sua chave de API (se necessário pelo seu servidor). Se seu servidor não requer autenticação, insira
noneou deixe em branco:none - Salve suas configurações e comece a usar o Grambo com seu servidor personalizado.
✅ Pronto! O Grambo agora enviará solicitações de correção gramatical para seu servidor personalizado. Todo o processamento ocorre através do seu serviço de IA escolhido.
🔌 Serviços compatíveis
Qualquer serviço que implemente o formato de API de completações de chat OpenAI funcionará. Aqui estão algumas opções populares com suas URLs padrão:
| Serviço | URL padrão | Chave de API |
|---|---|---|
| LM Studio | http://localhost:1234/v1 |
Opcional |
| Ollama (manual) | http://localhost:11434/v1 |
Não necessária |
| Jan | http://localhost:1337/v1 |
Opcional |
| LiteLLM | http://localhost:4000/v1 |
Necessária |
| vLLM | http://localhost:8000/v1 |
Opcional |
| AnythingLLM | http://localhost:3001/api/openai |
Necessária |
| Servidor remoto / personalizado | https://your-server.com/v1 |
Varia |
💡 Dica: Certifique-se de que seu servidor de IA local está em execução antes de salvar suas configurações no Grambo.
📡 Requisito de formato de resposta OpenAI
O Grambo espera que o servidor responda usando o formato padrão de completações de chat OpenAI. Este é o mesmo formato usado pela API oficial OpenAI e é amplamente suportado por ferramentas de IA local.
- Endpoint: Seu servidor deve aceitar solicitações POST em
/chat/completions(relativo à URL base que você fornece) - Formato de solicitação: O Grambo envia um array
messagespadrão com um prompt do sistema e texto do usuário - Formato de resposta: O servidor deve retornar um objeto JSON com
choices[0].message.contentcontendo o texto corrigido - Campo de modelo: O nome do modelo que você insere nas configurações é passado no corpo da solicitação como parâmetro
model
⚠️ Compatibilidade: Se seu servidor não retornar respostas no formato OpenAI, o Grambo não conseguirá analisar a correção. Consulte a documentação do seu servidor para confirmar que suporta a API de completações de chat OpenAI.
❓ Perguntas frequentes
Qual é a diferença entre URL de servidor personalizado e a IA local integrada?
A IA local integrada usa a configuração automática do Grambo para instalar e gerenciar o Ollama para você. A URL de servidor personalizado é para usuários avançados que já têm um servidor de IA em execução — local ou remoto — e querem conectar o Grambo manualmente.
Preciso de uma chave de API?
Depende do seu servidor. A maioria dos servidores locais (LM Studio, Ollama, Jan) não requer chave de API. Se seu servidor requer autenticação, insira a chave no campo Chave de API. Caso contrário, você pode inserir "none" ou deixar em branco.
Posso conectar a um servidor remoto, não apenas localhost?
Sim! Você pode usar qualquer URL — local (http://localhost:...) ou remota (https://seu-servidor.com/v1). Apenas certifique-se de que o servidor seja acessível do seu Mac e retorne respostas compatíveis com OpenAI.
Qual nome de modelo devo inserir?
Insira o identificador exato do modelo que seu servidor espera. Por exemplo, no LM Studio é mostrado no menu suspenso do modelo. Para Ollama, é a tag do modelo que você baixou (ex. llama3, mistral, qwen2).
Por que o Grambo não está recebendo resposta do meu servidor?
Verifique que: (1) seu servidor está em execução e acessível na URL inserida, (2) o nome do modelo está correto, (3) o servidor retorna respostas JSON compatíveis com OpenAI, e (4) se uma chave de API é necessária, está inserida corretamente.
Posso usar a URL de servidor personalizado junto com outros provedores BYOK?
Sim. Você pode alternar entre URL de servidor personalizado, OpenAI, Anthropic, Google Gemini e IA local a qualquer momento nas configurações do Grambo. Cada modo é independente.
📧 Precisa de ajuda?
Se tiver dificuldades para conectar ao seu servidor personalizado ou tiver dúvidas sobre compatibilidade, entre em contato conosco em support@gramboapp.com