Guia de URL de servidor personalizado

Conecte o Grambo a qualquer serviço de IA local ou remoto — LM Studio, Ollama, LiteLLM, vLLM ou qualquer endpoint compatível com OpenAI

📖 Visão geral

O recurso URL de servidor personalizado do Grambo permite conectar-se a qualquer serviço de IA que expõe uma API compatível com OpenAI. Isso inclui ferramentas de IA local como LM Studio, Jan e Ollama configurado manualmente, bem como serviços auto-hospedados ou remotos como LiteLLM, vLLM e AnythingLLM. Você fornece a URL do servidor, o nome do modelo e uma chave de API opcional — o Grambo faz o resto.

📡 Formato OpenAI necessário: O servidor ao qual você se conecta deve retornar respostas no formato de completações de chat OpenAI. A maioria das ferramentas de IA local modernas suporta isso nativamente.

⚙️ Como configurar a URL de servidor personalizado

Siga estas etapas para conectar o Grambo ao seu servidor de IA personalizado:

  1. Abra as configurações do Grambo: Inicie o Grambo no seu Mac e clique no botão "Configurações".
  2. Escolha "Traga sua própria chave (BYOK)" em "Tipo de serviço".
  3. Selecione "URL de servidor personalizado" das opções de modelo/provedor.
  4. Insira sua URL de servidor: Cole a URL base do seu servidor de IA, incluindo o caminho (ex. /v1):
    http://localhost:1234/v1
  5. Insira o nome do modelo: Digite o nome exato do modelo que seu servidor está executando (ex. llama3, mistral, phi3):
    llama3
  6. Insira sua chave de API (se necessário pelo seu servidor). Se seu servidor não requer autenticação, insira none ou deixe em branco:
    none
  7. Salve suas configurações e comece a usar o Grambo com seu servidor personalizado.

✅ Pronto! O Grambo agora enviará solicitações de correção gramatical para seu servidor personalizado. Todo o processamento ocorre através do seu serviço de IA escolhido.

🔌 Serviços compatíveis

Qualquer serviço que implemente o formato de API de completações de chat OpenAI funcionará. Aqui estão algumas opções populares com suas URLs padrão:

Serviço URL padrão Chave de API
LM Studio http://localhost:1234/v1 Opcional
Ollama (manual) http://localhost:11434/v1 Não necessária
Jan http://localhost:1337/v1 Opcional
LiteLLM http://localhost:4000/v1 Necessária
vLLM http://localhost:8000/v1 Opcional
AnythingLLM http://localhost:3001/api/openai Necessária
Servidor remoto / personalizado https://your-server.com/v1 Varia

💡 Dica: Certifique-se de que seu servidor de IA local está em execução antes de salvar suas configurações no Grambo.

📡 Requisito de formato de resposta OpenAI

O Grambo espera que o servidor responda usando o formato padrão de completações de chat OpenAI. Este é o mesmo formato usado pela API oficial OpenAI e é amplamente suportado por ferramentas de IA local.

  • Endpoint: Seu servidor deve aceitar solicitações POST em /chat/completions (relativo à URL base que você fornece)
  • Formato de solicitação: O Grambo envia um array messages padrão com um prompt do sistema e texto do usuário
  • Formato de resposta: O servidor deve retornar um objeto JSON com choices[0].message.content contendo o texto corrigido
  • Campo de modelo: O nome do modelo que você insere nas configurações é passado no corpo da solicitação como parâmetro model

⚠️ Compatibilidade: Se seu servidor não retornar respostas no formato OpenAI, o Grambo não conseguirá analisar a correção. Consulte a documentação do seu servidor para confirmar que suporta a API de completações de chat OpenAI.

Perguntas frequentes

Qual é a diferença entre URL de servidor personalizado e a IA local integrada?

A IA local integrada usa a configuração automática do Grambo para instalar e gerenciar o Ollama para você. A URL de servidor personalizado é para usuários avançados que já têm um servidor de IA em execução — local ou remoto — e querem conectar o Grambo manualmente.

Preciso de uma chave de API?

Depende do seu servidor. A maioria dos servidores locais (LM Studio, Ollama, Jan) não requer chave de API. Se seu servidor requer autenticação, insira a chave no campo Chave de API. Caso contrário, você pode inserir "none" ou deixar em branco.

Posso conectar a um servidor remoto, não apenas localhost?

Sim! Você pode usar qualquer URL — local (http://localhost:...) ou remota (https://seu-servidor.com/v1). Apenas certifique-se de que o servidor seja acessível do seu Mac e retorne respostas compatíveis com OpenAI.

Qual nome de modelo devo inserir?

Insira o identificador exato do modelo que seu servidor espera. Por exemplo, no LM Studio é mostrado no menu suspenso do modelo. Para Ollama, é a tag do modelo que você baixou (ex. llama3, mistral, qwen2).

Por que o Grambo não está recebendo resposta do meu servidor?

Verifique que: (1) seu servidor está em execução e acessível na URL inserida, (2) o nome do modelo está correto, (3) o servidor retorna respostas JSON compatíveis com OpenAI, e (4) se uma chave de API é necessária, está inserida corretamente.

Posso usar a URL de servidor personalizado junto com outros provedores BYOK?

Sim. Você pode alternar entre URL de servidor personalizado, OpenAI, Anthropic, Google Gemini e IA local a qualquer momento nas configurações do Grambo. Cada modo é independente.

📧 Precisa de ajuda?

Se tiver dificuldades para conectar ao seu servidor personalizado ou tiver dúvidas sobre compatibilidade, entre em contato conosco em support@gramboapp.com