PolarPOLAR

Modelos

Conheça a família de modelos Urso da Polar — desde edge/mobile até modelos de fronteira.

Família de Modelos Urso

A família Urso foi desenvolvida nativamente para português brasileiro, com tokenizador BPE custom de 49K vocabulários otimizado para PT-BR. Todos os modelos de chat possuem janela de contexto de 128K tokens (exceto Embed, com 8K) e variantes Think com raciocínio explícito.

Urso Mabe

O modelo principal da família Urso, treinado nativamente para português brasileiro com performance competitiva em benchmarks internacionais e brasileiros.

  • Classe: Sub-50B (denso)
  • Contexto: 128K tokens
  • Multimodal: Não
  • Model ID: urso-mabe
  • Think variant: urso-mabe-think
  • ENEM: 86,1% | MMLU: 81,6% | GSM8K: 89,9% | BELEBELE-PT: 93,3%

Indicado para chat, análise de documentos, tool calling nativo, RAG com fontes brasileiras e aplicações agênticas.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.polarai.com.br/v1",
    api_key="pk-sua-chave-aqui"
)

response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "user", "content": "Resuma este texto em uma frase."}
    ]
)

print(response.choices[0].message.content)

Urso Eco — Voice AI

Sistema de Voice AI em tempo real da Polar. Conversação por voz natural em português brasileiro com latência ultra-baixa.

  • Tipo: Voice AI (STT + LLM + TTS)
  • Latência: Sub-segundo
  • Personas: Múltiplas vozes nativas em PT-BR
  • Protocolo: WebSocket bidirecional
  • Status: Disponível (não é full-duplex ainda)

Ideal para atendimento ao cliente por voz, assistentes virtuais falados e aplicações que exigem interação por áudio.

Capacidades da Plataforma

Além dos modelos, a plataforma Polar oferece:

  • UrsoClaw — Agente autônomo da Polar, baseado no OpenClaw. Executa ações reais: emails, agendamentos, buscas, ferramentas brasileiras nativas (legislação, CNPJ, impostos, processos, medicamentos) e centenas de integrações
  • Urso Guardião — Engine de segurança com políticas por domínio, human-in-the-loop, auditoria e compliance (LGPD, TSE, CFM)
  • Orquestração de Agentes — Sub-agentes especializados orquestrados automaticamente para tarefas complexas (Work mode)
  • Verticais Profundas — RAG especializado para 8 setores: Jurídico, Saúde, Contábil, Educação, RH, Financeiro, Código, Audiovisual
  • Deep Research — Investigação multi-rodada com leitura de páginas, decomposição de queries e síntese com fontes
  • Automações — Tarefas agendadas (cron) com entrega via push, email ou Telegram
  • MCP — Model Context Protocol com centenas de integrações

Urso Guto — Em breve

O modelo principal da API, equilibrando qualidade e custo. Arquitetura densa.

  • Classe: Médio (denso)
  • Contexto: 128K tokens
  • Multimodal: Sim (imagens, documentos, áudio)
  • Status: Em desenvolvimento
  • Model ID: urso-guto (disponível em breve)
  • Think variant: urso-guto-think

Ideal para uso geral: chat, sumarização, análise de documentos, geração de conteúdo e function calling.

Urso Bah — Em breve

Modelo enterprise de alta qualidade, usando arquitetura Mixture of Experts (MoE). Superior em raciocínio complexo, análise jurídica e geração de código.

  • Classe: Large (MoE)
  • Contexto: 128K tokens
  • Multimodal: Sim
  • Status: Em desenvolvimento
  • Model ID: urso-bah (disponível em breve)
  • Think variant: urso-bah-think

Recomendado para aplicações enterprise que exigem alta qualidade: análise de contratos, redação profissional, código complexo.

Urso Embed

Modelo de embeddings otimizado para portugues brasileiro, com contexto de 8K tokens. Gera vetores densos para busca semantica, clustering e RAG.

  • Contexto: 8K tokens
  • Dimensoes: 1024
  • Model ID: urso-embed
response = client.embeddings.create(
    model="urso-embed",
    input=["A LGPD garante o direito a privacidade dos cidadaos brasileiros."]
)

embedding = response.data[0].embedding
print(f"Dimensoes: {len(embedding)}")
const response = await client.embeddings.create({
  model: "urso-embed",
  input: ["Busca semantica em portugues brasileiro."],
});

console.log(response.data[0].embedding.length);

Variantes Think

Todos os modelos de chat possuem variantes -think que habilitam raciocinio explicito via cadeia de pensamento (chain-of-thought). O modelo mostra seu raciocinio passo a passo antes de chegar a resposta final.

response = client.chat.completions.create(
    model="urso-guto-think",
    messages=[
        {"role": "user", "content": "Se um trem sai de Sao Paulo as 8h a 120km/h e outro sai do Rio as 9h a 150km/h, quando eles se encontram?"}
    ]
)

Os modelos Think sao recomendados para:

  • Problemas matematicos e logicos
  • Analise de codigo
  • Planejamento e decomposicao de tarefas
  • Questoes que exigem raciocinio em multiplas etapas

Tabela de Precos

Precos por 1M de tokens em BRL:

ModeloEntrada (R$/1M tokens)Saida (R$/1M tokens)
urso-mabeR$ 1,50R$ 6,00
urso-mabe-thinkR$ 1,50R$ 6,00
urso-guto (em breve)
urso-guto-think (em breve)
urso-bah (em breve)
urso-bah-think (em breve)
urso-embedR$ 0,10

IDs dos Modelos

Model IDs disponíveis na API:

  • urso-mabe — Mabe (denso)
  • urso-mabe-think — Mabe com raciocínio
  • urso-embed — Embeddings

Model IDs em breve:

  • urso-guto — Guto (denso)
  • urso-guto-think — Guto com raciocínio
  • urso-bah — Bah (MoE)
  • urso-bah-think — Bah (MoE) com raciocínio

On this page