Modelos

Conheça a família de modelos Urso da Polar — desde edge/mobile até modelos de fronteira.

Família de Modelos Urso

A família Urso foi desenvolvida nativamente para português brasileiro, com tokenizador BPE custom de 49K vocabulários otimizado para PT-BR. Todos os modelos de chat possuem janela de contexto de 128K tokens (exceto Embed, com 8K) e variantes Think com raciocínio explícito.

Urso Mabe

O modelo principal da família Urso, treinado nativamente para português brasileiro com performance competitiva em benchmarks internacionais e brasileiros.

Classe: Sub-50B (denso)
Contexto: 128K tokens
Multimodal: Não
Model ID: urso-mabe
Think variant: urso-mabe-think
ENEM: 86,1% | MMLU: 81,6% | GSM8K: 89,9% | BELEBELE-PT: 93,3%

Indicado para chat, análise de documentos, tool calling nativo, RAG com fontes brasileiras e aplicações agênticas.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.polarai.com.br/v1",
    api_key="pk-sua-chave-aqui"
)

response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "user", "content": "Resuma este texto em uma frase."}
    ]
)

print(response.choices[0].message.content)

Urso Eco — Voice AI

Sistema de Voice AI em tempo real da Polar. Conversação por voz natural em português brasileiro com latência ultra-baixa.

Tipo: Voice AI (STT + LLM + TTS)
Latência: Sub-segundo
Personas: Múltiplas vozes nativas em PT-BR
Protocolo: WebSocket bidirecional
Status: Disponível (não é full-duplex ainda)

Ideal para atendimento ao cliente por voz, assistentes virtuais falados e aplicações que exigem interação por áudio.

Capacidades da Plataforma

Além dos modelos, a plataforma Polar oferece:

UrsoClaw — Agente autônomo da Polar, baseado no OpenClaw. Executa ações reais: emails, agendamentos, buscas, ferramentas brasileiras nativas (legislação, CNPJ, impostos, processos, medicamentos) e centenas de integrações
Urso Guardião — Engine de segurança com políticas por domínio, human-in-the-loop, auditoria e compliance (LGPD, TSE, CFM)
Orquestração de Agentes — Sub-agentes especializados orquestrados automaticamente para tarefas complexas (Work mode)
Verticais Profundas — RAG especializado para 8 setores: Jurídico, Saúde, Contábil, Educação, RH, Financeiro, Código, Audiovisual
Deep Research — Investigação multi-rodada com leitura de páginas, decomposição de queries e síntese com fontes
Automações — Tarefas agendadas (cron) com entrega via push, email ou Telegram
MCP — Model Context Protocol com centenas de integrações

Urso Guto — Em breve

O modelo principal da API, equilibrando qualidade e custo. Arquitetura densa.

Classe: Médio (denso)
Contexto: 128K tokens
Multimodal: Sim (imagens, documentos, áudio)
Status: Em desenvolvimento
Model ID: urso-guto (disponível em breve)
Think variant: urso-guto-think

Ideal para uso geral: chat, sumarização, análise de documentos, geração de conteúdo e function calling.

Urso Bah — Em breve

Modelo enterprise de alta qualidade, usando arquitetura Mixture of Experts (MoE). Superior em raciocínio complexo, análise jurídica e geração de código.

Classe: Large (MoE)
Contexto: 128K tokens
Multimodal: Sim
Status: Em desenvolvimento
Model ID: urso-bah (disponível em breve)
Think variant: urso-bah-think

Recomendado para aplicações enterprise que exigem alta qualidade: análise de contratos, redação profissional, código complexo.

Urso Embed

Modelo de embeddings otimizado para portugues brasileiro, com contexto de 8K tokens. Gera vetores densos para busca semantica, clustering e RAG.

Contexto: 8K tokens
Dimensoes: 1024
Model ID: urso-embed

response = client.embeddings.create(
    model="urso-embed",
    input=["A LGPD garante o direito a privacidade dos cidadaos brasileiros."]
)

embedding = response.data[0].embedding
print(f"Dimensoes: {len(embedding)}")

const response = await client.embeddings.create({
  model: "urso-embed",
  input: ["Busca semantica em portugues brasileiro."],
});

console.log(response.data[0].embedding.length);

Variantes Think

Todos os modelos de chat possuem variantes -think que habilitam raciocinio explicito via cadeia de pensamento (chain-of-thought). O modelo mostra seu raciocinio passo a passo antes de chegar a resposta final.

response = client.chat.completions.create(
    model="urso-guto-think",
    messages=[
        {"role": "user", "content": "Se um trem sai de Sao Paulo as 8h a 120km/h e outro sai do Rio as 9h a 150km/h, quando eles se encontram?"}
    ]
)

Os modelos Think sao recomendados para:

Problemas matematicos e logicos
Analise de codigo
Planejamento e decomposicao de tarefas
Questoes que exigem raciocinio em multiplas etapas

Tabela de Precos

Precos por 1M de tokens em BRL:

Modelo	Entrada (R$/1M tokens)	Saida (R$/1M tokens)
`urso-mabe`	R$ 1,50	R$ 6,00
`urso-mabe-think`	R$ 1,50	R$ 6,00
`urso-guto` (em breve)	—	—
`urso-guto-think` (em breve)	—	—
`urso-bah` (em breve)	—	—
`urso-bah-think` (em breve)	—	—
`urso-embed`	R$ 0,10	—

IDs dos Modelos

Model IDs disponíveis na API:

urso-mabe — Mabe (denso)
urso-mabe-think — Mabe com raciocínio
urso-embed — Embeddings

Model IDs em breve:

urso-guto — Guto (denso)
urso-guto-think — Guto com raciocínio
urso-bah — Bah (MoE)
urso-bah-think — Bah (MoE) com raciocínio

On this page