Modelos
Conheça a família de modelos Urso da Polar — desde edge/mobile até modelos de fronteira.
Família de Modelos Urso
A família Urso foi desenvolvida nativamente para português brasileiro, com tokenizador BPE custom de 49K vocabulários otimizado para PT-BR. Todos os modelos de chat possuem janela de contexto de 128K tokens (exceto Embed, com 8K) e variantes Think com raciocínio explícito.
Urso Mabe
O modelo principal da família Urso, treinado nativamente para português brasileiro com performance competitiva em benchmarks internacionais e brasileiros.
- Classe: Sub-50B (denso)
- Contexto: 128K tokens
- Multimodal: Não
- Model ID:
urso-mabe - Think variant:
urso-mabe-think - ENEM: 86,1% | MMLU: 81,6% | GSM8K: 89,9% | BELEBELE-PT: 93,3%
Indicado para chat, análise de documentos, tool calling nativo, RAG com fontes brasileiras e aplicações agênticas.
from openai import OpenAI
client = OpenAI(
base_url="https://api.polarai.com.br/v1",
api_key="pk-sua-chave-aqui"
)
response = client.chat.completions.create(
model="urso-mabe",
messages=[
{"role": "user", "content": "Resuma este texto em uma frase."}
]
)
print(response.choices[0].message.content)Urso Eco — Voice AI
Sistema de Voice AI em tempo real da Polar. Conversação por voz natural em português brasileiro com latência ultra-baixa.
- Tipo: Voice AI (STT + LLM + TTS)
- Latência: Sub-segundo
- Personas: Múltiplas vozes nativas em PT-BR
- Protocolo: WebSocket bidirecional
- Status: Disponível (não é full-duplex ainda)
Ideal para atendimento ao cliente por voz, assistentes virtuais falados e aplicações que exigem interação por áudio.
Capacidades da Plataforma
Além dos modelos, a plataforma Polar oferece:
- UrsoClaw — Agente autônomo da Polar, baseado no OpenClaw. Executa ações reais: emails, agendamentos, buscas, ferramentas brasileiras nativas (legislação, CNPJ, impostos, processos, medicamentos) e centenas de integrações
- Urso Guardião — Engine de segurança com políticas por domínio, human-in-the-loop, auditoria e compliance (LGPD, TSE, CFM)
- Orquestração de Agentes — Sub-agentes especializados orquestrados automaticamente para tarefas complexas (Work mode)
- Verticais Profundas — RAG especializado para 8 setores: Jurídico, Saúde, Contábil, Educação, RH, Financeiro, Código, Audiovisual
- Deep Research — Investigação multi-rodada com leitura de páginas, decomposição de queries e síntese com fontes
- Automações — Tarefas agendadas (cron) com entrega via push, email ou Telegram
- MCP — Model Context Protocol com centenas de integrações
Urso Guto — Em breve
O modelo principal da API, equilibrando qualidade e custo. Arquitetura densa.
- Classe: Médio (denso)
- Contexto: 128K tokens
- Multimodal: Sim (imagens, documentos, áudio)
- Status: Em desenvolvimento
- Model ID:
urso-guto(disponível em breve) - Think variant:
urso-guto-think
Ideal para uso geral: chat, sumarização, análise de documentos, geração de conteúdo e function calling.
Urso Bah — Em breve
Modelo enterprise de alta qualidade, usando arquitetura Mixture of Experts (MoE). Superior em raciocínio complexo, análise jurídica e geração de código.
- Classe: Large (MoE)
- Contexto: 128K tokens
- Multimodal: Sim
- Status: Em desenvolvimento
- Model ID:
urso-bah(disponível em breve) - Think variant:
urso-bah-think
Recomendado para aplicações enterprise que exigem alta qualidade: análise de contratos, redação profissional, código complexo.
Urso Embed
Modelo de embeddings otimizado para portugues brasileiro, com contexto de 8K tokens. Gera vetores densos para busca semantica, clustering e RAG.
- Contexto: 8K tokens
- Dimensoes: 1024
- Model ID:
urso-embed
response = client.embeddings.create(
model="urso-embed",
input=["A LGPD garante o direito a privacidade dos cidadaos brasileiros."]
)
embedding = response.data[0].embedding
print(f"Dimensoes: {len(embedding)}")const response = await client.embeddings.create({
model: "urso-embed",
input: ["Busca semantica em portugues brasileiro."],
});
console.log(response.data[0].embedding.length);Variantes Think
Todos os modelos de chat possuem variantes -think que habilitam raciocinio explicito via cadeia de pensamento (chain-of-thought). O modelo mostra seu raciocinio passo a passo antes de chegar a resposta final.
response = client.chat.completions.create(
model="urso-guto-think",
messages=[
{"role": "user", "content": "Se um trem sai de Sao Paulo as 8h a 120km/h e outro sai do Rio as 9h a 150km/h, quando eles se encontram?"}
]
)Os modelos Think sao recomendados para:
- Problemas matematicos e logicos
- Analise de codigo
- Planejamento e decomposicao de tarefas
- Questoes que exigem raciocinio em multiplas etapas
Tabela de Precos
Precos por 1M de tokens em BRL:
| Modelo | Entrada (R$/1M tokens) | Saida (R$/1M tokens) |
|---|---|---|
urso-mabe | R$ 1,50 | R$ 6,00 |
urso-mabe-think | R$ 1,50 | R$ 6,00 |
urso-guto (em breve) | — | — |
urso-guto-think (em breve) | — | — |
urso-bah (em breve) | — | — |
urso-bah-think (em breve) | — | — |
urso-embed | R$ 0,10 | — |
IDs dos Modelos
Model IDs disponíveis na API:
urso-mabe— Mabe (denso)urso-mabe-think— Mabe com raciocíniourso-embed— Embeddings
Model IDs em breve:
urso-guto— Guto (denso)urso-guto-think— Guto com raciocíniourso-bah— Bah (MoE)urso-bah-think— Bah (MoE) com raciocínio