Comparar Modelos
Compare os modelos da família Urso Polaris 1 e escolha o ideal para seu caso de uso.
Geração Polaris 1
Três ursos. Um norte. A primeira geração de modelos da Polar, nomeada em homenagem à Estrela do Norte.
Tabela Comparativa
| Modelo | Tier | Contexto | Multimodal | Think | Entrada (R$/1M) | Saída (R$/1M) |
|---|---|---|---|---|---|---|
| Urso Bah (em breve) | Flagship | 128K | Sim | Sim | — | — |
| Urso Guto (em breve) | Principal | 128K | Sim | Sim | — | — |
| Urso Mabe | Ultra-rápido | 128K | Não | Sim | R$ 1,50 | R$ 6,00 |
| Urso Embed | Embeddings | 8K | Não | Não | R$ 0,10 | — |
Benchmarks
Resultados em benchmarks de referência:
| Benchmark | Urso Bah | Urso Guto | Urso Mabe |
|---|---|---|---|
| ENEM (PT-BR) | Em breve | Em breve | 86,1% |
| MMLU | Em breve | Em breve | 81,6% |
| GSM8K | Em breve | Em breve | 89,9% |
| BELEBELE-PT | Em breve | Em breve | 93,3% |
| BBH | Em breve | Em breve | 76,8% |
Benchmarks para Urso Bah e Urso Guto serão publicados junto com o lançamento de cada modelo.
Os modelos -think apresentam ganhos adicionais em benchmarks de raciocínio.
Recomendações por Caso de Uso
Chatbots e Atendimento ao Cliente
Recomendado: Urso Mabe (ultra-rápido)
Velocidade máxima e custo mínimo para interações conversacionais de alto volume. Responde antes de você terminar de perguntar.
response = client.chat.completions.create(
model="urso-mabe",
messages=[
{"role": "system", "content": "Você é um atendente de suporte ao cliente."},
{"role": "user", "content": "Quero cancelar meu pedido."}
],
temperature=0.7
)Para chatbots que exigem mais qualidade, o Urso Guto oferece o equilíbrio ideal.
Análise Jurídica e Contratos
Recomendado: Urso Bah ou Urso Bah Think (flagship) (em breve)
A análise jurídica exige compreensão profunda e precisão. O Urso Bah é o flagship — pensa antes de falar, vai fundo. A variante Think mostra o raciocínio jurídico.
response = client.chat.completions.create(
model="urso-bah-think",
messages=[
{"role": "system", "content": "Você é um advogado brasileiro especialista em direito civil."},
{"role": "user", "content": "Analise se esta cláusula contratual é abusiva segundo o CDC."}
],
temperature=0.2
)Geração de Conteúdo
Recomendado: Urso Guto ou Urso Bah (Urso Bah em breve)
Para redação de artigos, emails e comunicação profissional. O Urso Guto atende a maioria dos casos; o Urso Bah (flagship) oferece qualidade superior para conteúdo que exige sofisticação.
response = client.chat.completions.create(
model="urso-guto",
messages=[
{"role": "user", "content": "Escreva um email profissional solicitando uma reunião."}
],
temperature=0.8
)Código e Desenvolvimento
Recomendado: Urso Bah Think (flagship) (em breve)
Para geração, revisão e debugging de código. A variante Think ajuda a decompor problemas complexos passo a passo.
response = client.chat.completions.create(
model="urso-bah-think",
messages=[
{"role": "user", "content": "Implemente uma função de busca binária em Python com tratamento de erros."}
],
temperature=0.1
)Aplicações de Alto Volume e Baixa Latência
Recomendado: Urso Mabe (ultra-rápido)
Para APIs de alto volume, classificação, extrações e respostas instantâneas.
response = client.chat.completions.create(
model="urso-mabe",
messages=[
{"role": "user", "content": "Classifique este texto como positivo, negativo ou neutro."}
],
temperature=0.0,
max_tokens=10
)Busca Semântica e RAG
Recomendado: Urso Embed + Urso Guto
Use o Embed para gerar vetores e o Guto para gerar respostas baseadas nos documentos recuperados.
# 1. Gerar embeddings
embedding_response = client.embeddings.create(
model="urso-embed",
input=["Texto do documento para indexar"]
)
# 2. Após recuperar documentos relevantes, gerar resposta
response = client.chat.completions.create(
model="urso-guto",
messages=[
{"role": "system", "content": "Responda com base nos documentos fornecidos."},
{"role": "user", "content": "Contexto: [documentos recuperados]\n\nPergunta: Qual é a política de devolução?"}
]
)Custo vs. Qualidade
De maneira geral:
- Custo mínimo e velocidade máxima: Urso Mabe — ideal para classificação, extrações simples, alto volume
- Melhor custo-benefício: Urso Guto — melhor escolha para a maioria das aplicações
- Máxima qualidade e raciocínio profundo: Urso Bah (em breve) — para aplicações enterprise e análise especializada
Latência
Estimativas típicas de latência (time-to-first-token):
| Modelo | Latência típica |
|---|---|
| Urso Mabe | ~100ms |
| Urso Guto | ~200ms |
| Urso Bah | ~400ms |
| Urso Embed | ~50ms |
Variantes Think adicionam latência extra devido ao raciocínio explícito, mas oferecem respostas mais precisas.