PolarPOLAR

Comparar Modelos

Compare os modelos da família Urso Polaris 1 e escolha o ideal para seu caso de uso.

Geração Polaris 1

Três ursos. Um norte. A primeira geração de modelos da Polar, nomeada em homenagem à Estrela do Norte.

Tabela Comparativa

ModeloTierContextoMultimodalThinkEntrada (R$/1M)Saída (R$/1M)
Urso Bah (em breve)Flagship128KSimSim
Urso Guto (em breve)Principal128KSimSim
Urso MabeUltra-rápido128KNãoSimR$ 1,50R$ 6,00
Urso EmbedEmbeddings8KNãoNãoR$ 0,10

Benchmarks

Resultados em benchmarks de referência:

BenchmarkUrso BahUrso GutoUrso Mabe
ENEM (PT-BR)Em breveEm breve86,1%
MMLUEm breveEm breve81,6%
GSM8KEm breveEm breve89,9%
BELEBELE-PTEm breveEm breve93,3%
BBHEm breveEm breve76,8%

Benchmarks para Urso Bah e Urso Guto serão publicados junto com o lançamento de cada modelo.

Os modelos -think apresentam ganhos adicionais em benchmarks de raciocínio.

Recomendações por Caso de Uso

Chatbots e Atendimento ao Cliente

Recomendado: Urso Mabe (ultra-rápido)

Velocidade máxima e custo mínimo para interações conversacionais de alto volume. Responde antes de você terminar de perguntar.

response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "system", "content": "Você é um atendente de suporte ao cliente."},
        {"role": "user", "content": "Quero cancelar meu pedido."}
    ],
    temperature=0.7
)

Para chatbots que exigem mais qualidade, o Urso Guto oferece o equilíbrio ideal.

Análise Jurídica e Contratos

Recomendado: Urso Bah ou Urso Bah Think (flagship) (em breve)

A análise jurídica exige compreensão profunda e precisão. O Urso Bah é o flagship — pensa antes de falar, vai fundo. A variante Think mostra o raciocínio jurídico.

response = client.chat.completions.create(
    model="urso-bah-think",
    messages=[
        {"role": "system", "content": "Você é um advogado brasileiro especialista em direito civil."},
        {"role": "user", "content": "Analise se esta cláusula contratual é abusiva segundo o CDC."}
    ],
    temperature=0.2
)

Geração de Conteúdo

Recomendado: Urso Guto ou Urso Bah (Urso Bah em breve)

Para redação de artigos, emails e comunicação profissional. O Urso Guto atende a maioria dos casos; o Urso Bah (flagship) oferece qualidade superior para conteúdo que exige sofisticação.

response = client.chat.completions.create(
    model="urso-guto",
    messages=[
        {"role": "user", "content": "Escreva um email profissional solicitando uma reunião."}
    ],
    temperature=0.8
)

Código e Desenvolvimento

Recomendado: Urso Bah Think (flagship) (em breve)

Para geração, revisão e debugging de código. A variante Think ajuda a decompor problemas complexos passo a passo.

response = client.chat.completions.create(
    model="urso-bah-think",
    messages=[
        {"role": "user", "content": "Implemente uma função de busca binária em Python com tratamento de erros."}
    ],
    temperature=0.1
)

Aplicações de Alto Volume e Baixa Latência

Recomendado: Urso Mabe (ultra-rápido)

Para APIs de alto volume, classificação, extrações e respostas instantâneas.

response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "user", "content": "Classifique este texto como positivo, negativo ou neutro."}
    ],
    temperature=0.0,
    max_tokens=10
)

Busca Semântica e RAG

Recomendado: Urso Embed + Urso Guto

Use o Embed para gerar vetores e o Guto para gerar respostas baseadas nos documentos recuperados.

# 1. Gerar embeddings
embedding_response = client.embeddings.create(
    model="urso-embed",
    input=["Texto do documento para indexar"]
)

# 2. Após recuperar documentos relevantes, gerar resposta
response = client.chat.completions.create(
    model="urso-guto",
    messages=[
        {"role": "system", "content": "Responda com base nos documentos fornecidos."},
        {"role": "user", "content": "Contexto: [documentos recuperados]\n\nPergunta: Qual é a política de devolução?"}
    ]
)

Custo vs. Qualidade

De maneira geral:

  • Custo mínimo e velocidade máxima: Urso Mabe — ideal para classificação, extrações simples, alto volume
  • Melhor custo-benefício: Urso Guto — melhor escolha para a maioria das aplicações
  • Máxima qualidade e raciocínio profundo: Urso Bah (em breve) — para aplicações enterprise e análise especializada

Latência

Estimativas típicas de latência (time-to-first-token):

ModeloLatência típica
Urso Mabe~100ms
Urso Guto~200ms
Urso Bah~400ms
Urso Embed~50ms

Variantes Think adicionam latência extra devido ao raciocínio explícito, mas oferecem respostas mais precisas.

On this page