Comparar Modelos

Compare os modelos da família Urso Polaris 1 e escolha o ideal para seu caso de uso.

Geração Polaris 1

Três ursos. Um norte. A primeira geração de modelos da Polar, nomeada em homenagem à Estrela do Norte.

Tabela Comparativa

Modelo	Tier	Contexto	Multimodal	Think	Entrada (R$/1M)	Saída (R$/1M)
Urso Bah (em breve)	Flagship	128K	Sim	Sim	—	—
Urso Guto (em breve)	Principal	128K	Sim	Sim	—	—
Urso Mabe	Ultra-rápido	128K	Não	Sim	R$ 1,50	R$ 6,00
Urso Embed	Embeddings	8K	Não	Não	R$ 0,10	—

Benchmarks

Resultados em benchmarks de referência:

Benchmark	Urso Bah	Urso Guto	Urso Mabe
ENEM (PT-BR)	Em breve	Em breve	86,1%
MMLU	Em breve	Em breve	81,6%
GSM8K	Em breve	Em breve	89,9%
BELEBELE-PT	Em breve	Em breve	93,3%
BBH	Em breve	Em breve	76,8%

Benchmarks para Urso Bah e Urso Guto serão publicados junto com o lançamento de cada modelo.

Os modelos -think apresentam ganhos adicionais em benchmarks de raciocínio.

Recomendações por Caso de Uso

Chatbots e Atendimento ao Cliente

Recomendado: Urso Mabe (ultra-rápido)

Velocidade máxima e custo mínimo para interações conversacionais de alto volume. Responde antes de você terminar de perguntar.

response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "system", "content": "Você é um atendente de suporte ao cliente."},
        {"role": "user", "content": "Quero cancelar meu pedido."}
    ],
    temperature=0.7
)

Para chatbots que exigem mais qualidade, o Urso Guto oferece o equilíbrio ideal.

Análise Jurídica e Contratos

Recomendado: Urso Bah ou Urso Bah Think (flagship) (em breve)

A análise jurídica exige compreensão profunda e precisão. O Urso Bah é o flagship — pensa antes de falar, vai fundo. A variante Think mostra o raciocínio jurídico.

response = client.chat.completions.create(
    model="urso-bah-think",
    messages=[
        {"role": "system", "content": "Você é um advogado brasileiro especialista em direito civil."},
        {"role": "user", "content": "Analise se esta cláusula contratual é abusiva segundo o CDC."}
    ],
    temperature=0.2
)

Geração de Conteúdo

Recomendado: Urso Guto ou Urso Bah (Urso Bah em breve)

Para redação de artigos, emails e comunicação profissional. O Urso Guto atende a maioria dos casos; o Urso Bah (flagship) oferece qualidade superior para conteúdo que exige sofisticação.

response = client.chat.completions.create(
    model="urso-guto",
    messages=[
        {"role": "user", "content": "Escreva um email profissional solicitando uma reunião."}
    ],
    temperature=0.8
)

Código e Desenvolvimento

Recomendado: Urso Bah Think (flagship) (em breve)

Para geração, revisão e debugging de código. A variante Think ajuda a decompor problemas complexos passo a passo.

response = client.chat.completions.create(
    model="urso-bah-think",
    messages=[
        {"role": "user", "content": "Implemente uma função de busca binária em Python com tratamento de erros."}
    ],
    temperature=0.1
)

Aplicações de Alto Volume e Baixa Latência

Recomendado: Urso Mabe (ultra-rápido)

Para APIs de alto volume, classificação, extrações e respostas instantâneas.

response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "user", "content": "Classifique este texto como positivo, negativo ou neutro."}
    ],
    temperature=0.0,
    max_tokens=10
)

Busca Semântica e RAG

Recomendado: Urso Embed + Urso Guto

Use o Embed para gerar vetores e o Guto para gerar respostas baseadas nos documentos recuperados.

# 1. Gerar embeddings
embedding_response = client.embeddings.create(
    model="urso-embed",
    input=["Texto do documento para indexar"]
)

# 2. Após recuperar documentos relevantes, gerar resposta
response = client.chat.completions.create(
    model="urso-guto",
    messages=[
        {"role": "system", "content": "Responda com base nos documentos fornecidos."},
        {"role": "user", "content": "Contexto: [documentos recuperados]\n\nPergunta: Qual é a política de devolução?"}
    ]
)

Custo vs. Qualidade

De maneira geral:

Custo mínimo e velocidade máxima: Urso Mabe — ideal para classificação, extrações simples, alto volume
Melhor custo-benefício: Urso Guto — melhor escolha para a maioria das aplicações
Máxima qualidade e raciocínio profundo: Urso Bah (em breve) — para aplicações enterprise e análise especializada

Latência

Estimativas típicas de latência (time-to-first-token):

Modelo	Latência típica
Urso Mabe	~100ms
Urso Guto	~200ms
Urso Bah	~400ms
Urso Embed	~50ms

Variantes Think adicionam latência extra devido ao raciocínio explícito, mas oferecem respostas mais precisas.

On this page