Model Card

Especificações, usos pretendidos, limitações e considerações éticas dos modelos Urso.

Model Card — Família Urso

Este documento descreve as especificações técnicas, usos pretendidos, limitações e considerações éticas dos modelos de linguagem da família Urso, desenvolvidos pela Polar.

Especificações do Modelo

Arquitetura

Modelo	Arquitetura	Contexto	Status
Urso Mabe (V5)	Dense Transformer, Sub-50B	128K	Disponível
Urso Guto	Dense Transformer	128K	Em breve
Urso Bah	Mixture of Experts	128K	Em breve
Urso Embed	Dense Transformer	8K	Disponível

Treinamento

Pré-treinamento: Corpus multilingual curado com ênfase em PT-BR
SFT: Fine-tuning supervisionado com dados de instrução-resposta para 8 setores brasileiros
Alinhamento: Otimização por preferências com pares de segurança dedicados
Think variants: Treinamento com cadeia de pensamento para raciocínio auditável

Capacidades

Geração e compreensão de texto em português brasileiro e inglês
Raciocínio explícito com variantes Think
Function calling com 7 ferramentas brasileiras nativas
Structured output compatível com OpenAI
Embeddings semânticos otimizados para PT-BR (modelo Embed)
Contexto de 128K tokens para documentos extensos

Uso Pretendido

Usos recomendados

Atendimento ao cliente: Chatbots e assistentes virtuais para empresas brasileiras
Análise de documentos: Leitura, sumarização e extração de informações
Assistência profissional: Suporte a profissionais como ferramenta de apoio
Geração de conteúdo: Redação, tradução e revisão de textos
Educação: Tutoria, explicação de conceitos e material didático
Pesquisa: Análise de dados e síntese de informações

Usos fora do escopo

Os modelos Urso não devem ser usados para:

Diagnóstico médico: Não são substitutos para profissionais de saúde
Aconselhamento jurídico definitivo: Não substituem o julgamento de um advogado
Decisões autônomas com consequências significativas: Decisões que impactam vida, liberdade, emprego ou direitos não devem ser tomadas exclusivamente por IA
Vigilância e monitoramento: Não devem ser usados para vigilância em massa
Geração de conteúdo enganoso: Não devem criar desinformação ou deepfakes
Armas ou atividades ilegais: Não devem facilitar atividades ilegais

Dados de Treinamento

O modelo foi treinado com um corpus curado de bilhões de tokens, otimizado para português brasileiro.

Distribuição linguística

Categoria	Proporção
Português brasileiro (PT-BR)	Majoritário
Inglês (EN)	Secundário
Governo e legal	Complementar
Matemática e ciência	Complementar
Código-fonte	Complementar

Princípios de curadoria

Filtragem educacional e de qualidade rigorosa
Filtragem de toxicidade
Deduplicação para reduzir memorização
Descontaminação contra benchmarks de avaliação
Dados governamentais e legais exclusivamente de domínio público (Art. 8, Lei 9.610/98)
Dados de clientes nunca são utilizados para treinamento

Para detalhes sobre conformidade legal dos dados, consulte a Proveniência de Dados.

Resultados de Avaliação

Urso Mabe — Benchmarks

Benchmark	Score	Questões
ENEM	86,1%	Provas brasileiras
MMLU	81,6%	Conhecimento geral (57 disciplinas)
GSM8K	89,9%	Raciocínio matemático
BELEBELE-PT	93,3%	Compreensão de leitura PT-BR
BBH	76,8%	Raciocínio complexo

Urso Mabe é o modelo brasileiro sub-50B com melhor performance em benchmarks nacionais e internacionais.

Para scores atualizados, consulte Comparar Modelos.

Considerações Éticas

Vieses conhecidos

Como todo modelo de linguagem, os modelos Urso podem refletir vieses presentes nos dados de treinamento. A Polar trabalha continuamente para identificar e mitigar esses vieses.

Medidas de segurança

Guardrails: Sistema de defesa em profundidade com múltiplas camadas de proteção
Alinhamento: Treinamento com preferências de segurança dedicadas
Disclaimers automáticos: Avisos obrigatórios para setores de alto risco (saúde, jurídico)
Monitoramento: Logs e métricas para detecção de comportamentos inesperados
Compliance: Conformidade com LGPD, PL 2338/2023, TSE, ECA e demais legislação brasileira

Limitações

Os modelos podem gerar informações incorretas ou inventadas (alucinações)
Conhecimento limitado aos dados de treinamento (cutoff temporal)
Podem não compreender nuanças culturais de todas as regiões do Brasil
Performance pode variar entre diferentes tipos de tarefas

Canais de Reporte

Canal	Uso
safety@polar.com.br	Vulnerabilidades de segurança, outputs nocivos
dpo@polar.com.br	Questões de privacidade e dados pessoais
dados@polar.com.br	Dados de treinamento e opt-out
suporte@polar.com.br	Suporte geral

Todos os reportes são analisados em até 5 dias úteis. Vulnerabilidades críticas são tratadas em 24 horas.

Atualizações

Este Model Card é atualizado periodicamente. Última atualização: Março 2026.

On this page