PolarPOLAR

Model Card

Especificações, usos pretendidos, limitações e considerações éticas dos modelos Urso.

Model Card — Família Urso

Este documento descreve as especificações técnicas, usos pretendidos, limitações e considerações éticas dos modelos de linguagem da família Urso, desenvolvidos pela Polar.

Especificações do Modelo

Arquitetura

ModeloArquiteturaContextoStatus
Urso Mabe (V5)Dense Transformer, Sub-50B128KDisponível
Urso GutoDense Transformer128KEm breve
Urso BahMixture of Experts128KEm breve
Urso EmbedDense Transformer8KDisponível

Treinamento

  • Pré-treinamento: Corpus multilingual curado com ênfase em PT-BR
  • SFT: Fine-tuning supervisionado com dados de instrução-resposta para 8 setores brasileiros
  • Alinhamento: Otimização por preferências com pares de segurança dedicados
  • Think variants: Treinamento com cadeia de pensamento para raciocínio auditável

Capacidades

  • Geração e compreensão de texto em português brasileiro e inglês
  • Raciocínio explícito com variantes Think
  • Function calling com 7 ferramentas brasileiras nativas
  • Structured output compatível com OpenAI
  • Embeddings semânticos otimizados para PT-BR (modelo Embed)
  • Contexto de 128K tokens para documentos extensos

Uso Pretendido

Usos recomendados

  • Atendimento ao cliente: Chatbots e assistentes virtuais para empresas brasileiras
  • Análise de documentos: Leitura, sumarização e extração de informações
  • Assistência profissional: Suporte a profissionais como ferramenta de apoio
  • Geração de conteúdo: Redação, tradução e revisão de textos
  • Educação: Tutoria, explicação de conceitos e material didático
  • Pesquisa: Análise de dados e síntese de informações

Usos fora do escopo

Os modelos Urso não devem ser usados para:

  • Diagnóstico médico: Não são substitutos para profissionais de saúde
  • Aconselhamento jurídico definitivo: Não substituem o julgamento de um advogado
  • Decisões autônomas com consequências significativas: Decisões que impactam vida, liberdade, emprego ou direitos não devem ser tomadas exclusivamente por IA
  • Vigilância e monitoramento: Não devem ser usados para vigilância em massa
  • Geração de conteúdo enganoso: Não devem criar desinformação ou deepfakes
  • Armas ou atividades ilegais: Não devem facilitar atividades ilegais

Dados de Treinamento

O modelo foi treinado com um corpus curado de bilhões de tokens, otimizado para português brasileiro.

Distribuição linguística

CategoriaProporção
Português brasileiro (PT-BR)Majoritário
Inglês (EN)Secundário
Governo e legalComplementar
Matemática e ciênciaComplementar
Código-fonteComplementar

Princípios de curadoria

  • Filtragem educacional e de qualidade rigorosa
  • Filtragem de toxicidade
  • Deduplicação para reduzir memorização
  • Descontaminação contra benchmarks de avaliação
  • Dados governamentais e legais exclusivamente de domínio público (Art. 8, Lei 9.610/98)
  • Dados de clientes nunca são utilizados para treinamento

Para detalhes sobre conformidade legal dos dados, consulte a Proveniência de Dados.

Resultados de Avaliação

Urso Mabe — Benchmarks

BenchmarkScoreQuestões
ENEM86,1%Provas brasileiras
MMLU81,6%Conhecimento geral (57 disciplinas)
GSM8K89,9%Raciocínio matemático
BELEBELE-PT93,3%Compreensão de leitura PT-BR
BBH76,8%Raciocínio complexo

Urso Mabe é o modelo brasileiro sub-50B com melhor performance em benchmarks nacionais e internacionais.

Para scores atualizados, consulte Comparar Modelos.

Considerações Éticas

Vieses conhecidos

Como todo modelo de linguagem, os modelos Urso podem refletir vieses presentes nos dados de treinamento. A Polar trabalha continuamente para identificar e mitigar esses vieses.

Medidas de segurança

  • Guardrails: Sistema de defesa em profundidade com múltiplas camadas de proteção
  • Alinhamento: Treinamento com preferências de segurança dedicadas
  • Disclaimers automáticos: Avisos obrigatórios para setores de alto risco (saúde, jurídico)
  • Monitoramento: Logs e métricas para detecção de comportamentos inesperados
  • Compliance: Conformidade com LGPD, PL 2338/2023, TSE, ECA e demais legislação brasileira

Limitações

  • Os modelos podem gerar informações incorretas ou inventadas (alucinações)
  • Conhecimento limitado aos dados de treinamento (cutoff temporal)
  • Podem não compreender nuanças culturais de todas as regiões do Brasil
  • Performance pode variar entre diferentes tipos de tarefas

Canais de Reporte

CanalUso
safety@polar.com.brVulnerabilidades de segurança, outputs nocivos
dpo@polar.com.brQuestões de privacidade e dados pessoais
dados@polar.com.brDados de treinamento e opt-out
suporte@polar.com.brSuporte geral

Todos os reportes são analisados em até 5 dias úteis. Vulnerabilidades críticas são tratadas em 24 horas.

Atualizações

Este Model Card é atualizado periodicamente. Última atualização: Março 2026.

On this page