Model Card
Especificações, usos pretendidos, limitações e considerações éticas dos modelos Urso.
Model Card — Família Urso
Este documento descreve as especificações técnicas, usos pretendidos, limitações e considerações éticas dos modelos de linguagem da família Urso, desenvolvidos pela Polar.
Especificações do Modelo
Arquitetura
| Modelo | Arquitetura | Contexto | Status |
|---|---|---|---|
| Urso Mabe (V5) | Dense Transformer, Sub-50B | 128K | Disponível |
| Urso Guto | Dense Transformer | 128K | Em breve |
| Urso Bah | Mixture of Experts | 128K | Em breve |
| Urso Embed | Dense Transformer | 8K | Disponível |
Treinamento
- Pré-treinamento: Corpus multilingual curado com ênfase em PT-BR
- SFT: Fine-tuning supervisionado com dados de instrução-resposta para 8 setores brasileiros
- Alinhamento: Otimização por preferências com pares de segurança dedicados
- Think variants: Treinamento com cadeia de pensamento para raciocínio auditável
Capacidades
- Geração e compreensão de texto em português brasileiro e inglês
- Raciocínio explícito com variantes Think
- Function calling com 7 ferramentas brasileiras nativas
- Structured output compatível com OpenAI
- Embeddings semânticos otimizados para PT-BR (modelo Embed)
- Contexto de 128K tokens para documentos extensos
Uso Pretendido
Usos recomendados
- Atendimento ao cliente: Chatbots e assistentes virtuais para empresas brasileiras
- Análise de documentos: Leitura, sumarização e extração de informações
- Assistência profissional: Suporte a profissionais como ferramenta de apoio
- Geração de conteúdo: Redação, tradução e revisão de textos
- Educação: Tutoria, explicação de conceitos e material didático
- Pesquisa: Análise de dados e síntese de informações
Usos fora do escopo
Os modelos Urso não devem ser usados para:
- Diagnóstico médico: Não são substitutos para profissionais de saúde
- Aconselhamento jurídico definitivo: Não substituem o julgamento de um advogado
- Decisões autônomas com consequências significativas: Decisões que impactam vida, liberdade, emprego ou direitos não devem ser tomadas exclusivamente por IA
- Vigilância e monitoramento: Não devem ser usados para vigilância em massa
- Geração de conteúdo enganoso: Não devem criar desinformação ou deepfakes
- Armas ou atividades ilegais: Não devem facilitar atividades ilegais
Dados de Treinamento
O modelo foi treinado com um corpus curado de bilhões de tokens, otimizado para português brasileiro.
Distribuição linguística
| Categoria | Proporção |
|---|---|
| Português brasileiro (PT-BR) | Majoritário |
| Inglês (EN) | Secundário |
| Governo e legal | Complementar |
| Matemática e ciência | Complementar |
| Código-fonte | Complementar |
Princípios de curadoria
- Filtragem educacional e de qualidade rigorosa
- Filtragem de toxicidade
- Deduplicação para reduzir memorização
- Descontaminação contra benchmarks de avaliação
- Dados governamentais e legais exclusivamente de domínio público (Art. 8, Lei 9.610/98)
- Dados de clientes nunca são utilizados para treinamento
Para detalhes sobre conformidade legal dos dados, consulte a Proveniência de Dados.
Resultados de Avaliação
Urso Mabe — Benchmarks
| Benchmark | Score | Questões |
|---|---|---|
| ENEM | 86,1% | Provas brasileiras |
| MMLU | 81,6% | Conhecimento geral (57 disciplinas) |
| GSM8K | 89,9% | Raciocínio matemático |
| BELEBELE-PT | 93,3% | Compreensão de leitura PT-BR |
| BBH | 76,8% | Raciocínio complexo |
Urso Mabe é o modelo brasileiro sub-50B com melhor performance em benchmarks nacionais e internacionais.
Para scores atualizados, consulte Comparar Modelos.
Considerações Éticas
Vieses conhecidos
Como todo modelo de linguagem, os modelos Urso podem refletir vieses presentes nos dados de treinamento. A Polar trabalha continuamente para identificar e mitigar esses vieses.
Medidas de segurança
- Guardrails: Sistema de defesa em profundidade com múltiplas camadas de proteção
- Alinhamento: Treinamento com preferências de segurança dedicadas
- Disclaimers automáticos: Avisos obrigatórios para setores de alto risco (saúde, jurídico)
- Monitoramento: Logs e métricas para detecção de comportamentos inesperados
- Compliance: Conformidade com LGPD, PL 2338/2023, TSE, ECA e demais legislação brasileira
Limitações
- Os modelos podem gerar informações incorretas ou inventadas (alucinações)
- Conhecimento limitado aos dados de treinamento (cutoff temporal)
- Podem não compreender nuanças culturais de todas as regiões do Brasil
- Performance pode variar entre diferentes tipos de tarefas
Canais de Reporte
| Canal | Uso |
|---|---|
| safety@polar.com.br | Vulnerabilidades de segurança, outputs nocivos |
| dpo@polar.com.br | Questões de privacidade e dados pessoais |
| dados@polar.com.br | Dados de treinamento e opt-out |
| suporte@polar.com.br | Suporte geral |
Todos os reportes são analisados em até 5 dias úteis. Vulnerabilidades críticas são tratadas em 24 horas.
Atualizações
Este Model Card é atualizado periodicamente. Última atualização: Março 2026.