Model Card
Especificações, usos pretendidos, limitações e considerações éticas dos modelos Urso.
Model Card — Família Urso
Este document descreve as especificações técnicas, usos pretendidos, limitações e considerações éticas dos modelos de linguagem da família Urso, desenvolvidos pela Polar.
Especificações do Modelo
Arquitetura
| Modelo | Arquitetura | Parâmetros totais | Parâmetros ativos | Contexto |
|---|---|---|---|---|
| Urso Lite | Dense Transformer | 3B | 3B | 128K |
| Urso Base | Mixture of Experts | 30B | 6B | 128K |
| Urso Pro | Mixture of Experts | 70B | 14B | 128K |
| Urso Ultra | Mixture of Experts | 200B+ | 30B | 128K |
| Urso Embed | Dense Transformer | — | — | 8K |
Treinamento
- Pré-treinamento: Realizado em corpus multilingual com ênfase em PT-BR (65% dos dados)
- SFT: Fine-tuning supervisionado com dados de alta qualidade em instrução-resposta
- Alinhamento: GRPO (Group Relative Policy Optimization) com preferências humanas
- Think variants: Treinamento adicional com dados de cadeia de pensamento
Capacidades
- Geração e compreensão de texto em português brasileiro e inglês
- Processamento multimodal (imagens, documentos, áudio) nos modelos Base, Pro e Ultra
- Raciocínio explícito com variantes Think
- Function calling e structured output
- Embeddings semânticos (modelo Embed)
Uso Pretendido
Os modelos Urso foram projetados para os seguintes casos de uso:
Usos recomendados
- Atendimento ao cliente: Chatbots e assistentes virtuais para empresas brasileiras
- Análise de documentos: Leitura, sumarização e extração de informações de documentos
- Assistência profissional: Suporte a profissionais em suas tarefas diárias
- Geração de conteúdo: Redação, tradução e revisão de textos
- Desenvolvimento: Geração, revisão e documentação de código
- Educação: Tutoria, explicação de conceitos e geração de material didático
- Pesquisa: Análise de dados, revisão de literatura e síntese de informações
Usos fora do escopo
Os modelos Urso não devem ser usados para:
- Diagnóstico médico: Os modelos não são substitutos para profissionais de saúde e não devem ser usados para diagnóstico, prescrição ou orientação médica
- Aconselhamento jurídico definitivo: Embora possam auxiliar profissionais do direito, não substituem o julgamento de um advogado e não devem ser usados como única fonte de orientação jurídica
- Decisões autônomas com consequências significativas: Decisões que impactam significativamente a vida, liberdade, emprego ou direitos de pessoas não devem ser tomadas exclusivamente por IA
- Vigilância e monitoramento: Não devem ser usados para vigilância em massa ou monitoramento de indivíduos
- Geração de conteúdo enganoso: Não devem ser usados para criar desinformação, deepfakes ou conteúdo que engane deliberadamente
- Armas ou atividades ilegais: Não devem ser usados para desenvolver armas ou facilitar atividades ilegais
Dados de Treinamento
Resumo das fontes
| Fonte | Tokens | Tipo |
|---|---|---|
| GigaVerbo v2 | 320B | Corpus PT-BR curado |
| FineWeb-Edu | 1.3T | Web educacional filtrado |
| The Stack v2 | 900B | Código-fonte |
| Wikipedia PT | — | Enciclopédia |
| CulturaX | — | Corpus multilingual |
| Legislação e jurisprudência brasileira | — | Governo e direito |
Distribuição linguística
- 65% Português brasileiro (PT-BR)
- 17% Inglês (EN)
- 8% Governo e legal
- 6% Matemática e ciência
- 4% Código-fonte
Para detalhes completos sobre proveniência de dados, consulte a Proveniência de Dados.
Resultados de Avaliação
Os modelos Urso são avaliados continuamente em benchmarks de referência. Resultados detalhados serão publicados em relatórios técnicos periódicos.
Benchmarks principais:
- ENEM (vestibular brasileiro)
- OAB (Exame da Ordem dos Advogados)
- MMLU adaptado para PT-BR
- HumanEval (geração de código)
- MT-Bench adaptado para PT-BR
- MATH (raciocínio matemático)
Para scores atualizados, consulte Comparar Modelos.
Considerações Éticas
Vieses conhecidos
Como todo modelo de linguagem treinado em dados da internet, os modelos Urso podem refletir vieses presentes nos dados de treinamento, incluindo vieses de gênero, raça, região e socioeconômicos. A Polar trabalha continuamente para identificar e mitigar esses vieses.
Medidas de segurança
- Filtros de conteúdo: Sistemas de filtragem para bloquear conteúdo tóxico, prejudicial ou ilegal
- Alinhamento: Treinamento com GRPO para alinhar respostas com valores humanos
- Red teaming: Avaliação adversarial contínua por equipes internas e externas
- Monitoramento: Logs e métricas para detectar comportamentos inesperados em produção
- Rate limiting: Limites de taxa para prevenir abuso
Limitações
- Os modelos podem gerar informações incorretas ou inventadas (alucinações)
- Conhecimento limitado a dados de treinamento (cutoff temporal)
- Podem não entender corretamente nuanças culturais de todas as regiões do Brasil
- Performance pode variar significativamente entre diferentes tipos de tarefas
- Modelos menores (Lite) têm capacidades mais limitadas
Canais de Reporte
Para reportar problemas de segurança, vieses ou comportamentos inadequados:
- Segurança: safety@polar.com.br
- Proteção de dados (DPO): dpo@polar.com.br
- Suporte geral: suporte@polar.com.br
Levamos todos os reportes a sério e respondemos em até 48 horas úteis.
Atualizações
Este Model Card é atualizado periodicamente conforme novos dados de avaliação e melhorias são implementados. Última atualização: Março 2026.