Aula 05 — Governança & Ética de Dados (o ponto que o concorrente larga no chão)

Sou o Camilo, teu professor de TI. Esta aula é o bloco de baixa concorrência da Fluência: enquanto o adversário queima energia decorando SQL, aqui mora um punhado de pontos que ele deixa em branco — e que o edital do CE nomeia com nome e sobrenome. Pega firme nos dois alvos (governança e viés) e pega leve no resto. É aula de decoreba certeira, não de oceano.


🩸 Por que ESTA aula vale ouro


🏅 Depoimento de aprovado

Gabriel Santana — 1º lugar SEFAZ-GO 2026 (banca FCC). (GO é o espelho do edital do CE — mesma banca, edital reciclado.)


🗺️ MINI-MAPA DA SÉRIE — onde esta aula mora

Aula Tema 💰 Onde está o ponto
00 ✅ Fundamentos (tipos de dado, DIKW, ciclo de vida) 🛡️ blindagem — base + mapa
01 ✅ CRISP-DM (as 6 fases na ordem) 🥉 alto — campeão recorrente
02 Arquitetura & Eng. de Dados (DW/Lake/Lakehouse, ETL×ELT, OLAP, DAG) 🥈 ouro
03 Banco de Dados & SQL (relacional, normalização, NoSQL, SQL na mão) 🥇 OURO
04 Machine Learning & IA (sup×não-sup, clusterização, over/underfit, Lasso/Ridge) 👑 O OURO MÁXIMO (7 de 11 em SP)
05 ⬅️ (esta) Governança & Ética de Dados (governança, qualidade, viés, ética IA, IA generativa) 🟡 médio — mas BAIXA concorrência + edital literal
06 Segurança / LGPD / Sigilo Fiscal (CID, LGPD, CTN 198 + IN SEFAZ-CE 92/21) 🟡 médio — ponto nomeado
07 Python / Pandas / NumPy (leitura de código) 👻 órfão eliminatório (hedge)

🔑 Leitura do mapa: esta Aula 05 é "médio" no volume de questões, mas é o bloco com a MAIOR especificidade de edital (o CE nomeia 3 tipos + 5 vieses + 7 termos) e a MENOR concorrência (ninguém domina). É o oposto do ML: lá tem muita questão e muito concorrente; aqui tem pouca questão e pouco concorrente. ROI alto pra quem decora a tabela certa.


O PLACAR DOS PROFESSORES (faro FCC — neste bloco)

Estes são os professores que a gente "ouviu" pra montar a munição. Eles são INSUMO — a palavra final é minha. Faro = quão bem cada um cobriu o que a FCC 2026 cobrou neste bloco (governança/viés caíram em SP — prova que JÁ aconteceu).

Prof Faro neste bloco Confie nele para...
Felipe Mathias 9/10 decodificou a governança (votação=colegiada × DAMA=federada) e o viés × alucinação — a melhor leitura do bloco
Equipe Simulado CE (Lucas Ian) 9/10 munição de elite que NINGUÉM mais deu: XAI (LIME × SHAP), privacidade diferencial, explicabilidade × interpretabilidade
Equipe Véspera TIC 8/10 os 5 tipos de viés FCC 2026 (transcrição literal) + "governança federada/colegiada"
Renato da Costa (prof da reta final do CE no Estratégia) 7/10 ética em IA (alucinação/caso do juiz, transparência/caixa-preta, viés/gestão urbana) e IA generativa — ⚠️ ver alerta
Lucas Ianni 6/10 viés dentro do núcleo de Ciência de Dados/IA

⚠️ HONESTIDADE OBRIGATÓRIA: o Renato é o prof da reta final do CE no Estratégia e dá ética/IA generativa muito bem (caso do juiz, caixa-preta, viés histórico). MAS ele NÃO cobre os 3 tipos de governança do edital — ele toca governança só pelo lado da ética/LGPD. 🧭 Tradução do Camilo: uso o Renato pro miolo ético (ele é ótimo nisso), o Mathias pra decodificar os modelos de governança, e o Simulado CE pra munição de elite (XAI). O que nenhum deles entrega completo, eu fecho aqui — começando pelos 3 tipos de governança, que é o ALVO específico do CE.


🧠 BIZU DA BANCA — como a FCC pensa Governança & Ética

🔑 Bordão da aula: na FCC, governança e ética não se decoram soltas — você acha a palavra-gatilho no caso fiscal e crava o modelo.


📑 SUMÁRIO — os 5 blocos desta aula

  1. Bloco 1 — Governança de dados 🔴 o ALVO específico do CE: os 3 tipos do edital (centralizada · compartilhada · colegiada — sem federada!), DAMA-DMBOK, papéis (owner/steward/custodian).

  2. Bloco 2 — Qualidade de dados 🟡 as 6 dimensões (completude, acurácia, consistência, atualidade, unicidade, validade) + MDM (dados mestres) — ancorado na questão real de pré-processamento.

  3. Bloco 3 — Viés algorítmico 🔴 o 2º alvo quente: os 5 tipos de viés FCC 2026, fairness, e a questão real que caiu em SP.

  4. Bloco 4 — Ética em IA 🟡 os 7 termos do edital (transparência · responsabilidade · explicabilidade · privacidade · segurança · alucinação · viés) + a munição de elite (XAI: LIME × SHAP).

  5. Bloco 5 — IA generativa 🟡 LLM/transformers, alucinação, RAG, deepfake, uso responsável — o tema moderno que o edital nomeia.


▶️ Próximo (Bloco 1): o alvo nº 1 do CE — os 3 tipos de governança, ancorados no caso do comitê de dados da SEFAZ (exatamente o cenário que caiu em SP). É a decoreba que rende ponto de graça. Bora.


Bloco 1 — GOVERNANÇA DE DADOS (o ALVO específico do CE 🔴)

🎯 O que travar neste bloco (só isso):

🔴 PROBABILIDADE PRO CE: ALTA. Caiu em SP 2026 ⚡ (Q3710), está literal no edital (os 3 tipos nomeados) e foi órfã — ninguém domina. É o tema com os 3 sinais batendo. Se você só tem tempo pra UM tema desta aula, é este.


🎬 Caso prático — o comitê de dados da SEFAZ (o cenário que caiu)

A SEFAZ tem 3 áreas que mexem com dado tributário: Fiscalização (onde o Guilherme trabalha), Arrecadação e TI. Cada uma cuidava do dado do seu jeito — padrões de qualidade diferentes, políticas de acesso diferentes, metadados diferentes. Resultado: as análises não batiam (a Fiscalização dizia uma coisa, a Arrecadação outra, porque o mesmo "contribuinte" estava cadastrado de 3 jeitos).

A alta administração decidiu organizar a casa. E aqui está o pulo do gato — o JEITO de organizar tem nome, e é isso que a FCC pergunta:

Como a SEFAZ resolveu... O nome do modelo é... A palavra-gatilho
Criou UMA diretoria central que manda em todos os dados de todas as áreas CENTRALIZADA "concentra num único órgão"
Deixou cada área (Fiscalização, Arrecadação, TI) cuidar do seu próprio dado, com autonomia DESCENTRALIZADA "cada área decide sozinha"
Dividiu o trabalho: TI cuida da infraestrutura, as áreas de negócio definem as regras COMPARTILHADA "distribui responsabilidades entre TI e negócio"
Criou um COMITÊ com representantes das 3 áreas que se reúnem e decidem por votação COLEGIADA "votação / comitê / quórum / deliberação coletiva"

A sacada: a SEFAZ montou o comitê que vota → é COLEGIADA. Foi isso, palavra por palavra, que caiu em SP. O Guilherme não escolhe o modelo — mas você, na prova, tem que reconhecer qual é pela descrição.


🧊 OS TIPOS DE GOVERNANÇA — caixa-mãe (decore esta tabela)

Modelo Quem manda Imagem mental No edital do CE?
Centralizada 1 órgão/diretoria central define tudo pra todos "o quartel-general único" SIM
Compartilhada responsabilidade dividida entre TI (infra) e negócio (regras) "TI constrói a estrada, o negócio dirige" SIM
Colegiada comitê de representantes decide por VOTAÇÃO/consenso "o conselho que vota" SIM
Federada centraliza padrões + descentraliza operação (modelo DAMA) "regras únicas, execução local" NÃO — fora do rol do CE

🔑 A REGRA DE OURO (cole na parede):


⚠️ A POLÊMICA QUE VALE OURO (o que separa o aprovado) — Mathias decodificou

A questão de SP (Q3710) tinha um detalhe maldoso: o cenário misturava "comitê que vota" (cara de colegiada) COM "padrões corporativos mínimos + autonomia operacional de cada área" (cara de federada, pela doutrina DAMA-DMBOK). Pela doutrina pura, muita gente marcaria federada.

A leitura do Camilo (pra você não cair): o gabarito oficial foi colegiada (B), e o Mathias acertou a lógica: "pelo DAMA-DMBOK isso seria federada, MAS a decisão por quórum/votação puxa pra colegiada — e o EDITAL desempata: a banca só listou centralizada/compartilhada/colegiada, então 'federada' não está na mesa."


👥 Os 3 PAPÉIS da governança (DAMA-DMBOK) — decoreba rápida

A governança define quem responde pelo dado. São 3 papéis que a FCC adora confundir:

🧊 OS 3 PAPÉIS — quem é quem

Papel Quem é O que faz Analogia
Data Owner (proprietário) o gestor de negócio (ex.: o coordenador da Fiscalização) RESPONDE pelo dado, define quem acessa, aprova políticas o dono do carro
Data Steward (curador/zelador) um servidor designado pra cuidar da qualidade daquele domínio ZELA pela qualidade, padroniza, resolve inconsistência, documenta o motorista que cuida e dirige
Data Custodian (custodiante) a TI GUARDA tecnicamente: backup, segurança, infraestrutura, acesso físico o mecânico/garagem

🔑 Bizu: Owner RESPONDE (negócio) · Steward ZELA pela qualidade · Custodian GUARDA (TI). A pegadinha clássica é trocar steward (cuida da qualidade, é de negócio/dados) com custodian (cuida da infra, é de TI). Steward ≠ TI.


O PLACAR DOS PROFESSORES — Governança de dados

Leitura do Camilo: este é o tema mais órfão do bloco — caiu em SP e nenhum dos 7 profs tinha isolado os modelos antes da prova. Quem brilhou foi o Mathias na decodificação pós-prova.

Prof Apostou? Veredito O que disse / fez
Felipe Mathias ⚠️ decodificou 🎯 acertou a lógica "votação/quórum = colegiada; pelo DAMA seria federada, mas o EDITAL desempata → B" — a melhor leitura
Equipe Véspera TIC ⚠️ de passagem ⚠️ parcial citou "governança federada/colegiada" como "assunto inédito/diferentão", sem isolar os 4
Simulado CE (Manuela) ✅ ângulo operacional 🔮 aposta CE cobriu o lado operacional: catalogação, linhagem ("árvore genealógica do dado"), deduplicação, glossário/metadados
Renato da Costa (prof do CE) ❌ não cobre os tipos ⚪ não cobriu toca governança só via ética/LGPD — ponto-cego do curso do CE

A leitura do Camilo: confia no Mathias pra lógica (votação = colegiada) e decore a especificidade do edital do CE (só 3 tipos). É aposta 🔮 pro CE (a prova não aconteceu), mas é a aposta com mais lastro do bloco: caiu igual em SP, está literal no edital, e ninguém estuda. Ponto de graça.


🎯 QUESTÃO REAL — o comitê que vota (caiu de verdade ✅)

🎯 Questão — teste agora
FCC — SEFAZ-SP · 2026 · tec 3847060
1 toque = candidata · 2 toques = riscar (eliminei)

Uma Secretaria da Fazenda Estadual está reestruturando seu modelo de governança de dados fiscais. Atualmente, três áreas distintas gerenciam dados tributários: a Coordenadoria de Fiscalização, a Subsecretaria de Arrecadação e a Diretoria de Tecnologia da Informação. Cada área mantém seus próprios padrões de qualidade, políticas de acesso e definições de metadados, gerando inconsistências nas análises. Para resolver o problema, a alta administração decidiu criar uma estrutura de governança onde representantes das três áreas se reúnem periodicamente para deliberar sobre políticas, padrões e prioridades relacionadas aos dados tributários. As decisões sobre frameworks de qualidade, taxonomias de metadados e diretrizes de acesso são tomadas através de votação pelos membros, com cada área tendo poder de voto proporcional ao volume de dados sob sua responsabilidade. Adicionalmente, foram estabelecidos padrões corporativos mínimos obrigatórios, enquanto cada área mantém autonomia para decisões operacionais específicas de seus processos internos, desde que em conformidade com os padrões aprovados pelo grupo deliberativo. Nesse caso, a governança de dados implementada foi


🪤 AS 3 PEGADINHAS QUE DECIDEM A QUESTÃO (a FCC repete essas)

  1. Federada disfarçada de colegiada. A banca descreve "padrões centrais + autonomia local" (federada da DAMA) num cenário de votação. No CE, o gatilho da votação manda: COLEGIADA. E federada não é resposta possível.

  2. Colegiada × descentralizada. Ambas "distribuem" — mas colegiada tem comitê + padrão comum votado; descentralizada é cada um por si, sem padrão comum. A presença de "padrões corporativos obrigatórios" mata a descentralizada.

  3. Steward × Custodian (os papéis). Steward zela pela qualidade (negócio/dados); Custodian guarda a infra (TI). A banca troca os dois. Steward não é TI.


🔗 CONEXÃO — não é ilha


🧊 GUARDE NO BOLSO (Bloco 1)


➡️ Próximo (Bloco 2): governança define quem cuida do dado; agora vamos ver o que é cuidar bem — as dimensões de qualidade do dado (completude, acurácia, consistência...) e os dados mestres (MDM), ancorados na questão real de pré-processamento que caiu em SP.


Bloco 2 — QUALIDADE DE DADOS & DADOS MESTRES (MDM) 🟡

🧭 Combinado de honestidade (leia antes): qualidade de dados não caiu como questão pura nas 3 provas (MT/GO/SP 2026) — ela aparece embutida na questão de pré-processamento (SP Q3716). É blindagem barata + conceito-ferramenta: você decora as dimensões em 15 min e usa elas pra resolver questão de preparação de dados (que CAI). Pega leve, mas não pula — porque o edital pede "qualidade" e o conceito te ajuda no ML.


As dimensões da qualidade — o "exame de saúde" do dado

Caso da mesa do Guilherme: chegou uma base de 2,3 milhões de declarações fiscais pra ele analisar. Antes de cruzar nada, ele faz o check-up da base — e cada problema que ele acha tem um nome de dimensão:

🧊 AS 6 DIMENSÕES DA QUALIDADE (decore com 1 exemplo cada)

Dimensão Pergunta que ela responde O problema na base da DABOA
Completude falta dado? (campo vazio) 12% dos registros com campo obrigatório vazio
Acurácia (exatidão) o dado está correto / bate com a realidade? CNPJ que não existe na Receita
Consistência o mesmo dado bate entre as bases? "Simples Nacional" na base A × "SIMPLES NACIONAL" na base B
Atualidade (vigência) o dado está atual ou velho? endereço de 2015 num cadastro de 2026
Unicidade tem duplicata? a mesma NF-e cadastrada 2×
Validade (conformidade) o dado respeita o formato/regra? data escrita "32/13/2026"

🔑 Bizu colável: Completude (falta?) · Acurácia (certo?) · Consistência (bate?) · Atualidade (velho?) · Unicidade (repetido?) · Validade (formato ok?). A literatura varia de 4 a 8 dimensões — não brigue com o número exato; decore as 6 mais cobradas e o que cada uma significa.


📦 MDM — Master Data Management (gestão de dados mestres)

O problema: "contribuinte" aparece em 3 sistemas da SEFAZ com 3 grafias. Qual é a versão oficial? O MDM (Gestão de Dados Mestres) resolve isso.

🧊 CONCEITO — Dados Mestres (MDM)

Dado mestre = o dado central, estável e compartilhado entre vários sistemas (cliente, produto, contribuinte, fornecedor). Não é transação ("vendeu R$80 mil") — é a entidade que participa das transações ("a empresa DABOA"). MDM (Master Data Management) = a disciplina que cria uma fonte única da verdade (golden record): uma versão oficial, limpa e deduplicada do dado mestre, usada por todos os sistemas. 🔑 Macete: dado mestre = a ENTIDADE (contribuinte, produto); dado transacional = o EVENTO (a venda, a NF-e). MDM = "um cadastro de contribuinte só, oficial pra SEFAZ inteira".


O PLACAR DOS PROFESSORES — Qualidade de dados

Leitura do Camilo: ninguém isolou "dimensões de qualidade" como aposta forte — porque a FCC cobra isso dentro de pré-processamento (que é Aula 2/arquitetura). O Renato dá o pano de fundo (pré-processamento, tratamento de nulos/outliers) e o Mathias/Emannuelle cobrem a limpeza. Veredito honesto: qualidade não caiu pura em 2026; é 🟡 blindagem que sustenta a questão de preparação de dados.


🎯 QUESTÃO REAL — a limpeza da base (qualidade aplicada, caiu ✅)

🎯 Questão — teste agora
FCC — SEFAZ-SP 2026 · tec 3847053
1 toque = candidata · 2 toques = riscar (eliminei)

Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AAAA, AAAA-MM-DD), campos obrigatórios vazios em aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devido a erros de digitação (ex: "Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico. Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é


🔗 CONEXÃO — não é ilha


🧊 GUARDE NO BOLSO (Bloco 2)


➡️ Próximo (Bloco 3): o 2º alvo quente da aula — o viés algorítmico, o tema que caiu quentinho em SP e que o edital nomeia. Você vai ver o modelo de risco da SEFAZ discriminar o contribuinte porque aprendeu errado com o passado.


Bloco 3 — VIÉS ALGORÍTMICO (o 2º ALVO quente 🔴)

🎯 O que travar neste bloco (só isso):

🔴 PROBABILIDADE PRO CE: ALTA. Caiu em SP 2026 ⚡ (Q3714), está literal no edital ("Viés") e está em alta na FCC. É o tema ético que mais pontua.


🎬 Caso prático — o modelo de risco que discrimina o setor

A SEFAZ ligou uma IA pra classificar declarações por risco de fraude. Depois de 6 meses, o Guilherme percebe algo errado: o modelo dá risco alto pra empresas de certos setores, mesmo quando os números financeiros são iguais aos de outros setores com risco baixo.

Investigando, ele descobre a causa: a base histórica de treino tinha mais autuações naqueles setores — não porque eles fraudam mais, mas porque a fiscalização do passado mirou mais neles (decisão humana antiga). O modelo aprendeu esse padrão torto e o perpetuou: "esse setor sempre foi autuado → logo é suspeito".

A sacada: o algoritmo não inventou nada — ele espelhou uma injustiça que já estava nos dados. Lixo histórico entra → discriminação sistemática sai, com aparência de objetividade. Isso é VIÉS ALGORÍTMICO. Esse cenário caiu em SP quase palavra por palavra — você resolve já já.


🧊 CONCEITO — Viés Algorítmico

Viés = distorção sistemática no modelo que gera resultados injustos/discriminatórios contra um grupo, sem justificativa técnica objetiva. A origem está nos DADOS de treino (dados tendenciosos, incompletos ou não representativos), não numa "intenção" do algoritmo. 🔑 Palavra-chave FCC: "reproduz/perpetua o padrão dos dados de treinamento" → é viés. Fairness (equidade/justiça algorítmica) = o objetivo oposto: garantir que o modelo não discrimine.


🧊 OS 5 TIPOS DE VIÉS — FCC 2026 (Véspera TIC transcreveu; decore 1 exemplo cada)

Tipo de viés O que é Exemplo fiscal
Automação confiar cego na saída da IA, sem revisão humana auditor autua só porque "o sistema mandou", sem conferir
Domínio o contexto de treino ≠ contexto de uso modelo treinado com dados de SP aplicado no CE sem ajuste
Exclusão grupos ficaram de fora do dataset MEIs não entraram na base → modelo ignora o perfil deles
Representação a base não reflete a diversidade real só grandes empresas no treino → erra com as pequenas
Amostragem os dados não foram coletados aleatoriamente só notas de um período/região → enviesa o aprendizado

🔑 Bizu: o caso da SEFAZ (fiscalização do passado mirou um setor) é viés de representação/histórico — a base não representa a realidade, representa a decisão humana antiga. A FCC vive trocando esses 5 nomes entre si — decore o que cada um significa, não só a lista.


O PLACAR DOS PROFESSORES — Viés algorítmico

Leitura do Camilo: aqui os bons pegaram e o tema está claramente em alta.

Prof Apostou? Veredito O que disse (literal do dossiê)
Equipe Véspera TIC ✅ forte 🎯 CRAVOU transcreveu os 5 vieses FCC + "questão fresquinha, pode ter algo na prova de vocês" (caiu igual → "quem errou toma tapa na orelha")
Renato da Costa (prof do CE) 🎯 cravou o caso "se o modelo foi criado com dados tendenciosos, pode ser discriminatório" · caso da gestão urbana: IA reproduz padrões discriminatórios dos dados históricos → exige monitoramento contínuo
Felipe Mathias 🎯 cravou bloco viés × alucinação na ética em IA
Lucas Ianni 🎯 tema viés dentro do núcleo de Ciência de Dados/IA

A leitura do Camilo: confia no Renato (caso pronto + ele é o prof do CE) e na Véspera TIC (os 5 tipos). O viés é o eixo ético que CAI — a SP plantou e o edital nomeia. Decora os 5 tipos e a fronteira com alucinação e você crava.


🎯 QUESTÃO REAL — o modelo que discrimina (caiu de verdade ✅)

🎯 Questão — teste agora
FCC — SEFAZ-SP · 2026 · tec 3847055
1 toque = candidata · 2 toques = riscar (eliminei)

Determinada Secretaria da Fazenda implementou um sistema de IA para classificar automaticamente declarações fiscais quanto ao risco de irregularidade. Após seis meses de operação, auditores identificaram que o modelo estava atribuindo pontuações de risco sistematicamente mais altas para empresas de setores específicos, mesmo quando os indicadores financeiros eram similares aos de outros setores com pontuações menores. A análise técnica revelou que a base de dados histórica utilizada no treinamento continha proporcionalmente mais autuações em determinados setores devido a fiscalizações direcionadas realizadas no passado, e não necessariamente por maior incidência real de irregularidades. O modelo aprendeu e perpetuou esse padrão desproporcional. O problema de governança e ética em IA que está caracterizado nessa situação é:


🪤 AS PEGADINHAS QUE DECIDEM A QUESTÃO

  1. VIÉS × ALUCINAÇÃO (a pegadinha-rei do bloco): viés = reproduz padrão (injusto) que existe nos dados; alucinação = inventa fato que não existe. A SP plantou alucinação como distrator (letra D).

  2. Viés × falta de explicabilidade: viés é o conteúdo torto do aprendizado; explicabilidade é não conseguir justificar a saída. Pode coexistir, mas a questão pede o problema caracterizado — se a causa descrita é o treino enviesado, é viés.

  3. A origem do viés está nos DADOS, não no algoritmo. Se a alternativa disser "o algoritmo é intencionalmente discriminatório" → quase sempre falso; o algoritmo é neutro, os dados o ensinaram torto.


🔗 CONEXÃO — não é ilha


🧊 GUARDE NO BOLSO (Bloco 3)


➡️ Próximo (Bloco 4): subimos do viés pra moldura ética inteira — os 7 termos que o edital do CE nomeia (transparência, responsabilidade, explicabilidade...) + a munição de elite que só o Simulado CE deu (XAI: LIME × SHAP).


Bloco 4 — ÉTICA EM IA (os 7 termos do edital 🟡)

🧭 Combinado de honestidade: o único termo que CAIU isolado em 2026 foi viés (Bloco 3). Os outros 6 (transparência, responsabilidade, explicabilidade, privacidade, segurança, alucinação) não caíram puros nas 3 provas — mas o edital do CE nomeia os 7, LITERAL, e é mais detalhado que o que a FCC já cobrou. Tradução: a banca pode estrear transparência/explicabilidade/alucinação puras no CE. É blindagem barata de alto valor — decora os 7 numa olhada e segue. Pega leve, mas cobre.


Os 7 termos do edital — mapeados 1:1

O edital do CE lista, nesta ordem: "Transparência, Responsabilidade, Explicabilidade, Privacidade, Segurança, Alucinação, Viés". Decore o que cada um significa:

🧊 OS 7 TERMOS DA ÉTICA EM IA (a sequência do edital CE)

# Termo O que é (1 frase) Pegadinha / no Fisco
1 Transparência saber que há uma IA decidindo e quais dados/variáveis ela usa o contribuinte tem direito de saber que um algoritmo o classificou
2 Responsabilidade (accountability) alguém responde pela decisão da IA — a responsabilidade é do HOMEM, não da máquina o auditor responde pelo auto (inclusive perante a juíza Bia), mesmo que a IA tenha sugerido
3 Explicabilidade conseguir justificar o PORQUÊ da saída (≠ caixa-preta) o eixo jurídico do auditor: decisão automatizada precisa de justificativa pra valer
4 Privacidade proteger dado pessoal/sensível (LGPD, anonimização) sigilo fiscal — liga com CTN 198 (Aula 6)
5 Segurança proteger o modelo e os dados contra ataque/vazamento CID — liga com a Aula 6
6 Alucinação a IA inventa um fato falso, mas convincente o caso do juiz com jurisprudência inexistente
7 Viés reproduz distorção discriminatória do treino Bloco 3 (o alvo quente)

🔑 Bizu pro auditor: o termo de ouro pra você é a explicabilidade — um modelo de risco que não explica por que marcou o contribuinte não tem validade jurídica num processo. "Caixa-preta" é o inimigo.


🧊 ZOOM — Explicabilidade × Interpretabilidade × Transparência (a FCC mistura)


💎 MUNIÇÃO DE ELITE (só o Simulado CE deu — ninguém mais)

O Simulado TI do CE (Lucas Ian) entregou a munição mais cirúrgica do bloco — XAI (eXplainable AI), as técnicas que abrem a caixa-preta. Se a banca estrear isso, só quem viu aqui pega:

Técnica O que faz Pegadinha FCC
LIME explica uma previsão criando um modelo simples (surrogate) na vizinhança daquele exemplo — é agnóstico (serve pra qualquer modelo) é explicação local (de 1 caso)
SHAP mede a contribuição de cada variável pra previsão; dá explicação local E global 🪤 dizer que SHAP é "exclusivamente local" = ERRADO (ele também é global)
Privacidade diferencial adiciona ruído/aleatoriedade às estatísticas agregadas pra proteger o indivíduo na base técnica de privacidade, não de explicabilidade

O PLACAR DOS PROFESSORES — Ética em IA

Leitura do Camilo: ética entrou na prova via viés (Q3714). O resto é blindagem — mas o edital do CE detalha os 7 termos, então a banca pode estrear os puros.

Prof Apostou? Veredito O que entregou
Simulado CE (Lucas Ian) ✅ cirúrgico 🔮 aposta de elite XAI (LIME × SHAP), privacidade diferencial, explicabilidade × interpretabilidade — único a dar
Renato da Costa (prof do CE) 🎯 ética bem dada alucinação (caso do juiz→CNJ), caixa-preta, "responsabilidade do uso é do HOMEM", IA transparente, explicável e auditável
Felipe Mathias 🔮 aposta discursiva IA generativa como tema nº2 de discursiva — Cartilha de IA Generativa do Gov. Federal ("a FCC tira questões DAQUI")
André Castro ⚠️ ⚠️ parcial alertou "bancas usam IA" — confirmou em tom, não em questão

JÁ CAIU (fato): dos 7 termos, só VIÉS caiu isolado (SP Q3714) — você resolveu no Bloco 3. 🔮 APOSTA pro CE: os outros 6 são plausíveis porque o edital nomeia os 7 e é mais detalhado que a prova já cobrada. A munição de XAI/privacidade diferencial é o ponto-cego de todo mundo — ninguém além do Simulado CE entregou.


⚖️ NOTA DE HONESTIDADE (anti-invenção): este bloco não traz badge de questão porque, conferido no banco, não existe questão FCC 2026 isolada de explicabilidade/transparência/alucinação/responsabilidade nas safras fiscais (MT/GO/SP) — todas essas apareceram como distrator dentro da Q3714 (viés). Por isso o selo é 🟡 blindagem barata: decora os 7 termos + XAI, e segue. A questão que CAI deste eixo é a de viés (Bloco 3).


🔗 CONEXÃO — não é ilha


🧊 GUARDE NO BOLSO (Bloco 4)


➡️ Próximo (Bloco 5): o tema moderno que fecha a aula — IA generativa (LLM, ChatGPT/Gemini, transformers, alucinação, RAG, deepfake). O edital nomeia, a FCC adora novidade — blindagem que pode virar ponto.


Bloco 5 — IA GENERATIVA (o tema moderno 🟡)

🧭 Combinado de honestidade: IA generativa não caiu pura nas 3 provas fiscais de 2026 — mas é novidade quente que a FCC recente cobra (TRF-4 2025 ⚡: riscos da IA generativa, gab D) e o edital do CE nomeia. É 🟡 blindagem barata moderna: entende os conceitos, decora a fronteira com alucinação, e segue. A banca AMA tema novo.


🎬 Caso prático — o assistente que ajuda (e o que mente)

O Guilherme usa um ChatGPT/Copilot pra resumir um relatório fiscal de 200 páginas. Funciona lindo. Mas quando ele pede "me cite a jurisprudência sobre X", a IA responde com um acórdão que NÃO EXISTE — número, ementa, tudo inventado, mas convincente. Caso real que o Renato conta: um juiz sentenciou com jurisprudências inexistentes geradas por IA → foi parar no CNJ.

A sacada: a IA generativa é poderosa pra criar conteúdo novo, mas pode alucinar — inventar fato falso com cara de verdade. Por isso a responsabilidade é SEMPRE do humano que usa.


🧊 CONCEITO — IA Generativa, LLM e Transformers


🧊 OS RISCOS DA IA GENERATIVA (o que a FCC cobra)

Risco O que é
Alucinação inventa fato falso, convincente, sem correspondência com a verdade
Desinformação / deepfake conteúdo falso em escala (risco apontado nos dossiês via TRF-4 2025)
Violação de direitos autorais treino/saída com material protegido
Viés reproduz preconceito dos dados de treino (Bloco 3)
Privacidade vazamento de dado pessoal usado no treino/prompt

🔑 Uso responsável: IA generativa = ferramenta de apoio, com humano no controle e revisão obrigatória. A responsabilidade jurídica nunca é da máquina.


O PLACAR DOS PROFESSORES — IA generativa

Prof Apostou? Veredito O que disse
Renato da Costa (prof do CE) 🎯 deu bem "IA generativa = ChatGPT, Gemini, Claude, Copilot — gera CONTEÚDO NOVO" · alucinação (caso do juiz→CNJ) · "LLM = processamento e compreensão de linguagem natural"
Felipe Mathias 🔮 aposta discursiva Cartilha de IA Generativa do Gov. Federal"a FCC tira questões DAQUI"
Equipe Simulado CE 🔮 aposta avançada transformers encoder/decoder, decoder-only (GPT) = generativo autorregressivo

📌 REFERÊNCIA (fora das 3 fiscais, sem badge no banco): segundo os dossiês de reta-final, a TRF-4 2025 (FCC) teria cobrado riscos da IA generativa (desinformação + violação de direitos autorais). ⚠️ Não tenho essa questão no meu banco pra conferir alternativa por alternativa — então trato como referência de tendência, não como fato cravado (o ⚡ fica reservado pras 3 fiscais MT/GO/SP com tec_id). 🔮 APOSTA pro CE: não caiu puro nas 3 espelho, mas o edital nomeia e a FCC adora novidade → blindagem que pode virar ponto.


⚖️ NOTA DE HONESTIDADE: sem badge de questão FCC 2026 das 3 espelho aqui — IA generativa não caiu pura em MT/GO/SP (apareceu só como alucinação-distrator na Q3714 de viés). A única referência de questão é a TRF-4 2025 (FCC, fora do recorte fiscal e fora do meu banco — não conferida alternativa por alternativa). Por isso 🟡 aposta, não fato cravado pro CE. Estude os conceitos (não inventei questão).


🔗 CONEXÃO — não é ilha


🧊 GUARDE NO BOLSO (Bloco 5)


Bloco 6 — 🎓 FECHO + PLANO DE ATAQUE + DRILL

Para tudo e respira, Felício. 🫁 Este bloco é o ponto que o concorrente larga no chão — ele queima energia no SQL e deixa governança e viés em branco. Você, não. Guarda o essencial no bolso e leva a ordem de ataque certa.


📦 O QUE LEVAR NO BOLSO (os 5 blocos numa olhada)

A tabela-mãe da Aula 5 (cola no espelho):

Tema 🔑 O que crava a questão Prioridade CE
Governança votação/comitê = COLEGIADA · só 3 tipos (sem federada) · Owner responde/Steward zela/Custodian guarda 🔴 ALTA
Qualidade 6 dimensões · nunca excluir registro nem remover outlier automático · MDM = fonte única da verdade 🟡 média (embutido)
Viés reproduz o padrão do treino (origem = dados) · 5 tipos · ⚡ viés ≠ alucinação 🔴 ALTA
Ética IA 7 termos do edital · explicabilidade = eixo do auditor · SHAP é local E global 🟡 média-alta (blindagem)
IA generativa gera conteúdo novo · RAG reduz alucinação · responsabilidade = humano 🟡 média (novidade)

🎯 PLANO DE ATAQUE 80/20 (a ORDEM, não a lista)

Você não precisa esgotar DAMA-DMBOK. Precisa decorar a tabela certa e reconhecer o cenário. A ordem por ROI:

1️⃣ DECORA os 3 tipos de governança 🔴 — é o ALVO específico do CE.

2️⃣ DECORA os 5 vieses + a fronteira viés × alucinação 🔴 — o 2º alvo.

3️⃣ BLINDA o resto (~30 min): 7 termos da ética (com explicabilidade no centro + SHAP local E global), 6 dimensões de qualidade (nunca excluir/remover automático), IA generativa (RAG reduz alucinação).

🧭 Bordão do plano: governança e viés são os 2 alvos; o resto é blindagem que o edital nomeia. Decora a tabela, acha a palavra-gatilho, crava.


O lembrete final

Honestidade temporal: o CE ainda NÃO aconteceu (prova 01-02/08/2026) — tudo aqui é aposta 🔮, calibrada pelo que JÁ CAIU ✅ e está no banco em SP 2026 (governança tec_id 3847060, viés tec_id 3847055, qualidade/pré-proc tec_id 3847053). A IA generativa só tem a referência TRF-4 2025 (fora do recorte fiscal e fora do banco — não conferida).

Tema Quem apostou Veredito real Pro CE
Governança (3 tipos) Mathias (decodificou) JÁ CAIU (SP, órfã) 🔴 ALTA
Viés (5 tipos) Véspera TIC · Renato JÁ CAIU (SP, em alta) 🔴 ALTA
Ética IA / XAI Simulado CE · Renato ⚠️ via viés/distrator 🟡 média-alta
Qualidade / MDM Renato (pré-proc) ✅ embutido (Q3716) 🟡 média
IA generativa Renato · Mathias 📌 ref. TRF-4 2025 (fora das 3, não no banco) 🟡 média

O professor de TI aqui é o Camilo. Os profs deram o insumo (o Mathias decodificou governança, a Véspera transcreveu os vieses, o Simulado CE entregou XAI) — eu pesei e calibrei pela prova real e pelo edital do CE. A grande sacada que só você tem: o edital do CE só lista 3 tipos de governança (federada está fora) e nomeia os 7 termos de ética — é munição que vira o gabarito — e que o concorrente não viu.

🔑 Bordão-mestre da Aula 5: acha a palavra-gatilho no caso fiscal — "votação" = colegiada, "reproduz o treino" = viés, "inventou" = alucinação — e crava o ponto que o concorrente larga.


🧭 PRÓXIMA PARADA — Aula 6: Segurança / LGPD / Sigilo Fiscal.

Você viu quem cuida do dado (governança) e a ética de usá-lo. Na Aula 6 a gente fecha o cerco: como PROTEGER o dado — a tríade CID (confidencialidade, integridade, disponibilidade), a LGPD, e o sigilo fiscal que você já conhece do CTN art. 198 + IN SEFAZ-CE 92/2021. É onde a Fluência abraça a Legislação Tributária. Te espero lá. 🔐


🎯 HORA DE RESOLVER — Drill da Aula 5

🔵 Bate o olho e resolve as que você já sabe · 🔴 Corrige com calma as que travar. Todas FCC SEFAZ-SP 2026, conferidas no banco. As 3 primeiras são o núcleo do bloco (governança · viés · qualidade — o que CAI); a última (train/val/test) é o gancho com o ML da Aula 4.

🎯 Questões pra resolver

👆 Marque a sua (1 toque) · risque as eliminadas (2 toques) · Conferir mostra o gabarito. A resolução comentada abre no TEC.
Questão 1 (FCC · SEFAZ-SP · 2026 · tec 3847060)
Uma Secretaria da Fazenda Estadual está reestruturando seu modelo de governança de dados fiscais. Atualmente, três áreas distintas gerenciam dados tributários: a Coordenadoria de Fiscalização, a Subsecretaria de Arrecadação e a Diretoria de Tecnologia da Informação. Cada área mantém seus próprios padrões de qualidade, políticas de acesso e definições de metadados, gerando inconsistências nas análises. Para resolver o problema, a alta administração decidiu criar uma estrutura de governança onde representantes das três áreas se reúnem periodicamente para deliberar sobre políticas, padrões e prioridades relacionadas aos dados tributários. As decisões sobre frameworks de qualidade, taxonomias de metadados e diretrizes de acesso são tomadas através de votação pelos membros, com cada área tendo poder de voto proporcional ao volume de dados sob sua responsabilidade. Adicionalmente, foram estabelecidos padrões corporativos mínimos obrigatórios, enquanto cada área mantém autonomia para decisões operacionais específicas de seus processos internos, desde que em conformidade com os padrões aprovados pelo grupo deliberativo. Nesse caso, a governança de dados implementada foi
Questão 2 (FCC · SEFAZ-SP · 2026 · tec 3847055)
Determinada Secretaria da Fazenda implementou um sistema de IA para classificar automaticamente declarações fiscais quanto ao risco de irregularidade. Após seis meses de operação, auditores identificaram que o modelo estava atribuindo pontuações de risco sistematicamente mais altas para empresas de setores específicos, mesmo quando os indicadores financeiros eram similares aos de outros setores com pontuações menores. A análise técnica revelou que a base de dados histórica utilizada no treinamento continha proporcionalmente mais autuações em determinados setores devido a fiscalizações direcionadas realizadas no passado, e não necessariamente por maior incidência real de irregularidades. O modelo aprendeu e perpetuou esse padrão desproporcional. O problema de governança e ética em IA que está caracterizado nessa situação é:
Questão 3 (FCC · SEFAZ-SP · 2026 · tec 3847053)
Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AAAA, AAAA-MM-DD), campos obrigatórios vazios em aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devido a erros de digitação (ex: "Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico. Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é
Questão 4 (FCC · SEFAZ-SP · 2026 · tec 3843227)
Na modelagem estatística utilizando aprendizado de máquina, a principal razão para separar os dados em conjuntos de treinamento, validação e teste é

Última atualização: 22/06/2026 22:13 — Camilo

Camilo · Projeto Auditor · modo interativo