Pular para o conteúdo principal

Fundamental

Esta página resume o núcleo linguístico de quem trabalha com Processamento de Linguagem Natural (PLN/NLP) em português. Dominar estes tópicos facilita modelagem, anotação de dados e interpretação de erros dos sistemas.

1. Morfologia (estrutura das palavras) — FUNDAMENTAL

Você precisa entender como as palavras são formadas e classificadas.

O que dominar:

Classes gramaticais:

  • Substantivo
  • Verbo
  • Adjetivo
  • Advérbio
  • Pronome
  • Preposição

Flexões:

  • Gênero (menino / menina)
  • Número (singular / plural)
  • Pessoa (eu, tu, ele…)
  • Tempo e modo verbal

Por quê isso importa no NLP?

  • Token classification
  • POS tagging (Part-of-Speech)
  • Lematização (ex: correndo → correr)

2. Conjugação verbal — CRÍTICO

Você já está mexendo com isso — aqui é onde o bicho pega mesmo.

Dominar:

Tempos:

  • Presente
  • Pretérito
  • Futuro

Modos:

  • Indicativo
  • Subjuntivo (MUITO importante)
  • Imperativo

Concordância verbal:

  • “nós vamos” vs “nós vai”

Pontos difíceis (importantes para IA):

  • Verbos irregulares (ser, ir, ter, estar)

Perífrases:

  • “vou fazer”
  • “estava comendo”

3. Sintaxe (estrutura da frase) — ESSENCIAL

Aqui você começa a entender o “sentido estrutural”.

Dominar:

Sujeito:

  • Simples
  • Composto
  • Oculto (implícito)

Estrutura:

  • Predicado
  • Objeto direto
  • Objeto indireto
  • Complementos

Por quê isso importa?

  • Parsing de frases
  • Extração de relações
  • Entendimento de intenção

4. Concordância (verbal e nominal)

Dominar:

  • “as crianças bonitas” (nominal)
  • “as crianças foram” (verbal)

Problema real em NLP:

Usuários erram MUITO isso:

  • “nós vai”
  • “as pessoa fala”

Seu modelo precisa:

  • Corrigir
  • Ou entender mesmo com erro

5. Semântica (significado) — NÍVEL MAIS ALTO

Aqui entra inteligência de verdade.

Dominar:

  • Polissemia
    • “banco” (financeiro vs sentar)
  • Sinonímia
  • Ambiguidade

Uso em NLP:

  • Embeddings
  • Similaridade semântica
  • Chatbots

6. Pragmática (intenção do usuário)

Dominar:

  • O que a pessoa QUER dizer, não só o que disse

Exemplo:

  • “Você pode abrir a janela?”
    → Não é pergunta, é um pedido

Em NLP:

  • Intent detection
  • Assistentes virtuais

7. Estruturas reais da fala (Português do mundo real)

Isso aqui é OURO pra você.

Dominar:

Português informal:

  • “nós vai”
  • “eu fui lá e peguei ele”

Elipses:

  • “Quer água?” (sem sujeito)

Frases quebradas:

  • “eu… tipo… fui lá”

Por que isso importa:

  • Modelos quebram aqui
  • Usuários reais falam assim

8. Coisas avançadas (diferencial)

✔️ Regência verbal:

  • “gostar de”
  • “assistir a”

✔️ Colocação pronominal:

  • “me dá”
  • “dá-me” (formal)

✔️ Voz verbal:

  • Ativa vs passiva
    • “João comeu o bolo”
    • “O bolo foi comido por João”