Skip to content

Commit

Permalink
Refina parágrafos sobre aprendizagem não supervisionada e por reforço
Browse files Browse the repository at this point in the history
  • Loading branch information
guilhermedias committed Jun 23, 2024
1 parent 52bab0a commit 927f3ce
Show file tree
Hide file tree
Showing 3 changed files with 46 additions and 13 deletions.
Binary file modified docs/texto.pdf
Binary file not shown.
28 changes: 16 additions & 12 deletions texto/02-desenvolvimento/01-machine-learning/main.tex
Original file line number Diff line number Diff line change
Expand Up @@ -51,20 +51,24 @@ \subsubsection{Aprendizagem supervisionada, não supervisionada e por reforço}

A aprendizagem supervisionada assemelha-se ao processo de aprendizagem adotado por seres humanos, onde o aprendiz identifica padrões a partir de
um conjunto de exemplos preparado por um tutor. Durante a fase de aprendizagem, o modelo é exposto a um conjunto de dados que contém informações
sobre o desfecho de interesse para cada uma das observações \cite{Theobald2021, Bi2019}. O acesso às informações de desfecho providas por um agente
externo confere o caráter de supervisão a este processo. Técnicas de aprendizagem de máquina para regressão e classificação (support vector machines,
árvores de decisão, redes neurais) pertencem a esta categoria \cite{Bi2019}. Um exemplo para a aplicação deste tipo de técnica no contexto da psicologia
clínica é o uso de dados de ensaios clínicos, onde o desfecho para cada paciente é conhecido, para a construção de um modelo capaz de predizer o
resultado da intervenção para novos pacientes.
sobre o desfecho de interesse para cada uma das observações. O acesso às informações de desfecho providas por um agente externo confere o caráter
de supervisão a este processo. Técnicas de aprendizagem de máquina para regressão e classificação (support vector machines, árvores de decisão,
redes neurais) pertencem a esta categoria \cite{Theobald2021, Bi2019}. Um exemplo para a aplicação deste tipo de aprendizagem é usar de dados de
ensaios clínicos, onde o desfecho para cada paciente é conhecido, na construção de um modelo capaz de predizer o resultado da intervenção para
novos pacientes \cite{Collins2023}.

Na aprendizagem não supervisionada, o conjunto de dados analisado não contém informações sobre o desfecho para
as observações; perde-se assim a característica de supervisão. Espera-se que a aplicação identifique, de maneira
autônoma, os padrões de relacionamento existentes entre as variáveis do conjunto de dados. Técnicas de aprendizagem de
máquina populares para tarefas de agrupamento e redução de dimensionalidade (k-means clustering, PCA, TSNE) pertencem
a esta categoria.
Na aprendizagem não supervisionada, o conjunto de dados analisado não contém qualquer informações sobre desfecho de interesse. Espera-se que o modelo
identifique os padrões de relacionamento existentes entre as variáveis do conjunto de dados e gere agrupamentos ou projeções de maneira autônoma.
Técnicas de aprendizagem de máquina para tarefas de agrupamento e redução de dimensionalidade (k-means clustering, PCA, TSNE) pertencem a esta categoria
\cite{Theobald2021, Bi2019}. Um exemplo para a aplicação deste tipo de aprendizagem é investigar os padrões de comorbidade em uma determinada população
clínica \cite{Sanchez2019}.

Na aprendizagem por reforço, as aplicações adquirem conhecimento a respeito da tarefa ao longo do tempo por meio da obtenção
de feedback sobre seu desempenho.
Na aprendizagem por reforço, o modelo aprende através de repetidos ciclos de tentativa e erro. A cada ciclo de aprendizagem, o modelo recebe feedback sobre seu
desempenho na tarefa, o feedback é incorporado à base de conhecimento construída pelo modelo em ciclos passados e, assim, melhora seu desempenho progressivamente
\cite{Theobald2021, Bi2019}. Um exemplo para a aplicação deste tipo de aprendizagem é auxiliar a tomada de decisões de tratamento em condições crônicas como a
esquizofrenia \cite{Shortreed2010}.

\subsubsection{Modelos discriminativos e generativos}

\subsection{A construção de uma aplicação de machine learning}
\subsubsection{Análise descritiva}
Expand Down
31 changes: 30 additions & 1 deletion texto/references.bib
Original file line number Diff line number Diff line change
Expand Up @@ -264,4 +264,33 @@ @inproceedings{Ng2001
url = {https://proceedings.neurips.cc/paper_files/paper/2001/file/7b7a53e239400a13bd6be6c91c4f6c4e-Paper.pdf},
volume = {14},
year = {2001}
}
}

@article{Shortreed2010,
title = {Informing sequential clinical decision-making through reinforcement learning: an empirical study},
volume = {84},
ISSN = {1573-0565},
url = {http://dx.doi.org/10.1007/s10994-010-5229-0},
DOI = {10.1007/s10994-010-5229-0},
number = {1-2},
journal = {Machine Learning},
publisher = {Springer Science and Business Media LLC},
author = {Shortreed, Susan M. and Laber, Eric and Lizotte, Daniel J. and Stroup, T. Scott and Pineau, Joelle and Murphy, Susan A.},
year = {2010},
month = dec,
pages = {109-136}
}

@ARTICLE{Sanchez2019,
title = "A machine learning approach for studying the comorbidities of complex diagnoses",
author = "S{\'a}nchez-Rico, Marina and Alvarado, Jes{\'u}s M",
journal = "Behav. Sci. (Basel)",
publisher = "MDPI AG",
volume = 9,
number = 12,
pages = "122",
month = nov,
year = 2019,
keywords = "UMAP; comorbidities; depression; hierarchical clustering",
language = "en"
}

0 comments on commit 927f3ce

Please sign in to comment.