Skip to content

Commit

Permalink
Inicia a subseção sobre o processo de machine learning
Browse files Browse the repository at this point in the history
  • Loading branch information
guilhermedias committed Jun 26, 2024
1 parent aabe34e commit 24a482a
Show file tree
Hide file tree
Showing 5 changed files with 75 additions and 5 deletions.
Binary file modified docs/texto.pdf
Binary file not shown.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
36 changes: 31 additions & 5 deletions texto/02-desenvolvimento/01-machine-learning/main.tex
Original file line number Diff line number Diff line change
Expand Up @@ -16,7 +16,7 @@ \subsection{O que é aprendizagem de máquina?}
\cite{Hutz2018} e usa o instrumento da Bateria Fatorial da Personalidade para coleta de dados, registrando as pontuações obtidas
nas escalas de neuroticismo, extroversão, socialização, realização e abertura \cite{Sancineto2015}. Além disso, os participantes
do estudo reportam o próprio nível de satisfação profissional em uma escala que contém os seguintes valores: baixo, médio e alto.
O conjunto de dados coletados é como apresentado na tabela \ref{table:example-data}.
O conjunto de dados coletados é como apresentado na tabela \ref{tab:dados-exemplo}.

\begin{table}[h!]
\centering
Expand All @@ -32,7 +32,7 @@ \subsection{O que é aprendizagem de máquina?}
1 & 1 & 2 & 4 & 5 & médio
\end{tabular}
\caption{Exemplo de dados coletados no estudo hipotético.}
\label{table:example-data}
\label{tab:dados-exemplo}
\end{table}

É possível utilizar esse conjunto de dados para construir um modelo de apredizagem de máquina preditivo. Um algoritmo processa o conjunto de dados,
Expand Down Expand Up @@ -74,7 +74,7 @@ \subsubsection{Modelos discriminativos e generativos}
Estratégias de aprendizagem supervisionada e não supervisionada podem ser utilizada na construção de modelos com objetivos de aprendizagem distintos. Modelos
discriminativos tem por objetivo modelar probabilidade condicional de um desfecho dadas determinadas condições \cite{Bi2019, Ng2001}. Um modelo discriminativo,
poderia representar diretamente a probabilidade de resposta a uma intervenção psicoterápica dadas as condicões socioeconômicas do paciente, como escolaridade e
renda. Modelos discriminativos são comumente usados em tarefas de regresão e classificação \cite{Bi2019}.
renda. Modelos discriminativos são comumente usados em tarefas de regressão e classificação \cite{Bi2019}.

Modelos generativos buscam modelar a distribuição de probabilidade conjunta para as variáveis presentes no conjunto de dados, ou seja, a probabilidade associada
a cada combinação de variáveis observada no conjunto de dados de treinamento \cite{Bi2019, Ng2001}. Um modelo generativo poderia, por exemplo, representar a
Expand All @@ -83,12 +83,38 @@ \subsubsection{Modelos discriminativos e generativos}
observações sintéticas \cite{Bi2019}. Esse tipo de modelo é associado a ferramentas de inteligência artificial generativa como o Chat GTP \cite{Wu2023}.

\subsection{A construção de uma aplicação de machine learning}
\subsubsection{Análise descritiva}
\subsubsection{Pré-processamento}

O processo para construção de modelos de aprendizagem de máquina consiste em uma sequência de estágios ordenados conforme a figura \ref{fig:processo} \cite{Greener2021}.

\begin{figure}[h!]
\centering
\includegraphics[width=\textwidth]{./02-desenvolvimento/01-machine-learning/imagens/processo.png}
\caption{Estágios para a construção de um modelo de aprendizagem de máquina.}
\label{fig:processo}
\end{figure}

\paragraph{Pré-processamento}

Na etapa de pré-processamento, busca-se preparar o conjunto de dados de treinamento, colocando-no em um estado adequado à técnica
de aprendizagem de máquina que se pretende utilizar. Tratamentos comumente realizados na etapa de pré-processamento são: seleção de
características, transformações, imputações e balanceamento de classes.

\paragraph{Separação dos dados}

A.

\paragraph{Seleção do modelo}

A.

\paragraph{Treinamento}

A.

\paragraph{Avaliação do desempenho}

A.

A seleção de características consiste em eliminar do conjunto de dados as variáveis que tenham pouca contribuição para a aprendizagem da tarefa.
Em um conjunto de dados onde todas as observações são de pessoas brasileiras, a variável de nacionalidade não contribui para a explicação do desfecho
que se busca prever, portanto pode ser removida.
Expand Down
1 change: 1 addition & 0 deletions texto/main.tex
Original file line number Diff line number Diff line change
@@ -1,6 +1,7 @@
\documentclass{article}

\usepackage{biblatex}
\usepackage{graphicx}

\addbibresource{references.bib}

Expand Down
43 changes: 43 additions & 0 deletions texto/references.bib
Original file line number Diff line number Diff line change
Expand Up @@ -305,4 +305,47 @@ @article{Wu2023
pages={1122-1136},
keywords={Three-dimensional displays;Web and internet services;Reinforcement learning;Chatbots;Robot sensing systems;Transformers;History;AIGC;ChatGPT;GPT-3;GPT-4;human feedback;large language models},
doi={10.1109/JAS.2023.123618}
}

@article{Luo2016,
title = {Guidelines for Developing and Reporting Machine Learning Predictive Models in Biomedical Research: A Multidisciplinary View},
volume = {18},
ISSN = {1438-8871},
url = {http://dx.doi.org/10.2196/jmir.5870},
DOI = {10.2196/jmir.5870},
number = {12},
journal = {Journal of Medical Internet Research},
publisher = {JMIR Publications Inc.},
author = {Luo, Wei and Phung, Dinh and Tran, Truyen and Gupta, Sunil and Rana, Santu and Karmakar, Chandan and Shilton, Alistair and Yearwood, John and Dimitrova, Nevenka and Ho, Tu Bao and Venkatesh, Svetha and Berk, Michael},
year = {2016},
month = dec,
pages = {e323}
}

@article{Shamout2021,
title = {Machine Learning for Clinical Outcome Prediction},
volume = {14},
ISSN = {1941-1189},
url = {http://dx.doi.org/10.1109/RBME.2020.3007816},
DOI = {10.1109/rbme.2020.3007816},
journal = {IEEE Reviews in Biomedical Engineering},
publisher = {Institute of Electrical and Electronics Engineers (IEEE)},
author = {Shamout, Farah and Zhu, Tingting and Clifton, David A.},
year = {2021},
pages = {116-126}
}

@article{Greener2021,
title = {A guide to machine learning for biologists},
volume = {23},
ISSN = {1471-0080},
url = {http://dx.doi.org/10.1038/s41580-021-00407-0},
DOI = {10.1038/s41580-021-00407-0},
number = {1},
journal = {Nature Reviews Molecular Cell Biology},
publisher = {Springer Science and Business Media LLC},
author = {Greener, Joe G. and Kandathil, Shaun M. and Moffat, Lewis and Jones, David T.},
year = {2021},
month = sep,
pages = {40-55}
}

0 comments on commit 24a482a

Please sign in to comment.