O ๐—ณ๐—ถ๐—ป๐—ฒ-๐˜๐˜‚๐—ป๐—ถ๐—ป๐—ด de modelos utilizando dados de tabelas de banco รฉ ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ ou ๐—ปรฃ๐—ผ ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ?

Share

Neste ensaio sobre ๐— ๐—ฎ๐—ฐ๐—ต๐—ถ๐—ป๐—ฒ ๐—Ÿ๐—ฒ๐—ฎ๐—ฟ๐—ป๐—ถ๐—ป๐—ด, vamos finalmente demonstrar onde a teoria que explicamos nos ensaios anteriores encontra a prรกtica. Veja o exemplo:

O ๐—ณ๐—ถ๐—ป๐—ฒ-๐˜๐˜‚๐—ป๐—ถ๐—ป๐—ด de modelos utilizando dados de tabelas de banco รฉ ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ ou ๐—ปรฃ๐—ผ ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ?

No contexto de machine learning, o fine-tuning utilizando dados de uma tabela de banco รฉ amplamente considerado como aprendizado ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ. Isso porque, normalmente, os dados contรชm ๐—น๐—ฎ๐—ฏ๐—ฒ๐—น๐˜€ (rรณtulos) que indicam o resultado ou a resposta esperada, permitindo que o modelo seja ajustado para prever esses labels com base nas features (caracterรญsticas) da tabela.

Por exemplo, imagine um cenรกrio em que vocรช deseja prever se uma transaรงรฃo financeira รฉ fraudulenta. Se vocรช jรก tem os resultados histรณricos (fraudulenta ou nรฃo), o processo รฉ supervisionado. O modelo serรก treinado e ajustado para aprender a fazer essas previsรตes com base nos dados de entrada fornecidos.

Outro exemplo seria o ajuste de um modelo para prever a rotatividade de funcionรกrios em uma empresa. Se vocรช possui dados histรณricos de funcionรกrios que saรญram ou permaneceram na empresa, juntamente com informaรงรตes como salรกrio, tempo de casa, e avaliaรงรตes de desempenho, o modelo serรก treinado para aprender a prever a probabilidade de um funcionรกrio sair com base nesses labels. Como hรก rรณtulos claros (funcionรกrio saiu ou permaneceu), esse รฉ mais um caso de aprendizado supervisionado.

Por outro lado, se o objetivo for simplesmente identificar padrรตes ou agrupar dados sem labels definidos, o processo entra no campo do aprendizado ๐—ปรฃ๐—ผ ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ โ€“ como em clustering ou reduรงรฃo de dimensionalidade. Embora รบtil em certos casos, esse tipo de aprendizado nรฃo รฉ o foco principal no processo de fine-tuning tradicional.

O ponto-chave aqui รฉ que, para um fine-tuning eficaz e orientado a resultados, os dados rotulados (labels) desempenham um papel central no sucesso do modelo. Assim, modelos ๐˜€๐˜‚๐—ฝ๐—ฒ๐—ฟ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ผ๐—ป๐—ฎ๐—ฑ๐—ผ๐˜€ sรฃo geralmente a escolha quando se busca maior ๐—ฝ๐—ฟ๐—ฒ๐—ฐ๐—ถ๐˜€รฃ๐—ผ e ๐—ฝ๐—ฟ๐—ฒ๐˜ƒ๐—ถ๐˜€๐—ถ๐—ฏ๐—ถ๐—น๐—ถ๐—ฑ๐—ฎ๐—ฑ๐—ฒ.