AMq2

Trabajo final de aprendizaje de máquina 2

El trabajo consta de dos pipelines uno de entrenamiento y otro de inferencia.

pipeline de entrenamiento

(ejecutado en train_pipeline.py) Este proceso consta de 2 scripts:

Script feauture_engineering.py, realiza el procesamiento de datos realizado por el data scientist, limpiando datos innecesarios, unificando labels, imputando datos daltantes y genera un archivo .csv de todo el procesamiento.

Script train.py, recibe los datos previamente procesados, realiza la división de los datos en entrenamiento y testeo, genera un modelo regresión lineal y guarda el modelo serializado.

(opcional) Script train_randomF.py, este script realiza el mismo procedimiento train.py, pero en este script se hace uso del framework optuna para optimizar un modelo de random forest regressor con una serie de parametro previamente definidos. Se crea y se guarda un modelo serializado con el cual mas adelante se podran hacer inferencias.

pipeline de inferencia

(ejecutado en inference_pipeline.py) Este proceso consta de 1 script:

Script predict.py, se hace el cargue de los datos en este caso un archivo JSON, luego se crea una inferencia de feauture_engineering para poder aplicar todo el procesamiento de los datos. Se carga un modelo entrenado en este caso tenemos la opcion de cargar el modelo de regresión lineal que esta por defecto o se puede cambiar la ruta para hacer inferencia con el modelo de random forest, los modelos disponibles estan en la carpeta ./src/models, una vez hecha la inferencia se guarda en un archivo .csv con ruta ./src/predictions.

observaciones

Todo el proceso tiene añadido logs que son guardados en el archivo logging_info.log ubicado en ./data/
Para ejecutar el pipeline se debe iniciar un cmd desde la carpera data y ejecutar el archivo init.py

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Notebook		Notebook
data		data
src		src
AMq2 - TP integrador.pdf		AMq2 - TP integrador.pdf
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AMq2

pipeline de entrenamiento

pipeline de inferencia

observaciones

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AMq2

pipeline de entrenamiento

pipeline de inferencia

observaciones

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages