En la actualidad, hay muchas industrias para las cuales la información de precios es de crítica importancia en su toma de decisiones. La precisión y nivel de actualización de las fuentes a través de las cuales se alimentan de esta información se tornan factores altamente relevantes.
Este es el caso de industrias como la financiera, sector inmobiliario y retail entre otros. Bancos de inversión, por ejemplo, requieren poder proyectar cambios en el índice de precios al consumidor para decidir posiciones respecto a las distintas monedas. En el sector inmobiliario, por ejemplo, es crítico conocer variaciones del precio promedio por metro cuadrado en diversas zonas, de manera de planificar nuevos proyectos. En retail también se encuentran aplicaciones en el monitoreo de la competencia, de manera de poder decir estrategias competitivas basadas en precio.
Los métodos basados en llamadas telefónicas, trabajo de campo o la descarga manual de datos son alternativas para obtener estos datos, sin embargo, presentan los siguientes problemas:
1. La entrega de información no es oportuna.
2. La solución no es escalable
3. Aumenta la posibilidad de errores por manipulación de datos
4. Se dedica más tiempo a la captura y limpieza que al análisis
El objetivo es poder sobre llevar las dificultades de los métodos basados en llamadas telefónicas, trabajo de campo o la descarga manual de datos. Es decir:
1. La entrega de información debe ser oportuna.
2. La solución debe ser escalable
3. A través del automatismo, disminuir las probabilidades de error
4. Permitir orientar la dedicación de tiempo al análisis en vez de captura y liempieza
Actualmente es posible construir un sistema capaz de automatizar la descarga de precios de la web, a través de Data Scraping, pudiendo generar indicadores y reportes que pueden ser accedidos en tiempo real, permitiendo generar proyecciones y análisis predictivo.
A través de una serie de modelos matemáticos e inteligencia artificial, es posible ajustar modelos predictivos capaces de predecir cambios en los niveles de precios de una canasta de bienes y servicios usualmente consumidos por las familias.
La solución creada, automatiza la descarga de precios de diversos productos y servicios desde la web, permitiendo generar proyecciones y predicciones de tendencias y fluctuaciones, para una serie de aperturas posibles de los datos, como pueden ser IPC temáticos, como el IPC de los alimentos, IPC del transporte, IPC inmobiliarios o IPC de los sueldos.
La solución ha logrado hasta este punto obtener mejor información y mejor foco en el uso de tiempo de los analistas de los clientes que actualmente utilizan este sistema en la banca de inversión, pudiendo identificar oportunidades de mejora en la forma de generar las proyecciones, y entregando feedback al mismo sistema para corregir las nuevas estimaciones. Al momento del este estudio, se consideraron 98 precios comparables con elementos de la canasta del IPC, procesando aproximadamente 100GB de datos en los 18 meses de operación del sistema. Los datos descargados en este tiempo han ya permitido generar proyecciones con errores menores al 5% comparado con la fuente oficial.