builderall

Ciencia de datos
¿Como utilizarla para optimizar el precio de una propiedad? 
Escrito por: Genaro Delgado Pereyra

La gran cantidad de datos que se generan en la actualidad estan transformando a las empresas y como toman desiciones importantes para lograr sus objetivos, e incluso las empresas que tienen equipos y sistemas de ciencia de datos suficientemente maduros estan transformandose en empresas 100% Data-Driven, esto es, toda la toma de deciciones de la organizacion la hacen unica y exclusivamente basada en los datos y en sus analisis.

El sector inmobiliario no es la exepcion de esta transformacion, cada vez son mas las agencias inmobiliarias, como Garios Real Estate, que estan usando los datos para conocer tendencias en el mercado, saber cuanta probabilidad hay de que una propiedad se venda en X tiempo, saber cual es el precio optimo de una propiedad e incluso podriamos conocer cual sera el precio de una propiedad en el futuro, esta informacion, por supuesto, es muy valiosa, ya que nos permite tomar las mejores deciciones basandonos en los datos y sus analisis

A continuacion realizaremos un pequeño estudio de mercado, basandonos el la ciencia de datos, para optimizar el precio de una casa.

¿Como usar los datos a nuestro favor?

Como mencionamos anteriormente, los datos se pueden usar para determinar cual es el mejor precio para una propiedad, aunque claro, que para hacer esto necesitamos de los datos adecuados, es decir, necesitamos que los datos que vamos a usar esten estrechamente relacionados con lo que queremos hacer, en este caso determinar el precio de una casa.

¿Pero cuales son los datos que necesitamos para poder decicir que precio ponerle a una propiedad?

En el caso de una casa, el precio se ve influido por muchas variables, por ejemplo, el tamaño del terreno, el tamaño de la construccion, la zona en la que esta ubicada, el numero de baños, el numero de estacionamientos, cuantos pisos hay, y muchas otras cosas mas, incluso cosas que podrian parecer insignificantes, como por ejemplo el numero de ventanas, el material con el que esta echo el piso y muchas otras variables mas.

Las tecnicas de machine learning son muy usadas en ciencia de datos, y utilizaremos algunos de estos algoritmos para nuestro proposito

¿Que es el machine learning?

Machine learning o en español aprendizaje de maquinas se refiere a un conjunto de tecnicas estadisticas y de programacion con las cuales se pretende "enseñar" a las computadoras a resolver problemas simples o encontrar patrones sin que sean explicitamente programadas para ello.

Por ejemplo consideremos el caso de los traductroes de idiomas, se puede programar un traductor con tecnicas clasicas, aunque estaria muy limitado por que seria muy dificil poder programar el contexto de las traducciones, otra forma de hacer un traducctor seria utilizando machine learning, de esta forma no programamos explicitamente a la computadora para que realize las traducciones, si no que le "enseñamos" a traducir basandonos en datos, esto permite que el algoritmo si pueda considerar el contexto y entonces generara mucho mejores traducciones.

En el caso de de nuestro objetivo, que es optimizar el precio de una casa, tambien le vamos a "enseñar" al algoritmo, pero los datos que vamos a usar son datos extraidos de internet y son los siguientes: el tamaño del terreno en metros cuadrados, el tamaño de la construccion en metros cuadrados y el precio de la casa. 

Una vez que nuestro algoritmo esta entrenado, le podemos preguntar cual es el precio mas optimo de una casa de X metros cuadrados de terreno y Y metros cuadrados de construccion, el precio que nos va a arrojar el algoritmo va a ser el precio optimo segun los datos que estemos utilizando.

Lo anterior es sumamente util por que nos permite hacer una valuacion bastante confiable de una casa en pocos segundos, aunque claro que para hacer una valuacion mas exacta y precisa se necesita de mas tiempo e informacion de expertos, pero como mencionamos anteriormente, como un metodo veloz para hacer una valuacion es muy util.

El algoritmo que vamos a utilizar es uno conocido como regresion lineal, la idea es simple, si tenemos una base de datos con los metros cuadrados de construccion y terreno ademas del precio de la casa, esos datos los podemos ajustar con una linea recta, a continuacion lo explicamos mas detalladamente

Optimizando el precio de una casa usando machine learning

Para optimizar el precio de una casa lo que necesitamos tener es una base de datos, la base de datos que usaremos en este caso se ve mas o menos como sigue:

En esta pequeña base de datos, que la queremos para hacer una pequeña demostracion, solo tenemos los metros cuadrados de terreno y construccion y el precio de las casas.
Como lo mencionamos anteriormente, podriamos tener mas datos sobre las casas, por ejemplo numero de baños, numero de estacionamientos, numero de pisos, cuantos cuartos tiene, etc.
Por supuesto al tener mas variables en el modelo podemos obtener mejores resultados y mas confiables. 

Lo primero que haremos es una muy simple exploracion de nuestros datos.
En las siguientes graficas se muestra la relacion que hay entre los metros cuadrados de terreno y construccion con el precio

Las graficas anteriores nos proporcionan informacion sobre la dispercion de los datos y asi poder quitar datos los anomalos que podrian hacer que nuestro algoritmo no funcione optimamente.
Por ejemplo si consideramos una casa en una zona muy exclusiva el costo por metro cuadrado de terreno y construccion pueden ser mucho mayores que en otras zonas, por eso se deben de considerar casa que esten en zonas parecidas y que tengan caracteristicas similare para que nuestro algoritmo no tenga sesgos muy grandes

Lo que haremos a continuacion es una regresion lineal, esto es, ajustaremos lineas rectas a nuestras graficas anteriores y esto nos permite decidir el precio de una casa considerando los metros cuadrados de terreno o los metros cuadrados de construccion, aunque este modelo no nos permite considerar la informacion de ambas variables al mismo tiempo, eso lo haremos mas adelante.

Las siguientes graficas muestran las lineas rectas ajustadas a nuestro modelo con un intervalo de prediccion.
Las siguientes graficas la podemos usar como sigue: si tenemos una casa de 150 metros cuadrados de construccion 
la grafica siguiente nos dice que un precio optimo es aproximadamente 1,400,000.
Luego si tenemos una casa de 150 metros cuadrados de terreno el algoritmo nos da un precio optimo aproximado de 1,600,00 que es diferente al anterior, esto es por que nuetro algoritmo no considera las dos variable, solo toma en cuenta una de ellas.

Por supuesto podemos hacer una algoritmo que tenga en cuenta la informacion de ambas variables o de tantas variables como queramos o tengamos.

La idea del algoritmo es similar a la anterior, solo que esta vez ya no ajustamos una linea recta si no un plano, dado que nuestros datos estan en tres dimensiones.

Esta vez ya no podemos hacer graficas pero podemos seguir poniendo precios a nuestra casas en tan solo unas segundos.

Por ejemplo si tenemos una casa de 120 m2 de construccion y 120 m2 de terreno el algoritmo nos da un precio optimo aproximado de 1,068,037

Esto lo poedmos hacer cuantas veces queramos si tenemos una casa de X m2 de construccion y Y m2 cuadrados de terreno, podemos tener un precio optimo aproximado en segundos.

Recientemente utilizamos estas tecnicas para determinar el precio de una propiedad para una integradora inmobiliaria, Garios Real Estate, conoce el caso de exito aqui

¿Quieres saber mas sobre esto y como te puede ayudar en tus negocios? 
ingresa aqui