使用房地产中的机器学习从观点演变为事实
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-05-13
利用ML的应用程序可以考虑家庭的大小,通勤,爱好和偏爱的家庭风格
更重要的是,它将确保借款人不会根据市场情况和未来趋势而多付钱,基本上它发现它们与可能存在的匹配,无论是房地产技术的初创企业还是已建立的企业,数据科学家都在寻求开创AI和ML方法并太空的先河,而客户体验则是他们目标的重中之重,数据模型的准确性,客户与企业品牌的互动方式以及这些企业对结果的满意程度将有助于衡量成功。
机器学习模型所做的预测和预测仅与用于训练它们的数据一样好
房地产数据是有根据的,在整个行业中,大多数ML模型都是从了解数据中存在的不同模式开始的,通过使用基本属性特征(例如居住面积平方英尺,卧室和浴室的数量或邻域类型),模型看起来可以使属性适应某种模式,从而可以进行准确的预测,有关这些特征的数据越好,模型的性能越好,问题在于房地产数据本质上是自以为是的,例如计税单是税务评估员评估的结果,多个上市服务中的房地产清单反映了上市代理和经纪人的描述,评估会因您雇用的人而异,收集和记录数据的方式多种多样,很容易导致人为错误和不一致,这很可能会导致模型准确性方面的问题。
主观性是成为人的意义
上市代理人可以将7×7平方英尺的空间(带挂衣服的角落)称为“全房间”,以增加以更高价格出售的可能性,但评估师可能不同意,他们可能只是称呼它为巢穴,这些广阔的视野以及对大胆而新颖的事物进行想象和重新想象的能力可以是美丽的。但这也可能使找到客观真理变得困难,在没有作为单一事实来源的数据集的情况下,机器学习模型别无选择,只能将这些主观数据视为现实,因此这些模型冒着复制甚至有时放大人类估计和偏见的风险,大多数模型的预测并不像我们希望的那样精确,因为它们要么无法识别统计偏差,要么重现过去的偏见,要么未考虑所有可能的因素。
如何找到客观真理
幸运的是,确实存在准确的数据(尽管来源不同),因此查找和企业数据只需花费更多的精力。更多数据可以更好地识别何时何地何人的判断会导致模型预测出现偏差,克服此偏见的一种方法是专门构建ML模型以在数据中找到意见模式,然后使用这些预测来为实际ML模型制定训练数据集,例如知道特定的评估者往往会根据天花板高度低估居住面积,或者评估者可能无法根据许可对房屋装修进行评估,可能会导致人们理解数据中的意见模式时产生歧义。
消除不准确评估的另一种选择是向房地产行业的一线工人提供更多数据
这样做使贷方,评估人,经纪人,评估人和上市代理人有能力将针头转向数据驱动的见解,结果不仅工作流程变得更加自动化,而且数据行为也逐渐改变,随着时间的流逝,该模型可以建立关键数据点的可信度,并程度地减少数据偏差。
数据是房地产的未来
更重要的是,它将确保借款人不会根据市场情况和未来趋势而多付钱,基本上它发现它们与可能存在的匹配,无论是房地产技术的初创企业还是已建立的企业,数据科学家都在寻求开创AI和ML方法并太空的先河,而客户体验则是他们目标的重中之重,数据模型的准确性,客户与企业品牌的互动方式以及这些企业对结果的满意程度将有助于衡量成功。
机器学习模型所做的预测和预测仅与用于训练它们的数据一样好
房地产数据是有根据的,在整个行业中,大多数ML模型都是从了解数据中存在的不同模式开始的,通过使用基本属性特征(例如居住面积平方英尺,卧室和浴室的数量或邻域类型),模型看起来可以使属性适应某种模式,从而可以进行准确的预测,有关这些特征的数据越好,模型的性能越好,问题在于房地产数据本质上是自以为是的,例如计税单是税务评估员评估的结果,多个上市服务中的房地产清单反映了上市代理和经纪人的描述,评估会因您雇用的人而异,收集和记录数据的方式多种多样,很容易导致人为错误和不一致,这很可能会导致模型准确性方面的问题。
主观性是成为人的意义
上市代理人可以将7×7平方英尺的空间(带挂衣服的角落)称为“全房间”,以增加以更高价格出售的可能性,但评估师可能不同意,他们可能只是称呼它为巢穴,这些广阔的视野以及对大胆而新颖的事物进行想象和重新想象的能力可以是美丽的。但这也可能使找到客观真理变得困难,在没有作为单一事实来源的数据集的情况下,机器学习模型别无选择,只能将这些主观数据视为现实,因此这些模型冒着复制甚至有时放大人类估计和偏见的风险,大多数模型的预测并不像我们希望的那样精确,因为它们要么无法识别统计偏差,要么重现过去的偏见,要么未考虑所有可能的因素。
如何找到客观真理
幸运的是,确实存在准确的数据(尽管来源不同),因此查找和企业数据只需花费更多的精力。更多数据可以更好地识别何时何地何人的判断会导致模型预测出现偏差,克服此偏见的一种方法是专门构建ML模型以在数据中找到意见模式,然后使用这些预测来为实际ML模型制定训练数据集,例如知道特定的评估者往往会根据天花板高度低估居住面积,或者评估者可能无法根据许可对房屋装修进行评估,可能会导致人们理解数据中的意见模式时产生歧义。
消除不准确评估的另一种选择是向房地产行业的一线工人提供更多数据
这样做使贷方,评估人,经纪人,评估人和上市代理人有能力将针头转向数据驱动的见解,结果不仅工作流程变得更加自动化,而且数据行为也逐渐改变,随着时间的流逝,该模型可以建立关键数据点的可信度,并程度地减少数据偏差。
数据是房地产的未来
没有数据,您只是一个有意见的人,成功地从数据中得出相关结论需要对人的观点和判断进行解释,然后通过ML加以压制,即使AI逐渐认识到人类的情感,但在这一领域中,如果没有情感,创新可能会做得更好。