• 用R语言创建房价指数模型预测美国房地产未来
    发布日期:2019-09-02 10:41   来源:未知   阅读:

  这里有大批的世界领袖,也有成群的流浪汉,有艺术家,有留学生,有形形色色各种各样的人。而其中的绝大多数,还在焦虑地计算着,应该为头顶的那片瓦支付多少钱。

  过去几年房价的快速上涨,待售房屋的供应又如此紧张,加上超高的抵押贷款率,很快让大众迷失了方向。你想着买曼哈顿的房子,总没错吧,那里可是大热的商业聚居区,即使住了不喜欢再卖掉,也不会亏本。

  但你不知道的是,传奇中的热门地区,如Soho,又或者Greenwich Village,价格正在悄无声息地下滑,而看似偏远的the Bronx,开发商却看好其成为下一个高端区域。

  Zillow (是美国最大的房地产垂直类信息网站,已经建立了全美最权威的房屋信息数据库。 而Zestimate是Zillow采用特有算法来估算房产市场价值的系统,囊括全美1.1亿套房产数据。

  2017年5月,Zillow开启了一场房地产估值的比赛,选手需要根据提供的历史交易数据,分析房屋特征,建立模型,预测未来的交易价格。

  重金之下必有勇夫,即使耗时将近两年,比赛仍有约4000个小组参加。2019年1月,比赛终于结束,拔得头筹的大佬们不但捧走了百万美金,相关新闻还上了时代广场的大屏幕。

  确定房产价格,地区,周边环境,租住比,地税,增值空间等多个维度作为模型基础,去构建较为完整准确的预测机制,协助房产中介及投资购房者更好的提前做出决策。

  系统主要包括数据清洗,特征选择,模型构建,可视化实现以及报告生成等多个模块。

  运用多种机器学习模型进行训练以及优化模型参数,结合数据,通过比较模型的预测以及残差、拟合优度等结果,选择当前最优模型。

  常青藤精英教育有幸请到了Amazon的数据科学家——Sherry导师,联手推出房价指数预测模型分析的精品实习项目。

  届时项目为3-5人小组,主要语言为R,由Amazon数据科学家带队,配合线上讲解以及平时答疑,完成与纽约地产公司合作的房价指数预测模型项目。

  R语言是统计领域广泛使用的一个语言分支,作为开放型的统计环境,它集分析与图形于一体,是属于GNU系统一个完全免费、源代码开放的优秀工具。

  随着大数据时代的到来,对于熟练掌握R语言应用的人才需求日渐旺盛。前美国总统奥巴马在招募竞选团队时,就提供了数据分析的职位,并要求具有R语言的技能。

  google首席经济学家Hal Varian曾说过:R的最让人惊艳之处在于你可以通过修改它来做所有的事情,而你已经拥有大量可用的工具包,这无疑让你是站在巨人的肩膀上工作。

  数据建模流程(定义问题,数据采集,数据整理,模型选择,参数调节,模型测试,报告与可视化,模型维护)

Copyright © 2002-2011 DEDECMS. 织梦科技 版权所有 Power by DedeCms