電脳ヨーグルト

ネガティブからポジティブへ

暇だったので港区の不動産価格を予想するアプリを作って遊んでた

f:id:at25250410:20190501002516p:plain

みなさんこんにちは!


GWで大学もバイト先も休みなので暇してます。

一応大学院に進学するつもりですが学部で就職も無くはないなといった感じで悩んでいますが・・・

来年は就活やら院試の勉強やらで忙しいのかもしれませんがとりあえず今は暇です。


誰か僕に予定をください・・・(゜-゜)


そういえば去年の今の時期くらいにカオスなバーベキューに参加したんだっけ、時が経つのは早いですね・・・

www.prog-ganbaru.com


まあそんなこんなで、今は暇なので個人的に色々作って遊んでました。

作ったもの

今回作ったのは、港区の不動産の価格を予想するアプリです。

不動産の種類最寄り駅までの時間(どの最寄り駅かの指定はめんどくさかったので諦めた)、面積建築年建蔽率容積率の6つの項目を入力すると、コンピュータが大体いくらくらいか計算して教えてくれるというアプリです。

f:id:at25250410:20190501000728p:plain

なぜ港区にしたのかというのは謎です・・・

www.prog-ganbaru.com


ざっくりとした事はYoutubeの方に載ってます。

www.youtube.com


動画にすると全然情報載せられないなと改めて思いました。

技術的な事

土地総合情報システム

こちらの国土交通省のページから港区の不動産取引価格のデータ(csv形式)を入手し、機械が学習できない文字データを数値に変換したり、学習の邪魔になりそうな項目を削除したり、空白を無くしたりするなどデータを整形しました。

その後skleranという機械学習ライブラリ(補助ツール)を用いて学習させました。

他のライブラリに比べてskleranは使いやすいのでこれから機械学習を始めたいという方にもおすすめです。

使用したアルゴリズムはRandmomForestです。


不動産価格は値段が大きい分、ピンポイントで値段を当てることが難しいです。なので推論した値が、実際の値のプラスマイナス2000万円の範囲内なら、その予想はおおむね正しいということで正解とすることにしました。

2000万円の土地に対して、0円という予測をしても正解とカウントされる激甘設定なのですが、そこは港区なので2000万円ぐらいの物件はあまりないのでそこまで懸念材料にはならないと感じました。

実際の正解率は7割ぐらいでした。

実際の価格が5000万円の物件があったとして、約7割の確率で3000万円~7000万円の間の値を返すという感じです。


7割だと使いものにならないと感じてしまいますが、実際に何回か試した感じだと数千万円ぐらいの、港区だとオーソドックスな価格帯の精度はもっと高く、逆に10億とか港区でもかなり高い部類の物件の価格を予想させた際には大幅に価格を間違えていました。(超高額物件のサンプルが少ないから)


そしてCGIとpythonを使いブラウザ上で動くようにしました。

CGIスクリプトについては下記記事に軽く書いてあります。

Python(CGI)で作った簡易単語検索アプリ - 電脳ヨーグルトは技術力を高めたい


そんな感じでゴミアプリを作って遊んでいました。

感想

学部1年の時はわりと熱心にAIの勉強をしていたのですが、最近はしばらくやっていなかったので色々忘れていることがありました。アルゴリズムに関する知識が足りていないのでそこら辺をもっと勉強しなければならないと痛感しました・・・


というかこの記事を書いている間に平成が終わっていました。


ハロー令和