見出し画像

日本の「不動産テック」が誇る最新技術とは?スクレイピングとCSV弄り?

日本の「不動産テック」が誇る最新技術とは・・・

スクレイピングとCSV弄り

でございます。

日本の不動産テック企業のほとんどはただのスクレイピング屋である

これは数年前に一部界隈でかなり話題になったブログですが、傑作なのであります。

日本において「ビッグデータでAIで機械学習でマーケティングのブランディングでディープラーニングのリードナーチャリングだ!」でごまかせる業界はもう不動産しかないのか、今年に入ってから「不動産テックでデータ可視化で物件価値の向上でウッハウハですよ!」な会社から融資をお願いされることが増えました。

しかし、残念ながら今のところ投資に値する会社はありません。というか適当すぎてやばい。話聞いてる途中で「え、え、ちょっと待って、それテクノロジーって言えるの?」と遮りたくなるレベルの会社だらけでびびります。

不動産テックはアメリカの話を聞いていると面白いんですが、日本の不動産テックはがっかりを通り越してテック名乗るな馬鹿野郎と言いたくなることばかりです。

「ごまかせる業界はもう不動産しかない」「適当すぎてやばい」「テック名乗るな馬鹿野郎」www

他社サイトからスクレイピングしすぎ

てことは賃貸情報サイトがクローラー対策したら会社潰れるじゃねえかというわけで、融資なんてとてもできなくなるのです。てかどんだけ迷惑かけてんだお前ら。(中略)
そんなことするんだったら提携申し込んで生データもらってこいよ。門前払いだろうけどさ。

「スクレイピングしすぎ」www

Orz

という感じでキレッキレでございます。ぜひとも引用元のブログをご一読いただく思います。

スクレイピング

スクレイピングについては、「スクレイピングした物件データを利用した物件検索サービスは問題ないのか」で解説していますので、もしまだでしたらご一読頂きたく思います。

スクレイピングは許可を取らない行為のため(データ利用の合意が取れたらスクレイピングなんて不要になるはずなので)、やり方としてはグレーでリスキーな面があります。それだけではなく、グレーなスクレイピングで他社に依存していると、スクレイピングできなくなったら事業もサービスも潰れる、というか停止します。まさに、今回スクレイピングしてた物件検索サービスが即効で停止に至った理由がそれです。

分かっていれば、普通は手を出さないリスキーなビジネスです。(相当数の不動産テックの人達は分かっていないと思われ)

グレーじゃないスクレイピングは、noteがエクスポート機能をつけていない(執筆時)ために、自分の書いたnoteの文章を取得してバックアップするためにやるような場合です。この場合は、どこから見ても変な負荷かけないかぎり完全に白です。

さらに言えば、日本の不動産業界では、スクレイピングする元のサイトのデータがまともじゃないので、スクレイピングしてきて集めてもビッグデータ的には意味ないです。レインズなどの情報がどれだけ偏った不正確なものであるかを不動産業界以外の人達は知らないはずです。一般物件検索サイトだって、一部の物件に偏り、しかもそれが無断転載と2次広告で氾濫して、重複だらけとかw

何が正なのかわからないわけですが、「正しいデータ」には業界ではだれも興味がないのかもしれません。

もちろん、レインズに登録される物件そのものが少ないという問題もあります。すべての成約データが登録されているわけではない、というと「少しもれがあるくらい?」と感じてしまいますが、感覚では30%くらいは登録されていないでしょう。

業者が売主であれば義務もないため登録しないのはもちろん、専任媒介などで受けた仲介でも、直前に一般媒介に切り替えて登録しないことがあります。私の経験でも、大手不動産屋では契約成立前に一般媒介に切り替えて、レインズへの登録はしていませんでした。

レインズを使ってみての雑感 

そんなんで日本の「不動産テック」の「ビッグデータ(笑い)でございます。

あと、

会社に不動産のシロウトしかいない

あと多いのが、「不動産テックです!」と言いながら不動産取引したことないシロウトばかりの会社。たまに宅建レベルの知識すらない方もいまして、顎が外れそうになります。

なんと例えればいいのかわかりませんが、サッカーのルールを何も知らない人がデータだけ適当にいじって「こういう戦術だと絶対勝てます!なんで世界中の監督がこの戦術を取らないのか意味がわからない!!」と戦略を提案してきたので見てみたら「これ全部オフサイドやんけ」というオチだった。みたいな話を聞かされるわけです。

(中略)不動産取引の手続きは結構複雑です。なので付け焼き刃の知識だとどこに時間がかかって、どこをネットの力で短縮できるかを正確に把握できません。不動産テックな会社は知識はおろか(以下省略)。

 「オフサイド」上手いwww

という日本の不動産テック界隈の不動産業についての無知加減についての件ですが、これも以前、「日本の『不動産テック』の耐えられない軽さ」で軽く具体例に触れています。また、「日本と米国、『不動産テック企業』の決定的な違いとは」でも色々と書いています。

引用文ではサッカーの例が挙がっていますが、「不動産業界という魔界」で触れたように、「ルールを破るならまずルールを分かった上で(無意味と思う部分を)破っていく、じゃないと単に怪我をするだけです」

つまり、新しい事をするというのなら、やけくそに手あたり次第やるのではなく、まずはルールを知った上でやらないと、言う事もやる事も、トンチンカンというかポイントがずれてしまうというか・・・。

CSV弄り

CSVってばアレですよ、エクセルとかの表計算ソフトとかで書きだすテキスト形式のデータ形式です。表形式の一覧をそのままテキストファイルに書き出したようなイメージです。列の一番目は「物件名」、二番目は「賃料」みたいな。

で、このCSVで書き出したもの、またはスクレイピングで持ってきたデータをCSVにして、それを「コンバート」をする業者ってのがありまして・・・不動産ITサービスではコンバート、コンバートって言っていますが、要はCSVの「列」を入れ替えたりしている訳です。相手先に合わせて、列の一番目を「賃料」、二番目を「物件名」にして・・・みたいな。相手先が未対応の項目(列)を削除したり、一応は正規化チックなこともしているわけですが、基本はそういう事です。

そもそもこのCSVという形式、ひと昔は仕様すら固まっておらず滅茶苦茶な状態で、「CSV職人」みたいなのが居たくらいw、CSVと言っても本当に色々で、定義すら曖昧な問題だらけなフォーマットでした。最近はやっとIETFでRFC 4180として「文書化」されたのが出来たのでマシになりましたが、他の人とやりとりする形式としては、未だに色々とあって扱いたくない形式です。ましてや、一対多、多対多のやりとりでCSV形式なんてありえない話しであります。普通は。(ま、はい、日本の不動産テック業界は普通ではありません)

で、このコンバート業者、結構昔からありまして、古くは「レンターズ(今確認したら吸収合併して無くなっていた)」などがあって、「いい生活」とか色々と出てきた感。コンバート業者は沢山ありまくるし、自分はそんな無駄で化石のような(化石に失礼)話しに興味もないので知りませんw 起源としては、昔のデータ入稿代行業者あたりが始めたのではないでしょうか(適当)。

ところが、日本の「不動産テック」業界では、この「スクレイピング」や「コンバート」で新たに起業する「不動産テック」が今も後を絶ちません。どこやどこ、というのも哀れなので触れませんが。

なんでこんなんになってしまうのか、というと、「不動産情報デジタル標準化の覚書」で書いた通り、不動産物件情報が標準化されていないからであります。なんで標準化されていないのかといったら、国交省から始まって天下り元官僚から不動産業界団体から日本の不動産テック企業まで、総じてアレだからです。

もう知らんがな。

この記事が気に入ったらサポートをしてみませんか?