日本の「不動産テック」が誇る最新技術とは?スクレイピングとCSV弄り?
日本の「不動産テック」が誇る最新技術とは・・・
スクレイピングとCSV弄り
でございます。
「日本の不動産テック企業のほとんどはただのスクレイピング屋である」
これは数年前に一部界隈でかなり話題になったブログですが、傑作なのであります。
「ごまかせる業界はもう不動産しかない」「適当すぎてやばい」「テック名乗るな馬鹿野郎」www
「スクレイピングしすぎ」www
Orz
という感じでキレッキレでございます。ぜひとも引用元のブログをご一読いただく思います。
スクレイピング
スクレイピングについては、「スクレイピングした物件データを利用した物件検索サービスは問題ないのか」で解説していますので、もしまだでしたらご一読頂きたく思います。
スクレイピングは許可を取らない行為のため(データ利用の合意が取れたらスクレイピングなんて不要になるはずなので)、やり方としてはグレーでリスキーな面があります。それだけではなく、グレーなスクレイピングで他社に依存していると、スクレイピングできなくなったら事業もサービスも潰れる、というか停止します。まさに、今回スクレイピングしてた物件検索サービスが即効で停止に至った理由がそれです。
分かっていれば、普通は手を出さないリスキーなビジネスです。(相当数の不動産テックの人達は分かっていないと思われ)
グレーじゃないスクレイピングは、noteがエクスポート機能をつけていない(執筆時)ために、自分の書いたnoteの文章を取得してバックアップするためにやるような場合です。この場合は、どこから見ても変な負荷かけないかぎり完全に白です。
さらに言えば、日本の不動産業界では、スクレイピングする元のサイトのデータがまともじゃないので、スクレイピングしてきて集めてもビッグデータ的には意味ないです。レインズなどの情報がどれだけ偏った不正確なものであるかを不動産業界以外の人達は知らないはずです。一般物件検索サイトだって、一部の物件に偏り、しかもそれが無断転載と2次広告で氾濫して、重複だらけとかw
そんなんで日本の「不動産テック」の「ビッグデータ」(笑い)でございます。
あと、
「オフサイド」上手いwww
という日本の不動産テック界隈の不動産業についての無知加減についての件ですが、これも以前、「日本の『不動産テック』の耐えられない軽さ」で軽く具体例に触れています。また、「日本と米国、『不動産テック企業』の決定的な違いとは」でも色々と書いています。
引用文ではサッカーの例が挙がっていますが、「不動産業界という魔界」で触れたように、「ルールを破るならまずルールを分かった上で(無意味と思う部分を)破っていく、じゃないと単に怪我をするだけです」
つまり、新しい事をするというのなら、やけくそに手あたり次第やるのではなく、まずはルールを知った上でやらないと、言う事もやる事も、トンチンカンというかポイントがずれてしまうというか・・・。
CSV弄り
CSVってばアレですよ、エクセルとかの表計算ソフトとかで書きだすテキスト形式のデータ形式です。表形式の一覧をそのままテキストファイルに書き出したようなイメージです。列の一番目は「物件名」、二番目は「賃料」みたいな。
で、このCSVで書き出したもの、またはスクレイピングで持ってきたデータをCSVにして、それを「コンバート」をする業者ってのがありまして・・・不動産ITサービスではコンバート、コンバートって言っていますが、要はCSVの「列」を入れ替えたりしている訳です。相手先に合わせて、列の一番目を「賃料」、二番目を「物件名」にして・・・みたいな。相手先が未対応の項目(列)を削除したり、一応は正規化チックなこともしているわけですが、基本はそういう事です。
そもそもこのCSVという形式、ひと昔は仕様すら固まっておらず滅茶苦茶な状態で、「CSV職人」みたいなのが居たくらいw、CSVと言っても本当に色々で、定義すら曖昧な問題だらけなフォーマットでした。最近はやっとIETFでRFC 4180として「文書化」されたのが出来たのでマシになりましたが、他の人とやりとりする形式としては、未だに色々とあって扱いたくない形式です。ましてや、一対多、多対多のやりとりでCSV形式なんてありえない話しであります。普通は。(ま、はい、日本の不動産テック業界は普通ではありません)
で、このコンバート業者、結構昔からありまして、古くは「レンターズ(今確認したら吸収合併して無くなっていた)」などがあって、「いい生活」とか色々と出てきた感。コンバート業者は沢山ありまくるし、自分はそんな無駄で化石のような(化石に失礼)話しに興味もないので知りませんw 起源としては、昔のデータ入稿代行業者あたりが始めたのではないでしょうか(適当)。
ところが、日本の「不動産テック」業界では、この「スクレイピング」や「コンバート」で新たに起業する「不動産テック」が今も後を絶ちません。どこやどこ、というのも哀れなので触れませんが。
なんでこんなんになってしまうのか、というと、「不動産情報デジタル標準化の覚書」で書いた通り、不動産物件情報が標準化されていないからであります。なんで標準化されていないのかといったら、国交省から始まって天下り元官僚から不動産業界団体から日本の不動産テック企業まで、総じてアレだからです。
もう知らんがな。
この記事が気に入ったらサポートをしてみませんか?