最近の記事

最近取り組んでいること(データの管理と検索改善)

Ubie にMLエンジニアとして転職してからメインで所属しているグループ(ホラクラシーでいうサークル)が3回ほど変わりました。 入社してからやっていたこと 当初メインで所属していた2つサークルでは以下のような仕事をしていました。 検索精度の向上 - 入社する前は Ubie ではあまり検索の仕事は無いのではないかと思っていたんですが、以外に結構ありました。Ubieが提供する各種サービスでは検索機能を提供しておりその精度を向上する作業に携わっていました。 自然言語を入力とす

    • 断熱でリモートワーク環境を改善〜省エネかつ快適な作業環境にむけて

      私が働いている Ubie Discovery はリモートワークで働いているメンバーが多い会社です。私も完全にリモートという程ではないですが、大部分の作業を自宅でしています。家で作業していると、家族とのコミュニケーションが増えているのを感じています。 自宅作業環境の問題点自宅での作業とその環境は気に入っているんですが、夏と冬に快適性が損なわれるのが悩みどころでした。つまり部屋の温度が夏は熱く、冬は寒くなりがちです。エアコンをガンガンに発動すればなんとかなるんですが、特にに昨今

      • 自作の転置インデクスを導入する~プロダクトの価値検証時に検索機能を提供するコストを低減

        検索のしごとをしていると「今、専門用語XXの検索はSQLのLIKE文で実装されている。しかし精度が厳しいので、Elasticsearchのような検索エンジンを使って精度を向上したい」という要望をもらうことがあります。 新規に Elasticsearch(Es)やSolrのような検索エンジンを使う場合、以下のようなタスクが考えられます。 クラスタの作成(QA、Staging、Production) ECなどの分野でミッションクリティカルな検索サービスで使っているものとクラ

        • 検索システム ― 実務者のための開発改善ガイドブックを読んで

          検索システム ― 実務者のための開発改善ガイドブックを読みました。この記事はその感想です。 全体的な感想特定の検索エンジンに関係なく役立つ内容が書かれているので、自分を含めどの検索エンジンを使っている人でもためなる内容となっています。 関連する多くのトピックが網羅されているので、検索を実際に導入する方がはじめに読んでこの分野の大まかな地図を得るのにベストな書籍だと思います。 インデクスやクエリだけでなく評価方法、ログの扱い、インデクス方式(リアルタイム、バッチ)の特性と

        最近取り組んでいること(データの管理と検索改善)

        • 断熱でリモートワーク環境を改善〜省エネかつ快適な作業環境にむけて

        • 自作の転置インデクスを導入する~プロダクトの価値検証時に検索機能を提供するコストを低減

        • 検索システム ― 実務者のための開発改善ガイドブックを読んで

          Ubie Discovery に転職しました(人生初の入社エントリ)

          今まで入社(転職)エントリを書いたことがないので、先人の転職エントリを横目に見つつ書きました。 自己紹介 かなり昔(15年前)にデータマイニング分野で Ph.D を取得してからずっとソフトウェアエンジニアをやっています。いろいろな会社でソフトウェアエンジニアをやってきたなかで担当させてもらうのが多いトピックは検索エンジン、機械学習の導入周り(理論部分は置いていかれているので、リリースされたシステムを頑健にしたり、シンプルな構成でリリースして機械学習の差込口を作ったり)です

          Ubie Discovery に転職しました(人生初の入社エントリ)