株式会社レトリバ

株式会社レトリバ(Retrieva, Inc.)の公式アカウントです。自然言語処理AI技術を用いて、… もっとみる

株式会社レトリバ

株式会社レトリバ(Retrieva, Inc.)の公式アカウントです。自然言語処理AI技術を用いて、人々を幸せにするミッションのもと、日々技術を研究し格闘しています。AI技術を使ってより豊かな暮らしが送れるようにしていきたい!

最近の記事

  • 固定された記事

【新卒広報レポート】テキスト分析AIツール「YOSHINA」って何?!

こんにちは!株式会社レトリバ広報担当の辻です!新卒一年目でレトリバに入社した私が、レトリバのメインプロダクトであるテキストデータ分析AIツール「YOSHINA」への理解を深めるべく、「YOSHINA」プロダクトオーナーである鷺坂さんへのインタビューを通して学んできました。 今回はその様子をレポートします! プロダクトオーナー紹介そもそも「YOSHINA」とは?辻:レトリバのメインプロダクトである「YOSHINA」ですが、そもそも何ができるツールなのでしょうか? 鷺坂:「

    • 【新卒広報レポート】技術者・管理者向けの生成系AI教育プログラムをひとり広報の私が受けてみた

      こんにちは!株式会社レトリバ新卒広報担当の辻です。 今回は現在開発中の生成系AIのノウハウをレクチャーする生成系AI講習プログラムを、新卒ひとり広報の私が実際に受けてきたので、その内容をリポートします! もともとはお客様のご要望を受け、実施をした生成系AI講習プログラムですが、受講していただいたお客様からは90%以上の満足度をいただいています。今後、生成系AIを活用したいと考えている中堅大手企業・官公庁・自治体の技術者や担当者およびマネジメント層に講習プログラムを展開してい

      • wikiHowから日本語要約データを作成してみた

        ※こちらの記事は、2020年7月2日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 こんにちは。 カスタマーサクセス部リサーチャーの勝又です。 私はレトリバで自然言語処理、とくに要約や文法誤り訂正に関する研究の最新動向の調査・キャッチアップなどを行っております。 今回の記事ではKoupaee and Wang(※1)によって作成された英語要約データセットを参考に、日本語でも同様の要約データセットを作成した話をします。 現状の日本語要

        • 文字列アルゴリズムは世界を救う?Suffix Array と Longest Common Substrings

          ※こちらの記事は、2020年6月2日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 レトリバのCTOの武井です。(https://twitter.com/goth_wrist_cut ) 新型コロナウィルスが世界で猛威を振るっていますが、皆様安全に過ごせておりますでしょうか。 レトリバでは フルリモート化 や、 交流なども オンライン飲み会 にするなど、工夫して過ごしています。 さて、今回はそんな新型コロナウィルス、COVID-19

        • 固定された記事

        【新卒広報レポート】テキスト分析AIツール「YOSHINA」って何?!

          テキストマイニングの基礎知識|3つの手法から活用例までわかりやすく解説

          こちらの記事は2021年3月30日にRetrieva OFFICIAL BLOGにて掲載された記事を再掲載したものとなります。 テキストマイニングとは、テキストデータを活用し、情報を抽出することを指します。社内のデータを活用して、テキストマイニングを行いたいと考えている担当者も多いでしょう。この記事では、テキストマイニングとは何なのか、目的や種類、代表的な手法などについて詳しく解説します。導入を検討している場合は、ぜひ参考にしてください。 テキストマイニングとは?テキスト

          テキストマイニングの基礎知識|3つの手法から活用例までわかりやすく解説

          AI活用により効率化できる業務は?実際の活用事例まで徹底解説!

          ※こちらは2021年2月15日にRetrieva OFFICIAL BLOGにて掲載したものの再掲載となります。 業務効率化の手段として、AIに大きな注目が集まっています。自社で活用しようと思っても、具体的なイメージが湧きにくい人は、多いのではないでしょうか。 この記事では、AI活用で効率化できる業務について解説します。具体的な活用事例も紹介しているので、AI活用を検討する際の参考にしてください。 AIとは?AIとは「Artificial Intelligence」の頭

          AI活用により効率化できる業務は?実際の活用事例まで徹底解説!

          Pyserini(Faiss)を使ってお手軽Entity検索をやってみた!

          こんにちは。 リサーチャーの勝又です。 私はレトリバで自然言語処理、とくに要約や文法誤り訂正に関する研究の最新動向の調査・キャッチアップなどを行っております。 今回の記事では、Pyseriniという情報検索の研究で使われるPythonライブラリの簡単な使い方、拡張方法について紹介します。 Pyseriniとは近年、Large Language Model(LLM)の流行に伴い、Retrieval-augmented Language Modelのように、情報検索技術の需要

          Pyserini(Faiss)を使ってお手軽Entity検索をやってみた!

          文字列検索の話(その1): ナーイブ検索と KMP法 BM法

          ※こちらの記事は、2020年5月21日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 CTO武井です。今回は2018/10/02にセミナーでお話した、文字列検索の話をブログにしようと思います。 セミナーでは時間の都合もあって、スライドにコードを載せてもなぁ、という感じで詳細は省いたのですが、 ブログではコードが載せられますので、コードを載せつつ説明していこうと思います。 ブログの文量が毎回とんでもないことになってしまうので (参考:

          文字列検索の話(その1): ナーイブ検索と KMP法 BM法

          ChatGPTを活用したチャットボット「YOSHINAボット」のログを「YOSHINA」で分析してみた

          こんにちは!株式会社レトリバ「YOSHINA」プロダクトオーナーの鷺坂です。今回は、2023年7月にリリースされた「YOSHINAボット」の会話ログを当社のAIテキスト分析ツール「YOSHINA」で分析をしてみましたので、その結果をご紹介します。 「YOSHINAボット」について「YOSHINAボット」は、レトリバが独自に持つナレッジ集とChatGPTの要約要素を組み合わせたチャットボットです。用意されたQAやシナリオでの回答ではなく、人の応対のような回答を提示できるため、

          ChatGPTを活用したチャットボット「YOSHINAボット」のログを「YOSHINA」で分析してみた

          とある新入社員の修論解説 〜音素認識〜

          こちらの記事は、2020年4月27日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 はじめまして。 2020 年度に新卒でレトリバにリサーチャー職で入社した古谷です。 私は、大学院で聴覚障害者の発話訓練を支援するための音素認識について研究していました。 そこで今回は、新入社員の第 1 回目の記事として、大学院での研究について簡単に紹介したいと思います。 なお、簡潔に書くため、一部で厳密でない表現を使っている部分があります。ご了承く

          とある新入社員の修論解説 〜音素認識〜

          とある新入社員の修論解説 〜文法誤り訂正〜

          こちらの記事は、2020年4月22日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 こんにちは。 2020年度に新卒でレトリバにリサーチャー職で入社した勝又です。 今回の記事では私の修士論文について説明し、具体的にどのようなテーマを修士で研究したのか簡単にご紹介します。 修論タイトル: 少量のラベルデータを利用した文法誤り訂正近年、自然言語処理ではニューラルネットワークを用いた手法が盛んに研究されています。 このニューラルネットワー

          とある新入社員の修論解説 〜文法誤り訂正〜

          Ruby on Rails & Postgresqlでベクトル近傍検索を手軽に実装するためのTips

          こんにちは。YOSHINA SaaS事業部エンジニアの高瀬です。 OpenAIとAzureOpenAIServiceの使い分けについての 前回の記事 に引き続き、ChatGPTと連携するアプリケーションを開発するために役立ちそうな様々なTipsをご紹介していきます。 本記事では Pgvector と neighbor を連携させて、Ruby on Railsでベクトルの近傍検索を可能にする方法についてご紹介します。Pgvector は Postgresql で ベクトル近

          Ruby on Rails & Postgresqlでベクトル近傍検索を手軽に実装するためのTips

          簡潔データ構造ってなに?

          こちらの記事は、2020年3月31日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 こんにちは。レトリバのリサーチャーの木村@big_wingです。レトリバでは学習アルゴリズムの高速化や低リソース化に取り組んでいます。今回から何回かに分けて簡潔データ構造について紹介していく予定です。 初回である今回は簡潔データ構造の概念について紹介します。 簡潔データ構造の書籍としてはNavarro氏の本、日本語で書かれたものとしては定兼氏の本と岡野

          簡潔データ構造ってなに?

          第2回生成系AI勉強会を開催いたしました!

          こんにちは!株式会社レトリバ広報担当の辻です!今回は、7月26日(水)に社内で行われた第2回 生成系AI勉強会についてご紹介します。(第1回 勉強会のご紹介はこちら) 勉強会の概要レトリバは自然言語処理に取り組んでおり、昨今は生成系AIについて質問される機会が多くなっています。そこで、今回の勉強会は、顧客対応を行う社員が、お客様から生成系AIについて質問されたときにしっかり説明できる知識を学ぶということをテーマに開催しました。 講師は、「日本語T5モデルの公開」を執筆した

          第2回生成系AI勉強会を開催いたしました!

          TopicModelの最終形態? Structured Topic Modelのご紹介

          こちらの記事は、2020年2月7日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。 こんにちは。レトリバの飯田です。カスタマーサクセス部 研究チームに所属しており、論文調査やそのアルゴリズムを実行するスクリプトの実装などを行なっています。 今回は、Bag of Words(BoW)表現に於いて、これがTopicModelの最終形態ではないか?と私が思っているStructured Topic Modelの紹介と再現実装をpythonで行なっ

          TopicModelの最終形態? Structured Topic Modelのご紹介

          高性能多言語埋め込み

          こんにちは。レトリバの飯田(@HIROKIIIDA7)です。新技術研究開発室で チームのリーダーをしています。このブログでは、SimCSE[1]、DiffCSE[2]など、教師なし文表現の紹介を行ってきました。近年、ついに多言語で使用可能な埋め込み表現 ME5が現れ、話題となっているため、今回はそのベンチマークを日本語で行いました ME5についてME5はE5(EmbEddings from bidirEctional Encoder rEpresentations)の多言語

          高性能多言語埋め込み