Empath研究所

人の声から感情を解析するAIを国産でつくる株式会社Empathのメンバーがお届けするnoteです。日々の研究結果やまとめをみなさんにシェアし、技術や感情についての理解を深めて頂けたら幸いです。

Empath研究所

人の声から感情を解析するAIを国産でつくる株式会社Empathのメンバーがお届けするnoteです。日々の研究結果やまとめをみなさんにシェアし、技術や感情についての理解を深めて頂けたら幸いです。

    マガジン

    • 音声/音質の評価方法

    • 研究者が書く!論文まとめ

      Empathの研究者が興味深い論文をまとめています。1つ読むごとに、雑学が1つ増えるかも!

    • 音の三大要素について

      Empathの研究者、山岡さんがやさしくかつ丁寧に音について解説しています。音声ファイルもあるので実際に耳で聞いて体感できます。

    • 『統計の歴史』を読む

      西田さんが読んだ本「統計の歴史」から、まとめられているnoteです。人はいつから統計をやってきたのか?このように個別のデータを収集して全体的な傾向をつかむということを、人はいつからできるようになったのか?一緒に探求しましょう!

    • 学会報告

      Empathの研究者が参加した学会の報告をまとめています。日頃、研究者ではない限りなかなか参加することのない、学会の様子を垣間見ていただければと思います!

    最近の記事

    新しい日本語大規模音声コーパス

    0. この記事から理解できることは?ReazonSpeechとは何か 1. ReazonSpeechとはReazonSpeechは、レアゾン・ヒューマンインタラクション研究所によって開発され、2023年1月に公開された、世界最高レベルの高精度日本語音声認識モデルおよび世界最大(19,000時間)の日本語音声コーパスです。 「ReazonSpeech」の特徴として以下が挙げられます。 以下それぞれの特徴について詳しく見ていこうと思います。 1.1 音声認識モデル 表1

      • Speaker Diazrization From Nemo | 第一回

        この記事を書いたのは 山岡さん. 0. この記事から理解できることは?Speaker Diarizationとはどのような技術か Speaker Diarizationの評価基準  Nemoの提供しているモデルがどのようなモデルか 2者間の音声データにおける精度 1. Speaker DiarizationとはSpekaer Diarizationとはいつだれが話したかを推定する問題です。 つまり、図1に示してある通り、入力は音声データの信号で、出力が音声区間のタイ

        • NVIDIA Nemo| 第1回

          この記事を書いたのは 山岡さん. 1. この記事から理解できることは?NVIDIA Nemoとは何か NVIDA Nemoで出来ること 2. NVDIA Nemoとは?NeMoは、会話型AIアプリケーションを作成するためのオープンソースのPythonツールキット。 NeMoツールキットは、再利用可能なコンポーネントであるNeural Modulesを用いて、会話型AIのための複雑なニューラルネットワークアーキテクチャを研究者が簡単に構成することが出来ます。(この点がめ

          • Empathと私のこれまでとこれから|その2

            このnoteを書いたのは西田さん. 前回の記事はこちら 文系研究者として一般企業で働く道を開拓したい そんなEmpathで今年7月から仕事をしてみて、ますます「自分のような文系研究者が企業で研究しながら働けることって稀なことなんだな」と思うようになりました。もちろん私は、(特に人文学系の)研究者の就職先がないという問題について、仕方がないものだと諦めてはいません。この問題の解決の一助にできればという思いもあり、人文知を活かせる仕事ってなんだろうと、最近考え始めました。

          マガジン

          マガジンをすべて見る すべて見る
          • 音声/音質の評価方法
            Empath研究所
          • 研究者が書く!論文まとめ
            Empath研究所
          • 音の三大要素について
            Empath研究所
          • 『統計の歴史』を読む
            Empath研究所
          • 学会報告
            Empath研究所
          • 心理学の再現性問題
            Empath研究所

          記事

          記事をすべて見る すべて見る

            2023年 新春の挨拶

            2023年の年始にあたり、謹んで新年のご挨拶を申し上げます。 昨年は、新型コロナウイルスの脅威、ウクライナ戦争の勃発、サプライチェーンの乱れ、急激な円安など、世界的に事業を取り巻く環境が大きく変化しました。このような激動の1年の中ですが、弊社の新しく始めた取り組みの一つであるNoteへの投稿を閲覧、いいねをして下さり大変感謝しております。 技術革新もとどまるところを知りません。基盤モデル(Foundation Model)と呼ばれる大量・多様なデータから高い汎化性能を獲得

            Empathと私のこれまでとこれから|その1

            このnoteを書いたのは西田さん. こんにちは。最近英語の文法を学びなおしている西田です。 このnoteを定期的に更新するようになったのが今年の5月でしたが、気がつけばもう12月も後半になりましたね。 私の場合は中学生くらいからでしょうか、毎年12月にはその年を振り返り「あぁ今年もあっという間だったなぁ」と思うようになったのですが、今年もまた時間が過ぎ去る速度(?)が過去最高を記録しました。みなさんはいつからこのような「ジャネの法則」あるいは「光陰矢の如し」を実感するよう

            Empath研究所を支えるなかまたちについて

            はじめまして、Empath研究所の編集をしている、Empath PR担当のジンです。 今日は毎回の学問的なBlogから少し離れて、Emapthの仲間たちをご紹介したいと思います。特に、この半年間にジョインした、研究・開発にかかわるメンバーについていくつかインタビュー記事があるので、ぜひnoteを通じてEmpathを知ってくださった方にもご注目いただければと思います。 エンジニアの川上さん・ロペさん Head of R&D 松本さん 全てお読みいただいた方はきっと「おな

            音声/音質の評価方法 第2回

            この記事を書いたのは 山岡さん. 0. 前回の記事の内容前回の記事まだご覧になってない方はぜひこちらから読んでみてください。 1. この記事から理解できることは? 一対比較法について  一対比較法における一意性の検定 2. 一対比較法とは一対比較法とは… 全ての評価対象系により出力される1音声について、取り得る2つの組合せ全てに対して、音声を比較し優劣を判定する方法です。 そのため$${n}$$個の評価対象系($${A_1}$$, $${A_2}$$,…,$${A_

            音声/音質の評価方法 第1回

            この記事を書いたのは 山岡さん. 1. 音声評価/音質評価の必要性音声評価 / 音質評価は多くの音声の研究において必要不可欠な作業です。 評価は、初めは人手によって行われることが多く、この作業によって集まったデータを基に、自分自身の声の特徴やあるサービスの音声・音質での数値化するのを助けてくれます。 数値化することにより、比較をすることが可能となり改善プロセスを回したり、生活の助けとなる可能性を秘めています。 2.評価方法評価方法には主観的な評価と客観的な評価の2つが存

            感情認識の手法

            この記事を書いたのは 山岡さん. 0. 本記事から分かること感情認識の手法 1. 感情認識の手法感情認識は、様々な手法が提案されていますが、大きく分けると視覚情報を用いた手法と聴覚情報を用いた手法の2つに分類が可能です。 本記事では特に聴覚情報を用いた手法について詳しく紹介していきます。 1-1. Keyword‑based method キーワードベースの感情検出は、最も直感的で簡単なアプローチです。 この手法のアイデアは、感情のキーワードにパターンを見つけて、それ

            音の三大要素について 第五回

            この記事を書いたのは 山岡さん. 0. 前回の記事の内容前回は、pythonを用いて音量を算出しました。 まだご覧になってない方はぜひ下のリンクから読んでみてください。 1. この記事から理解できることは?Pythonを用いて音の高さを算出する方法 2. Pythonを用いた音高の算出音の三要素について第三回の記事で、音の高さに関する紹介をしました。 第3回の記事は理論ベースの話でしたが今回は、実際にプログラミングを用いて音の高さを数値化してみます。 第4回で音量を用い

            『統計の歴史』を読む3

            統計で見えるようになるもの、統計で見えなくなるものこのnoteを書いたのは西田さん. 『統計の歴史』を読む2 のつづきです。 世界を数量化する動きの傍らで 第8章では、統計とともに発展したものではなく統計に対峙するものとして、レイは文学を挙げています。第8章を通じて世界を数値化することで削ぎ落とすことになる現実感や個別性を、人間の細部を繊細に描き出そうとする文学が補完してくれるという関係にあると、レイは考えています。 統計と人文学 第8章では人間や社会の細部を描くもの

            『統計の歴史』を読む 2

            このnoteを書いたのは西田さん. 『統計の歴史』を読む1 のつづきです。 世界の「数量化」は最近の発明だった「世界と個人を数字で見ること」。これは21世紀のいまとなってはすっかり当たり前の感覚となっています。たとえば、「日本の平均寿命は延伸傾向にある」ことから日本の医療の発展について語ることができます。また、平均寿命が何年なのかを知っていれば、それを超えた人に対して「長生きですごいなぁ」と感心しますね。 しかし、このように世界と個人を数字で見るという考え方は、実は人類史

            学会報告|AFFECTIVE COMPUTING & INTELLIGENT INTERACTION (ACII 2022)

            この記事を書いたのは 山岡さん. 10/17(月)~10/21(金)に第10回 AFFECTIVE COMPUTING & INTELLIGENT INTERACTIONが奈良県の「奈良春日野国際フォーラム甍」開催され、Empathからは山岡が参加させていただきました。 AFFECTIVE COMPUTING & INTELLIGENT INTERACTIONはACIIと呼ばれる国際学会で2005年に第一回目が開催されました。 ACIIでは名前の通り、人の感情を解析して

            『統計の歴史』を読む 1

            このnoteを書いたのは西田さん. 統計とは何か?突然ですが、みなさんは「統計」をご存知ですか? 私たちの一番身近な「統計」といえば、「平均」でしょうか。その求め方はご存知ですか? たとえば、あるクラスの生徒30人が数学のテストを受けたとしましょう。テスト結果が返ってきて、その平均点を求めたいときは、 (生徒30人の点数の合計)÷(生徒数30) これを計算すれば良いですね。 ここで算出された平均値は、そのクラスの数学のテストが全体的にどのような出来だったのかを表して

            音の三大要素について 第四回

            この記事を書いたのは 山岡さん. 0. 前回の記事の内容前回は、「音の高さ」を音声波形から数値化する手法について紹介しました。 まだご覧になってない方はぜひ下のリンクから読んでみてください。 1. この記事から理解できることは?Pythonを用いて音の大きさを算出する方法 2. Pythonを用いた音量の算出音の三要素について第二回の記事で、音の大きさを表す指標についての記事を掲載しました。 今回は、RMSに注目して音量を算出していきます。 Pythonには様々なライブ