![見出し画像](https://assets.st-note.com/production/uploads/images/118744588/rectangle_large_type_2_8cc744ea4c3b23418cbcabad14db6f59.png?width=800)
404|アップデート0_325~の見通し
![](https://assets.st-note.com/img/1697147574786-5qisI5yB0B.png)
AIブームの波にうまく乗れた
偶然と言えば偶然ですが、うまい具合にAIが流行ってくれたおかげで、研究が飛躍的に進みました。
以前まで、AI研究は水面下で進められてきましたが、ChatGPTが表舞台に出てきたことで、どこもAIや新機能を公表するようになったからです。
サンプリング周りのRPA
ChatGPTにサンプリングプログラムの設計を聞いてみたんですが、「ライブラリを活用した方がいい」とのことだったんですね。
ただ、ライブラリを検索してみたら、テキストマイニングライブラリとか、未だに「tinysegmenter」が勧められていたんですよ。笑(10年前から進歩していない?)
※「tinysegmenter」…以前に実験したら、文章を1、2文字レベルまで粉々に分解してくれましたw
「な、何もそこまでしろとはwww」
また、辞書構築アプリは自作してありますが(固有名詞抽出)、サンプリングプログラム(ハイライター)を現在以上の精度にアップデートするとなると、工数的に時間が足りないのが現状です。
一応、スクレイピング(プログラムによるウェブからの情報収集)についても聞いてみましたが、やはり「規約に注意が必要」(サイトが重くなることがあるので規制するサイトが多い)とのことでした。(僕はRSS【サイトが提供している更新情報のサマリー】を取得しています)
Googleが「文字起こしAI」をリリース
Googleが「文字起こしAI」をリリースするみたいですね~。
これまでSeraの自然語検索は、人間が話す言葉を手動で入力する必要がありましたが、音声から文字起こしができるんだったら、人間語で話しかけることができます。
謙虚でポジティブに続けていきたいと思っています!応援よろしくお願いします^^