見出し画像

404|アップデート0_325~の見通し

最近、仕事中にボソッと「鉄塊」とつぶやいていますw

AIブームの波にうまく乗れた

偶然と言えば偶然ですが、うまい具合にAIが流行ってくれたおかげで、研究が飛躍的に進みました。
以前まで、AI研究は水面下で進められてきましたが、ChatGPTが表舞台に出てきたことで、どこもAIや新機能を公表するようになったからです。

サンプリング周りのRPA

ChatGPTにサンプリングプログラムの設計を聞いてみたんですが、「ライブラリを活用した方がいい」とのことだったんですね。
ただ、ライブラリを検索してみたら、テキストマイニングライブラリとか、未だに「tinysegmenter」が勧められていたんですよ。笑(10年前から進歩していない?) 

「tinysegmenter」…以前に実験したら、文章を1、2文字レベルまで粉々に分解してくれましたw 

「な、何もそこまでしろとはwww」 

また、辞書構築アプリは自作してありますが(固有名詞抽出)、サンプリングプログラム(ハイライター)を現在以上の精度にアップデートするとなると、工数的に時間が足りないのが現状です。

一応、スクレイピング(プログラムによるウェブからの情報収集)についても聞いてみましたが、やはり「規約に注意が必要」(サイトが重くなることがあるので規制するサイトが多い)とのことでした。(僕はRSS【サイトが提供している更新情報のサマリー】を取得しています) 

Googleが「文字起こしAI」をリリース

Googleが「文字起こしAI」をリリースするみたいですね~。
これまでSeraの自然語検索は、人間が話す言葉を手動で入力する必要がありましたが、音声から文字起こしができるんだったら、人間語で話しかけることができます。

#那由他 #Sera #アップデート #AI #DX #RPA

謙虚でポジティブに続けていきたいと思っています!応援よろしくお願いします^^