自分百科事典 - 日記(20240408)

EP:013 – たすけてえーあい! #capslockradio https://capslockradio.net/ep013/ @Qleil_より
wordpressの自動投稿あまりにもうまくいかなさすぎる。shownotesはまた更新したらいいかという気楽さで投稿する第13回。

https://twitter.com/Qleil_/status/1776826059213955164

投稿しました。結局色々とフローを整理したり、なんだかんだとやってたら収録から二週間ぐらいかかってしまった…

なんか寝かせてたみたいで嫌だな…寝かせるほどの内容でもないのに…
今回は編集フローだのなんだのを改善したよ的な話とメモアプリ色々触りすぎて意味わからんことになってます、みたいな話です。ザッツオール。

ぜひに。

obsidianとmemos(thino)使ってぽちぽちメモるのなれてきたのでpodcastの収録時間の調整(長すぎるから録るのも編集もダルくなる)ことも考えつつメモベースに新鮮な話題を短めのサイクルで...と言う方向にしていきたい。この気持ちだけは本物。

https://twitter.com/Qleil_/status/1776828085213835544

というわけでObsidianでメモする習慣をちょっとずつつけつつあり、編集フローに限らず、ネタ帳も移行し、なんだったらツールの使い方などもちょっとずつまとめている。

自分wikiができていく感じいいな。

特にやはりmemosがいい。一人Twitterとして紹介されていたのをみて入れたのが始まりだったが、これはある意味「無理やりTwitter的なタイムライン見せ方にしているだけ」というのがミソなんだということに気づいた。

ベースがただのテキストで保存されているので、後からの拡張性などがすごい。好きにきりはりできずに、気兼ねなく削除もできる。無論ただのテキストなので、好きにObsidian上で検索できる。

これがマジでTwitterな感じだったら後から成形するのにも手間がまぁまぁ発生しそうである。

アステロイド・シティ、なんもわからんかった

https://twitter.com/Qleil_/status/1776222387777990844

劇場ですごい観たかったアステロイド・シティが配信されていたので観た。

ウェスアンダーソンの映画はやはり不思議な魅力がある。

正直映像のことなんか何にもわかってないので「いいなぁ」と言ってるだけなのだが、なんというかピシッとしている。とっても不自然、という言い方でもいいのかもしれない。

でもこの不自然さって、几帳面な人がリモコンを机のヘリに合わせて置いておくことをルールにしている、みたいな変さだ。

なんだったら登場人物やストーリーもそういう感じがする。きっちりしていて何かルールや筋のようなものははっきりあるんだけど、わかるものではない、みたいな。

パチンと三脚にはめてグリグリ動かしているみたいなピチッとした映像にとてもとても綺麗に人とモノが配置されている。美術館に行ったみたいな気分になれてお得だったな。

しかし本当にストーリーはわからなかった。なんだったんだ。

アステロイドシティなる...場所を舞台にした演劇…をやるにあたっての役者たちの話…?

WhisperAX、色々試した。モデルのダウンロードがえろう長いので使う前に準備しとかないと。長い音声ファイルを与えてローカル書き起こしさせるのも微妙かも。iPhone15 proでもかなり熱くなった。その場でレコーディング/リアルタイムでの文字起こしや、翻訳の使い方が良さそう

https://twitter.com/Qleil_/status/1776218555929022478

iPhoneでローカル(通信なし)でWhisper(文字起こしのAIモデル的な)が使えるぞ〜い!という話を聞いてtestflightまで落として入れてみた。

非常に未来を感じるアプリケーションだ…
かなりプリミティブというか、純粋にモデルを落として文字起こしが使えます!こういうことができます!というコアの部分だけを切り出したみたいなアプリで、じゃあ何に使おうかというとどうしよっかなみたいな感じはある。

モデルのダウンロードや最適化は結構時間がかかるし(容量もデカい)、音声を読み込ませて単純に文字起こしさせるのは実用的な速さではないし、スマホもアッチアチになる(これだったらローカルじゃなくて、APIとかでやらせたらいいかなという気持ちになる)

ただ、この精度とリアルタイム性を帯びた音声翻訳、文字起こし技術が活用されてアプリケーションが生まれてきたら…とは考えてしまう。アップロードをしなくていいというのはそれはそれで大きなメリットだし。

イヤホンしながら海外ぶらぶらするだけで全部翻訳された音声で聞こえるとか。逆に話したら手元の端末に全て英語に訳されて出てくるとか…ドラえもんの世界じゃん...

逆に音声合成技術を組み合わせることで、話せない人が実際に音声を使ってかなりリアルタイムにスムーズに話せる...みたいなこと...はもう起きてたか?

子供の頃に夢見た、スターウォーズやドラえもんの世界が、案外そう遠くないところまで来ているのかもしれない。
もう少し今起きていることを新鮮に感じてみてもいいんだろうな…

サポートされると嬉しくなってもっといろんなことをするかもしれません。