2024年1月の活動記録とまとめ

2024年1月31日 12:49

アウトプットしたこと

2つの作品をリリースしました。特に前者は１万３千字オーバーの超大作だと思います。今は価格を戻しましたが最初は割引きして販売することもありますので、気になる方は注目して頂ければと思います。

自然災害

地震へのコメントと対応検討について

あけまして、おめでとうございます。
Xは構造上、必要な情報が見にくい。
地震情報を拾うときに一次リソースにしているもの
強震モニタ（防災科研）
http://www.kmoni.bosai.go.jp/

知らなかったこと（災害伝言掲示板）
https://www3.nhk.or.jp/news/special/saigai/basic-knowledge/basic-knowledge_20231116_01.html

メモ
・ネットがあれば、nhkのツイートからも拾える
・電話線があれば、ショートメッセージ、伝言掲示板
・ネットが使えないとき、どうするか、スターリンクを考える？
・充電が出来ない問題、ポータブルな太陽光充電を検討
・トイレいけないとき、携帯簡易トイレを調べる
頭を使わず手軽が鍵
・災害時、当事者でなくてもニュースを見続けるのは精神衛生上よろしくないので寝る
・食事も水も大切だが、自分の場合はトイレを優先すること
・経済支援として、観光協会の通販を検討する
・巨大地震時の地震は統計上頻発するもんだと思って諦める
・津波警報出たら逃げる
・災害時のXのトレンドは情報が錯綜しており害悪でしかないので見に行かない。1次リソースのアカウントを検索して見にいく。トレンドのタイムラインはだいたいコピペか感想、インプレ稼ぎ、デマ、フェイクなので役に立たない
・もう少し、災害時にネットなくても生き抜く知識を身につける
・高所恐怖症であるが、地震も含めて地に足を付けたいので仕事や生活するときは考える
・火の元は自動で消えるか、消しやすいか
・地盤が硬いとこに住む
・鉄道はとまったので、滞在先でやりとりできることを考える
・地震から津波が到達した時刻を調べる。ほぼ時間差ない地域なかったか

個人でも時代に即した新たなバックアップ、開発環境を整備する

地震で災害にあったときに備えて資産の保護と管理をしておかないとな。個人のプロジェクトとはいえ、それなりに時間を掛けたソースコードなどがパーになるのは辛い。全部、消失してもネットワーク上にバックアップが備えてあり、パソコンさえあればリモートで開発できるといいのかもと思った。考える。

何というか安全第一の上ですぐに取り回しの効く環境を用意したいところ。また、ソフトウェアもそういう思想で書いてった方がいいのだろうな。資産を積み上げるというよりは使用していくイメージだ。「今回、勉強もままならない」ニュースを目にした。ICT活用、全然ダメじゃないかと露呈したと思う

個人開発関連

Android及びiPhoneアプリの開発環境

もしかしたらスマホアプリ作るかも！調べてる
https://flutterflow.io/

⇒ FlutterFlowがnocodeツールとして優秀そうなので検討をしている。android studioとか、flutterとかゼロからコードを書かなくてよくなり、アプリの内容やニーズに集中できて生産速度が上がることを期待したい。ただし、コストが掛かるので回収できるかは考えた方がいいかも。

演奏支援アプリケーションを開発するための構想について

何か、DAWのエフェクター（ワウなど）をエクスプレッションペダルでmidiコントロールする製品があまり売られていない（人気がない？）、かつ、midiコントロールでいけるようなので、micro:bitで試してみようかな。
https://makecode.microbit.org/pkg/microsoft/pxt-bluetooth-midi

どうやら、midiコントローラーがあれば良さそうなのだけどね。エクスプレッションペダルも合わせて、キーボードやフットスイッチなど製品があるにはあるようなのだが、用途を満たすためだけに1万円以上は高いと感じる。
https://www.soundhouse.co.jp/products/detail/item/282171/

それこそ、midiなんて昔からある技術だし自分が知らないだけでclassicな手法でお金をあまり掛けずに実は出来るんじゃないかって考えてはいる。とりま、自由課題として攻める。https://qiita.com/wdice02136/items/24bb10e0b2eece5c54f3

なお、先日作ったbluetoothフットスイッチと合わせて、自分向けに複合システム（エクスプレッションペダルでDAWのエフェクターを操作可能/譜めくり可能）を構築できるんじゃないかと。とりあえず、家にあるもので頑張って最小限のコストで完成させたい。

英会話アプリケーションの開発進捗について

英会話アプリの開発は検証段階に進んではいるのだが、何だかイケていない気がするので、メインはPythonで書いているのだが、別な言語（Javascript）にも手を出そうと思う。まだ、課題はあるし、実際にいい感じで練習になるのかまでは掴めていないのでもう少しリリースは先になりそう。

もちろん、完璧は目指していないが、メインの機能がいい感じでほどよく使える段階でリリースはする予定、6割くらいのイメージ、後はtipsや活用を載せていくだけだ。多機能じゃないけど、一番、ほしいところに集中している感じだ。気軽な不正確な会話をできるように目指す。世界は変わるはずだ。

⇒ Electronを使って進めている。もちろん、ChatGPTにもざっくり話を聞きながら、最終的には公式リソースを読んで理解を深めている。概念も知らないから、何かキーワードがないと分からないし、提示されたコードは読んで理解するようにしている。やはり、公式リソースが最強ではあるので、教養として時間を掛けて読めるといい。開発に頭が行っているので少しでも早くとは思うのだけど、まずは何をしたいのか？何を作りたいのか？を自分の頭で整理して聞いて、整理しなおしてを繰り返して、～～したいをコード化するにはという流れで聞いている。

後は、ElectronはHTMLやCSS、Javascriptなど、特にJavascriptをしてきたユーザーにはアプリケーション開発としては親和性がメッチャ高いと思う。自然に導入しやすいと思う。内部処理は流石にプログラミングをしてきた方がいいのだろうけど。たぶん、初期UIだったらPython(Tkinter)で作るよりもお手軽だと思う。細かいメニューやＵＩは試していないので何とも言えないけど、モダンだよね。

mdnのドキュメントは読みやすい

mdnはサンプルが比較的分かりやすい部分もあってよい。他の会社のドキュメントよりは読みやすい気がする。もちろん、門外漢からすれば何これって言葉を前提抜きで当然のように使うこともあるけど。canvasってアニメーションできるのね？
https://developer.mozilla.org/ja/docs/Web/API/Canvas_API/Tutorial/Basic_animations

技術の理解、論文を読もう

英語のリーディングが自分は壊滅的なので翻訳できるのは有難い。そもそも、ざっくり読むのが目的であり、辞書を引いて訳す作業が目的ではない。そこに労力を掛けたいわけではない。本格的に正確を期したいときにすればいいことだ。ちなみに、arxivの論文はarxivにより査読はされていない。

そろそろ、論文も読んでみようと思ったのでarxiv.orgを開いた。ざっくり読めればOKにして、原文の意図通りの変換精度は忘れてPDFを和訳できないか考えたがar5ivで解決した。HTMLなのでブラウザで翻訳できるじゃん！
https://ar5iv.labs.arxiv.org/html/2307.09288

arXivでBetaだけどPDFの他にHTMLで見られる論文もあるんだな
https://info.arxiv.org/about/accessible_HTML.html
"HTML (experimental")のリンクがあればHTMLで見られる
https://arxiv.org/abs/2312.06674

音楽

お気に入りのギターソロのリスニングとプレイ

恋花という曲のギターソロをコピーしようとしてギターが重なっているのかよく分からない部分があり苦戦中、何か情報はないかと調べていたら、該当曲の作詞家と作曲家と思われるアカウントを発見した。noteすごいな。
https://note.com/nosuoke

BOSSのエフェクター（PS-6のharmony）でいけるのか検討している、購入前なので製品仕様を含めてサポートに問いあわせている。とりあえず、ギターを重ねてみたりし試しているけど難易度高そうだ。自分の耳の聞き取りの悪さ、分析力が憎い、頑張れ！

とりま、ソフトウェア音源（pitch shift）で試しているが解決していない。-3rdぽい音が鳴っている気がするが重ねる音量のバランスなのか近付かない。単純にDelay音が重なっているように聞こえるのか、detuneなのか判別つかん。本当、素人からすると自分の耳が頼りだ。

⇒ 問い合わせは完了、返答も来た。また、メインのメロディはざっくり、プレイできると思う。クオリティは気にしない姿勢だし、あの雰囲気が出せればいいと思っている口だが、ざっくりプレイのメロディの物足りなさを感じたのと、あのメロディだからいいのでは？ということでリスニングを深めて、ある程度まではメロディは追えた。後はtabに残しつつエフェクターの検討と、サブの音階を捉えていきたい

AI

AIと向き合う

パブリックコメントを送付完了
https://www.meti.go.jp/press/2023/01/20240119002/20240119002.html
「AIと著作権に関する考え方について（素案）」が面白いので読んでみるといいかも！まだまだ、取り扱いに迷いはある文章に感じられた。新技術はそんなもんなのでは？気にせずポジティブな議論が行われればと思う。

Fine-TuningとRAGの選定と、モデルの開発について

Google ColaboratoryのProプランを使用しているのだが、A100を選択するとVRAMが40GBまで拡張されて、RAMも12GBから大幅にアップされるんだな。いつもケチってT4 GPUにしているので知らんかった。Fine-TuningなどVRAMが不足したら使おう

Fine-Tuning(QLora/unsloth)とRAGについて調べたり試したが分かりにくいな。datasetはどうやって作るのか、自分の手元にあるモデルはどう読み込むのかなど汎用的な使い方がソースコードから読み取りにくく説明がない。llama 7b chatのFTが分からん

RAGは概念的には分かるのだが、毎回、読ませるのか意味が分からない。QAとして使うならば、定型文をそのままの方が正確に思えるけど。学習させるということは誤差が発生する認識だ。また、LLMのモデルは上位、何社かのモデルで充分な気がしてきた。個別でチューニングとか非効率でわけわからん

Style-Bert-VITS2

Style-Bert-VITS2"、環境構築が無事に終わった。API_SERVERも備えているので次回は、リクエストを試してみる。後はトレーニングを試してみたい。感情表現が出来て面白い。https://github.com/litagin02/Style-Bert-VITS2

⇒　実際にトレーニングして発話させるところまで完了した。RVCとはまた違うのだろうけど、テキストからスピーチさせるのは面白い。私的なキャラマスコットの夢に一歩近づいたかもしれん。なお、リクエストも試したが、実際にコマンドでは試していないのでクリアできれば当面の課題は完了といったところか

Moore-AnimateAnyone、AI生成は基本Gradioのデモから触るのをオススメする。プロジェクトには敬意を表しつつも、自分にとってイマイチなアウトプットが出たら、環境構築をして試す時間は無駄になるからだ。無駄な時間は回避
https://github.com/MooreThreads/Moore-AnimateAnyone

アニメ

ぽんのみち、麻雀ルール掲載しているんだな。アニメはまさかの雀魂がｗｗｗ https://ponnomichi-pr.com/rule

note

メンバーシップを始めてみる

https://note.com/goto_finance/n/nbad7224ddc21
こちらのメンバーシップがすごいな。note投稿ユーザーではないアカウント（消費向けアカウント）が恐らく、サービスを受けるために大量にフォローしている。プロフィールページもそのまま受け取れば好感が持てる。汚くなったのは自分か

⇒　とりあえず、メンバーシップは開設できたのでアウトプットが出来次第、更新といった感じだ。リンクにある方のメンバーシップの参加人数がやばい。

５００円＊３万人＝１５００万円 / 月の計算になる。普通に３億/年の売り上げになってヤバス、1年で生涯年収達するのはすごいな。ファイヤーできる。もちろん、手数料、税金の差し引き、何かしらのコストもあるだろうからそのままではいけないだろうけど。まあ、トップ層は目指せなくても、ファイヤーできるように自分はやっていきたい