マガジンのカバー画像

日々の学びメモ

技術的なメモやサンプルコード、思いついたアイデア、考えたこと、お金の話等々、頭をよぎった諸々を気軽に垂れ流しています。
文章やサンプルコードは多少荒削りかもしれませんが、ブログや書籍にはまだ書いていないことを日々大量に…
¥400 / 月
運営しているクリエイター

記事一覧

swift-coreml-diffusers のコードを読んだメモ

この発表をする際に、自前で変換・圧縮したCore ML Stable Diffusion検証用として下記OSSアプ…

shu223
3日前
1

1行で翻訳機能を追加できる Translation API #WWDC24

WWDC24のセッション "Meet the Translation API" を見たメモ アプリに翻訳機能を入れられます…

shu223
1か月前
31

"What’s new in DockKit" のまとめ #WWDC24

DockKitは、iOS 17で追加されたフレームワークで、対応デバイスが今年に入ってやっと発売され…

shu223
1か月前
8

Core ML Stable Diffusion の SPLIT_EINSUM_V2 サポート

SPLIT_EINSUM_V2 とはml-stable-diffusion のv1.0.0で追加されたアテンション実装。Neural En…

shu223
2週間前
1

Swift Markdown の使い方

Swiftで書かれたMarkdownパーサーをGitHub検索したら、Apple謹製のものがあった。 最新リリー…

shu223
1か月前
4

llama.cppの公式Swift Packageの使い方を調べたメモ - llama.swiftuiのコードリーディ…

llama.cppにはiOS/macOS/visionOSに組み込みやすいようにSwift Packageが用意されている。 ・…

shu223
1か月前
6

OpenAIのストリーミングAPIについて調べたメモ

GPT-4oはマルチモーダルが売りで、発表では音声や動画を用いて人とリアルタイムコミュニケーションをしていたが、現状、Chat Completion APIは音声の入出力・動画入力をサポートしていない。(フレーム画像を送る方式はサポートしているが) マルチモーダルなリアルタイムコミュニケーションについてあれだけアピールしたのだから、これからそういうAPIも公開されると思われる。どんな感じのAPIになるのか想像するために、既存のWhisperモデル、TTSモデルを用いた音声入

OpenAI APIにiOSから動画を投げる実装のメモ #GPT-4o

これとか、 これの実装をやった際のメモ。 送信するフレーム数・画像サイズ画像をData型にす…

shu223
2か月前
5

GPTによる動画理解のOpenAI公式ガイドを読む

OpenAIのAPIドキュメントを読んでいたら "Video understanding with vision" と題されたリンク…

shu223
2か月前
4

[GPT-4o] MacPaw/OpenAI はマルチモーダル入力に対応しているのか

つい昨日、Swiftで書かれたOpenAI APIクライアントで最もスター数の多いしMacPaw/OpenAI のバ…

shu223
2か月前
8

Hugging FaceにあるLLM以外のCore MLモデルを漁ってみたメモ

Hugging FaceにはCore MLタグがあり、これで絞り込むといろんなモデルが出てくる。 Core MLモ…

shu223
2か月前
2

Copilot for Xcode をもう一度入れ直した

以前セットアップまでしたものの結局使わずにアンインストールしたCopilot for Xcodeを、今に…

shu223
2か月前
12

Vision文字認識の細かい話

iOS/macOS/visionOSで利用できるVisionフレームワークの文字認識についての細かい話を書いてい…

shu223
2か月前
5

EvernoteからObsidian & Notionにデータ移行したメモ

Evernoteには10年ぐらい課金し続けてきたが、もう何年もノートを見返していないので、昨年12月あたりに有料プランを解約した。年額払いしていたのでまだしばらく有料プランを使えるが、いまのうちにデータの退避しなきゃなーと思ってた折に という記事を見かけて、GWなのもあって、重い腰をあげてEvernoteからのデータ移行を進めることにした。 移行先の選定結論から書くとObsidian と Notion に分けて移行することにした。 当初はNotionを移行先にしようと思