SSE

#2 自分がソーシャルスキルの研究を始めた理由 -「困った子」ではなく「困っている子」のために-
+10

#2 自分がソーシャルスキルの研究を始めた理由 -「困った子」ではなく「困っている子」のために-

みなさんこんばんは、葵です。 前回の記事(#1)はこちらから! 前回の記事や前々回の記事では、たくさんのスキ!をありがとうございます🍀コメントも、とても励みになりました。最近は研究も本格化してなかなかnoteを書く時間をとることが難しいのですが、時間を見つけて、自分のペースで更新していけたらと思います! <はじめに…> 最近見たドラマで、「問題のあるレストラン」という作品があります。 私はこのドラマをリアルタイムでもみて、今でも何度も見直してしまうくらい好きなドラマ

スキ
9
画像解析を高速化させるためのTipsわかりやすくまとめてみた(6) プリフェッチ

画像解析を高速化させるためのTipsわかりやすくまとめてみた(6) プリフェッチ

前回(第5回)は、SSE2とAVX2の比較をしました。ベンチマークの結果、同じメモリに対して繰り返すだけなら約1.8倍高速化出来ましたが、大きな配列に対して連続して計算すると、約1.03倍にしかなりませんでした。 キャッシュメモリ CPUの中にはキャッシュメモリと呼ばれる高速なメモリがあります。低速なメインメモリへのアクセスを隠蔽するために、よく使うデータを演算装置の近くに高速なメモリに置いておくことで、速度性能を向上させています。 よく使うデータはキャッシュメモリに入

スキ
7
画像解析を高速化させるためのTipsわかりやすくまとめてみた(5)

画像解析を高速化させるためのTipsわかりやすくまとめてみた(5)

前回(第4回)は、整数型での四捨五入を、AVX2の整数型で実装しました。 今回は、もっと単純なお題で、SSE2とAVX2の比較をしてみたいと思います。 お題 乱数の入った80000000個の符号なし8bit整数型の配列を2つ(X, Y)を用意し、XとYの要素同士の平均値Zを求めます(ただし、小数点以下は切り上げ)。つまり、Z[i] = ceil(X[i] + Y[i]) です。 実装 前回までは、32bit整数型でしたが、今回は8bit整数型です。SSE2の場合はレ

スキ
5
画像解析を高速化させるためのTipsわかりやすくまとめてみた(4)

画像解析を高速化させるためのTipsわかりやすくまとめてみた(4)

前回(第3回)は、整数型での四捨五入を、SSE2~SSE4.1の整数型で計算する方法を説明しました。 今回は、AVX2の整数型で計算してみます。レジスタ長が2倍になるから2倍速くなってくれるよね…? 割り算を使わない割り算のAVX2での実装 前回のコードとの違いは、変数の型が m128_t から m256_t に、 関数のプレフィックスが _mm128 から _mm256 になっているところです。また、アラインメントは、SSEの場合は16バイトに合わせましたが、AVXの

スキ
5
画像解析を高速化させるためのTipsわかりやすくまとめてみた(3)

画像解析を高速化させるためのTipsわかりやすくまとめてみた(3)

前回(第2回)は、固定小数点数の話をしました。固定小数点数を使った整数型演算で、割り算を使わない割り算の方法を説明しました。 今回は、前回説明した、割り算を使わない割り算を用いて、前々回(第1回)の整数型での四捨五入を、SIMDの整数型で計算する方法を説明します。 SIMDとは Single Instruction, Multiple Data の略で、1つの命令で複数のデータに対して同時に並列に演算する手法です。ベクトル演算とも呼ばれます。SIMD命令があるプロセッサ

スキ
7
Instricsを使わずして、SIMD(SSE/AVX/NEONなど)を使いつつ、アーキテクチャ依存性のないソースコードを書く方法。

Instricsを使わずして、SIMD(SSE/AVX/NEONなど)を使いつつ、アーキテクチャ依存性のないソースコードを書く方法。

 今回は趣向を変えて、プログラミングテクニックに近い事を書きます。  最近のCPUには、SSEとかAVXとかNEONなどと呼ばれてる、要は幅の大きなレジスターを使って複数の計算を一回でやる機能…SIMDと呼ばれてる…があります。  これ、普通にソースコードを書いてもなかなか使えるものでもなく、通常ネット上で書かれてるテクニックだとInstricsと呼ばれてる、それぞれのCPU専用の疑似命令をCやC++のソースコードに書いて使うのですが、それだと、CPUのアーキテクチャを超え

有料
150
ロマンスカー SEの想い出

ロマンスカー SEの想い出

小田急電鉄で勤務させて貰った中で、一番の思い出はSEに乗務できたことかも知れません。SEはまさに小田急の初代ロマンスカーで、その名の通り、スーパーエクスプレス。新幹線ができる前は日本最高速度の新記録を保持していた名車です。私がロマンスカー乗務の資格を得たときは、まだロマンスカーはSEとNSEが全盛期で、7000系と呼ばれるピカピカのLSEが走り始めたばかりでした。新車が来ると「今日はマイクの音質が最高だ」と回送列車で一曲唄いたくなる衝動にかられましたが、でも、私はいちばん愛し

スキ
2