t_wの輪郭

RSS

SIMD

2023/7/9 13:36:00

なんかシンプルな処理方式
GPUとかが採用している
大昔は条件分岐とかできなかったらしい
今は条件分岐ができるようになったけど、恐らく条件分岐の処理はCPUに比べると遅いはず

正直よくわかってない
詳しくはググれ

WebGPU（WGSL？）で遺伝的プログラミングをするにあたっての制約 AVX2 WASM SIMD 『Introducing Iguana: extremely fast SIMD-optimized decompression』『言語処理系がLLVMに依存することの良し悪し | 雑記帳』

SIMD LLVMには体系だったベクトル演算命令がある LLVM SVE NEON AVX-512 AVX SSE

『言語処理系がLLVMに依存することの良し悪し | 雑記帳』

2025/6/26 13:25:00

https://blog.miz-ar.info/2024/12/depending-on-llvm/

SIMD decompression

『Introducing Iguana: extremely fast SIMD-optimized decompression』

2025/1/7 0:47:00

https://sneller.ai/blog/decompressing-at-over-10-gigabytes-per-second/

WASM SIMD

2024/11/23 19:45:00

『The fastest WASM zlib - Trifecta Tech Foundation』

AVX2

2023/7/18 23:06:00

WebGPUで遺伝的プログラミング 1070 TiはCUDA Coreが2432基正気か？WebGPUの制約令和やぞ SIMD

WebGPU（WGSL？）で遺伝的プログラミングをするにあたっての制約

2023/7/11 13:30:00

一つのBufferが128MBまでしか作れない。
- Deviceの取得時にmaxBufferSizeとか設定すれば限定解除できそうな雰囲気があるが、やり方がわからない
  - というかやってみたけど（RequiredLimitsを設定）Deviceが取得できなくなった
Shaderの中で宣言したarrayは添え字が定数でしか取得できない
- for(var i=0u; i<10u; i++ ){let val = arr[i]}みたいなことができない
- 正気か？
関数の再帰呼び出しは不可
- 「SIMDやぞ」ということで、まあわからなくはない
- 「Stackを作って関数の再帰呼び出しをfor文で再現」と思うも、「Shaderの中で宣言したarrayは添え字が定数でしか取得できない」
関数型がなさそう
- 「配列に関数を入れて処理を出しわける」みたいなことができない
- 無理やりやるとif文のお化けになってしまう
  - SIMDでif文めっちゃ使うのはなんかヤダ

然るに

遺伝的プログラミングで生成したProgramを構成するNode群を実行できない
- NodeからNodeを呼び出したい
  - → 「関数の再帰呼び出しは不可」
- Node群を入力側から順次実行し、Nodeの出力値をNodesOutputみたいなarrayに格納
  - → 「Shaderの中で宣言したarrayは添え字が定数でしか取得できない」
- StorageBufferは変数の添え字が使えるので、それでNodesOutputを作る
  - → 「一つのBufferが128MBまでしか作れない」
    - 並列処理の数だけNodesOutputが必要なので、1GBぐらいほしい
      - 手元にある1070 TiはCUDA Coreが2432基あるので
- 並列処理したい数だけStorageBufferを作る（シェーダーを自動生成する）
  - → 処理が複雑過ぎて3日もたてば何やってるかわからないコードになる
どれか一つでも制約をなんとかできれば遺伝的プログラミングはできそう。

きえええええええええええええぇぇぇぇぇ

GPGPUあるあるの制約なのかもしれないが、世の機械学習ライブラリはこういう制約をどう御しているのか。
なぜこんな古生代みたいな制約があるのか。令和やぞ。

一部WGSLの制約かもしれない。