t_wの輪郭

Feedlyでフォローするボタン
2025年8月
あれあれ
論文を読む『言語処理学会第31回年次大会表彰一覧(NLP2025)』論文読みStack

言語処理学会第31回年次大会表彰論文

2025/8/29 10:57:00

Stack

  • 『埋め込み表現の独立成分の言語内・言語間一貫性の分析』
  • 『構成的汎化におけるTransformerの内部機序の分析』
  • 『ダイアグラム理解に向けた大規模視覚言語モデルの内部表現の分析』
  • 『Sparse Autoencoders as a Tool for Steering the Output Language of Large Language Models』
  • 『Cognitive Preference Optimization: 脳情報による言語モデルの選好最適化』
  • 『事例ベース意思決定理論に基づく復号』
  • 『大規模言語モデルを用いたシフト還元型句構造解析』
  • 『Triple-Phase Transition: 脳との関係から捉える大規模言語モデルの学習ダイナミクス』
  • 『Swallow LLM』
  • 『意思決定を指標とする生成テキスト評価:アマチュアと専門家への影響分析』
  • 『コーパスの逆蒸留』
  • 『似た単語の知識ニューロンは似た形成過程を経る』
  • 『LM は日本の時系列構造をどうエンコードするか』
  • 『人間と LLM の "面白さ"の感性は一致するのか?』
  • 『LLMマルチエージェント間の相互作用の分析』
  • 『多角的な評価から大規模言語モデルにおける事実知識の想起の要因分析』
  • 『訳出の同時性に特化した評価データを用いた同時音声翻訳モデルの評価と分析』
  • 『コーパスの逆蒸留』
  • 『対照学習を用いたhallucination検出手法』
  • 『大規模言語モデルは他者の心をシミュレートしているか』
  • 『書き手の孤独感を予測できるか?』
  • 『対象言語・対象単語を選ばない汎用的な文法化度の定量化手法』
  • 『JETHICS: 日本語道徳理解度評価用データセット』
  • 『大規模画像言語モデルは物体の裏側を認識できるか?物体の見えない部分の認識を問うタスクの提案』
  • 『AnswerCarefully: 日本語LLM安全性向上のためのデータセット』
  • 『語形のベクトル化による最適な言語地図の描画』
  • 『大規模言語モデルの分布予測における常識に基づいた割合予測能力の評価』
  • 『Mitigating Social Bias in Large Language Models by Self-Correction』
  • 『LLM-jp-3 VILA: 日本語マルチモーダルデータセット及び強力な日本語マルチモーダルモデルの構築』
  • 『複数タスク・複数項目に跨ったマルチモーダル自動評価手法』
  • 『Asagi: 合成データセットを活用した大規模日本語VLM』
  • 『大規模視覚言語モデルにおける言語タスクに対する視覚情報の影響』
  • 『Mixture-of-Expertsの悲観的な統合による頑健な自然言語理解』
  • 『自閉スペクトラム症の眼球運動による言語モデルのファインチューニング』
  • 『拡散モデルを用いたテキスト生成における「崩壊問題」と時刻埋め込みの影響』
  • 『メッセージの階層構造を把握するための parsing action がランダムではないのはなぜか?』
  • 『訓練・推論時の不一致を解消する離散拡散テキスト生成モデル』
  • 『ReShape Attentionによる音声と言語の基盤モデルの統合』
  • 『FaithCAMERA: 広告文生成タスクのための忠実性を担保した評価データセットの構築』
  • 『whole-NWJC: 『国語研日本語ウェブコーパス』全データ』
  • 『多言語での判例事実概要からの法的関係性のグラフ可視化』
  • 『大規模言語モデルは日本語・中国語の状態パーフェクトを理解できるか?』
  • 『Sketch2Diagram: 視覚的指示を入力とするダイアグラム生成』
  • 『日本語Full-duplex音声対話システムの試作』
  • 『逆プロンプトを用いたコールドスタート推薦』
  • 『JMED-DICT: 大規模医療用語辞書の構築』
  • 『VDocRAG: 視覚的文書に対する検索拡張生成』
  • 『視覚情報による曖昧性解消コーパスの検討』
  • 『バックトラッキングを活用したマルチエージェントシステムによる複数制約充足プランニング』
  • 『不均衡最適輸送を用いた意味変化検出』
  • 『CCGによる日本語脳波データのモデリング』
  • 『リアルタイム音声対話システムのための応答タイミングと短文応答の同時予測』
『作業記憶の発達的特性が言語獲得の臨界期を形成する』『クレオールは計量的に峻別できるか?』『ベイズ教師なし文境界認識』『テキスト生成における最小ベイズリスク復号の理論的な理解に向けて』『ウェーブレット位置符号化』『llm-jp-judge: 日本語LLM-as-a-Judge評価ツール』『コーパスの逆蒸留』『モデル拡張によるパラメータ効率的な LLM の事前学習』『音素の合成性を仮定した連続信号をサインとした分散的ベイズ推論に基づく記号創発』『難易度調整可能な多枝選択式読解問題自動生成手法とDirect Preference Optimizationによる難易度調整精度の向上』『意思決定を指標とする生成テキスト評価:アマチュアと専門家への影響分析』『大規模言語モデルにおけるIn-context Learningの推論回路』『言語のインクリメンタルな処理の仕組みは普遍的か?:投機性によるparsing strategy再考...『大規模言語モデルの再パラメタ化に基づく初期化による損失スパイクの抑制』『ニューラルかな漢字変換システム Zenzai』『Transformer LLMにおける層単位のFFN層の重要度検証』『IMPARA-GED:言語モデルの文法誤り検出能力に着目した文法誤り訂正の参照文なし自動評価』『llm-jp-eval-mm: 日本語視覚言語モデルの自動評価基盤』『Ruri: 日本語に特化した汎用テキスト埋め込みモデル』『言語モデルの事前学習におけるバリエーションセットの効果』『認知負荷の最適化戦略としての自由語順と項省略』『層の冗長性と層同士の独立性に基づく言語モデルの層交換の成否の特徴づけ』『判決書要約文の自動評価』『大規模言語モデルにおいて数値属性間で共有されるスケーリングベクトルの解析とその応用』『Wikidataに基づく大規模ジオコーディングデータセット』『言語モデルのふるまいと多重実現』
作業寝ると解決するマルチプロジェクトあれあれ朝を増やす

あれ

2025/8/28 23:06:00

「寝ると問題が解決する」という特性から「朝をどれだけ増やすか」(プロジェクトをどれだけ並列で進めるか)みたいな観点もある。
プロジェクトをN個並列で進めて毎日全部着手すると、朝がN倍になるんですよ。

あれ
2025年8月
あれあれあれあれあれ『トランプ関税が米消費者に不意打ち、通販で「マジか」の高額請求 - Bloomberg』
メッセージキューメッセージキューサービスRepositoryに移行する

あれ

2025/8/28 14:27:00

ICommandProducerとICommandConsumerとか書き始めて「メッセージキューだこれ」となってる。実装するより先に既製品をちゃんと見よう。

既製品のメッセージキューサービスを使うとしても依存はしたくないのでインターフェースは切ったほうがいいんだろうな。

あれ
2025年8月家計簿にローリングバジェットを作る
あれあれあれあれ
境界付けられたコンテキストpackage by feature
あれ
データ構造予算2025年8月27日実績

あれ

2025/8/27 19:31:00

予算と実績のデータ構造について前職にいた時から考えているのだけど未だ答えが見えずにいる。

WBSとかでもそうなんだけど、親の値が子から集計される性質があり、それをうまく扱うのが難しい。
初期の頃には浅い木でざっくりで出したい場合があるし、時が近づくにつれて深い木で詳細にしたい場合もあるし、具体的な予定が決まっている子を登録することもある。「T月にAの件で支払いがあるけど、T月についてはそれ以外は全く未定なので、全体としてはざっくり予算にしたい」といった具合。

「あの時に出した予算(見積工数)はどうだったっけ?」「予算の精度ってどう推移したの?」という関心も当然生じる。

予算と実績の紐付けもある。「支払いAについての予算」と「支払いAについての実績」が紐付いている(経理業務の消し込みのイメージ)と嬉しい。つまり、「見込まれたイベントが本当にあったのか?」が記録されたい。

予算と実績に差異があれば差異分析となるし、「見込まれたイベントがなかった」となれば「なぜなかったのか」ということを紐づけたくなる。

あれ
Vapor『Vapor』

あれ

2025/8/27 10:41:00
app.get("hello") { req in
   "Hello, world!"
}

Coolじゃん。

あれ
2025年8月
あれあれあれ
あれ2025年8月26日

あれ

2025/8/26 18:34:00

秋刀魚を食べた。

2025年の秋刀魚は脂がのっていて大きいらしいと聞いていたが、実物を見てもいつもとの違いはピンとは来てなかったのだけど、フライパンに入れたらはみ出して「これは初めてかもしれない」となった。実際のところデカかったのかはわからん。

あれ
年金2025年8月26日
あれ
『層の冗長性と層同士の独立性に基づく言語モデルの層交換の成否の特徴づけ』ニューラル言語モデルの層交換は「層の冗長性」と「層同士の独立性」が高いとうまくいく
あれ
セルオートマトンプロセス哲学「二つの現実的存在は同一の領域からは生じない」プロセス哲学とセルオートマトンの接続
あれ
2025年8月
あれあれあれあれあれあれあれあれあれあれ
脱線本筋2025年8月25日

あれ

2025/8/25 15:27:00

「すごい速度で作業ができているぞ」という感覚があっても、すごい速度で脱線してるだけで本筋はそれほど進んでなかったりする。
むしろ本筋から逃げて脱線しているからすごい速度になっていたりする。

あれ
脱線2025年8月25日殿!!

あれ

2025/8/25 13:36:00

殿!!作業がものすごい速度で脱線をはじめたでござる!!!!作業がものすごい速度で脱線をはじめたでござる!!!!止まらない…殿!!!聞いて欲しいでござる!!!みて欲しいでござる!!!作業がものすごい速度で…止まらないでござる!!!止まら

あれ
AA審議中

審議中

2025/8/25 13:33:00
    ∧,,∧   ∧,,∧

 ∧ (´・ω・) (・ω・`) ∧∧

( ´・ω) U) ( つと ノ(ω・`)

| U (  ´・) (・` ) と ノ

 u-u (l   )   (    ノu-u

     `u-u' .`u-u'
あれ
読書2025年8月24日

あれ

2025/8/24 11:03:00

「体調悪いし本を読んでも進むまい」と思われたが、「では試してみようじゃないか」となったので本を読んでるけど、やっぱり頭に入ってこないな。

今回については上記の結果だったけど、次回はどうなるかはわからん。

あれ
2025年8月OpenZitiを試す
あれあれあれ
2025年8月21日朝を最大化朝読書

あれ

2025/8/22 0:22:00

 日記書いてなかった。いや、書く必要とかないんだけど。


 朝から本を読むのが最高に良い。朝は最も頭が冴えており、午後の100倍の集中力が出せる。つまり朝30分読書すれば、3000分読書したと同義。50時間だぞ。2日を生きてる。
 冗談はさておき、ハチャメチャに難しい本を読み、前日には理解できなかった場所が理解できる。これは大いなる前進だということは疑う余地はなく、それだけでその日1日を有効活用できたという実感が得られる。それ以降のそれ以外は些事と切って捨てても良いんではないかという気分にすらなる。生活があるので切って捨ててはいけない。

あれ
2025年8月帰省検討2025年秋
あれ9万輪到達@2025年8月21日あれあれあれあれ
DecoratorパターンRepositoryパターンRepositoryに移行するCommandパターン2025年8月19日

あれ

2025/8/21 23:51:00

Decoratorを使い回すために、共通のIRepositoryを作ろうとしていたんだけど(つまりIRepositoryに命令を出すための万能なパラメーターオブジェクトを作ろうとしていた)、executeメソッドを持つICommandを作って、それにDecoratorを着せればよさそうということに気づいた。

ずっとグネグネしてたやつがようやく収まった。


ただの関数オブジェクトじゃねっていう気がしなくもない。


うっ、executeコマンドに引数が欲しい。いや、コントラクターでパラメーターを渡せばいいはず。


『なぜ依存を注入するのか DIの原理・原則とパターン』に答えが書いてあった。引数の型として総称型を使えばよい。

あれ
『新配信サービス「ダウンタウンチャンネル(仮称)」開始のお知らせ | お知らせ | 吉本興業株式会社』ダウンタウンチャンネルは独自プラットフォーム独自プラットフォーム

あれ

2025/8/21 16:10:00

Youtubeじゃなくて独自プラットフォーム作ってるの気になる。


気になる:

  • システムはスクラッチで作ったのか?
  • 人集めに成功するか?
  • 金になるか?
  • 今後独自映像配信プラットフォームを立てる動きが加速するか?
あれ
スプレー式インスタントコーヒー

あれ

2025/8/21 13:01:00

「スプレー」に引っ張られて「のどぬ~るスプレー」のような容器に入った高濃度コーヒーのイメージが惹起されている。

通常はスプレーからコーヒーをマグカップなどの容器へと散布した後に水で希釈するが、手軽さを最重視する高位のものはスプレーから口へ直接散布して摂取する(というイメージ)

あれ
惰性の強さデライトすげぇ

あれ

2025/8/21 12:05:00

ここ最近は惰性でデライトをやっている。「デライトすげぇ」という気持ちもあるが、手元では「Webなどで良い記事を見つける」「良かった部分を抜き出す」をダラダラとやっている。そうしてそうやって惰性でやっているものが積み上がっているのを観ると「デライトすげぇ」という気持ちになる。

あれ
2025年8月
あれ
リピート

Repositoryに移行する

2025/8/18 23:14:00
  • なんかバグっとるのを修正した
  • 自動テストを二つ作成した
  • AIの導きによりPlaywrightでドラッグ&ドロップする関数を見つけた
  • ドラッグ&ドロップでの操作のテストを実装する
    • 要素の指定がむずい
    • 一日寝かせたらできた
  • Repositoryを作る
    • RelationRepositoryを作成する
    • PostRepositoryを作成する
      • AIでやったらバグりよった
  • リファクタリング
リピート2025年6月16日あれあれあれあれあれあれあれあれあれあれあれあれあれあれあれ
2025年8月
あれあれあれあれJPYC株式会社が資金移動業者の登録を受けた@2025年8月18日
歩数2025年の目標2025年9月2025年8月2025年7月2025年6月2025年5月2025年4月2025年3月2025年2月2025年1月2025年12月2025年11月2025年10月

2025年の歩数目標

2025/8/18 21:30:00
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
目標歩数 5428 5662 5896 6130 6363 6597 6831 7065 7298 7532 7766 8000
実績歩数 6184 6152 7407 8078 9472 8410
2025年2月の歩数:6152歩2025年3月の歩数:7407歩2025年4月の歩数:8078歩/日歩数2025年5月:9478歩/日歩数2025年7月:8426歩/日歩数2025年6月:8410歩/日
構成図ForgejoCoolifyIdentity Aware Proxyあれ

あれ

2025/8/18 9:53:00
architecture-beta
    group pn(cloud)[Private Network]
    group pb(cloud)[Public Network]

    group sv(server)[Server] in pn

    service iap(database)[Identity Aware Proxy] in pb

    service idp(database)[IDP] in sv
    service forgejo(database)[Forgejo] in sv
    service coolify(database)[Coolify] in sv
    service app(database)[App] in sv

    iap:R -- L:idp

    idp:R -- L:forgejo
    idp:R -- L:coolify
    forgejo:T -- B:coolify
    coolify:T -- B: app
    idp:R -- L: app

あれ
LLM-as-a-Judge『llm-jp-eval-mm: 日本語視覚言語モデルの自動評価基盤』『Advanced usage - OpenAI API』

あれ

2025/8/18 9:45:00

gpt-4o-2024-05-13は同一のseedを使用した場合でも,出力は決定的ではない5)ことに注意が必要

マジか。厳密な再現性がないじゃん。
公開されたモデルでも決定的にできないのかな。
『Advanced usage - OpenAI API』を読む感じではOpenAI側での設定に変更があると振る舞いが変わるっぽい?



LLM-as-a-Judge評価の安定性を検証
〜中略〜
実行ごとにHeron では約 1 ポイント,JVB-ItW では約 0.05 ポイントの変動が生じる

知りたかったやつだ。
これについてもTemparatureを0にし、Seedを固定してやっているのだろうか?そうだとしたら、設定の変更が否決定性のトリガーではなさそう?

あれ
脳内麻薬筋トレ昼食を決められない2025年8月17日

あれ

2025/8/17 22:45:00

1日中頭が終わっていた。
特に寝起きがひどい。

また、昼食を決められなくなってきている。1時間以上決められずにいるのは異常だ。

色々グダグダだったが、昼に図書館に行けたことは良かった。貸し出し登録をして、本を借りてきた。


頭の状態を調整するために、筋トレをするようにするか。

あれ
2025年8月
あれあれあれ
Transformer『Transformer LLMにおける層単位のFFN層の重要度検証』
あれ
アウトライナー『アウトライナーフリーク的個人年表 2004〜2023|Tak.(Word Piece)』

あれ

2025/8/13 13:36:00

断片を流すはずのWord Pieceに徐々に「記事らしい」記事が増える。Opal上で自由にアウトライン・プロセッシングするうち断片が次々と結合・収束し、自然にそうなっていった。

なんかアウトライナーを久々に使いたくなってきた。長い文章を書きたくなっている。でも「文章を書くぞ」という感じでやるのはつらい。「自然にそうなっていった」をやりたい。

あれ
Forgejo RunnerForgejo Actionsあれsudo docker run -it --rm --network hoge debian:stable bashCheckout code
あれ
Forgejo RunnerForgejo ActionsあれCheckout code

あれ

2025/8/13 11:08:00

Forgejo Runnerのlabelをdockerにしていたら、Checkout codeで「Could not resolve host」とエラーが出てしまった。labelをtest-containerにしたらCheckout codeがエラーなく動くようになった。

あれ
Repositoryに移行するあれ

あれ

2025/8/12 22:00:00

Repository周りをきっちり作り込みたいけど車輪の再発明してる感じがすごくする。ライブラリを使ったほうがいいかも。でもライブラリに依存したくないかも。うまくライブラリを使いつつ依存しないようにするのが設計の腕の見せ所かも。ライブラリを探そう。クラス図を書こう。

あれ
Forgejo RunnerForgejo Actions2025年8月12日Checkout code

あれ

2025/8/12 21:57:00

Forgejo Runnerが動くようになったのでActionを動かしたみたわけだが、Docker上で動かしているために、Gitレポジトリからはremoteがlocalhostで繋がり、Runnerからはforgejoで繋がるようになっているので、Runnerがレポジトリを取得できなくて動かない。なので、開発用のコンテナを立てる必要がある。めんどい。

あれあれ
Forgejo Runner

あれ

2025/8/12 9:36:00

forgejo-runnerでプログラムを動かせるから、セキュリティのために、作成されたアカウントは許可がないと何もできないようにしてたんだけど、レポジトリを非公開にすればいいだけな気がしてきたな。そうすれば許可されていないユーザーは私が登録したrunnerを使うことはできない。

あれ
日記2025年8月11日

日記2025年8月11日

2025/8/11 22:26:00

 ゼッテリアで朝食。コーヒーで過激な便意。危なかった。

 ケンタと見せかけてマクドと見せかけてサイゼで昼食。サイゼの方が安くつくまである。

 パスタが夕食。スーパーでゴーヤを買ったので、ゴーヤのナポリタンにした。


 ネチネチ作業をしていたらforgejo-runnerが動いた。だいぶ時間がかかった。明日動作確認する。

 作文している。精神的につらいタイプの作文。着手してればそのうち慣れるだろう。


 新規性のあることをやっていないので、日記は書かなくてもいいかなと思われたが、新規性にこだわる必要もないかもしれないということで書いた。たぶんこの程度の雑さで良い。

あれ
2025年8月
あれあれあれあれ日記2025年8月11日
DecoratorパターンRepositoryに移行する2025年8月11日

あれ

2025/8/11 21:31:00

一旦Repositoryで動くようにはなったが、複数のRepositoryに同一のDecoratorを着せられるようにしたい。後々のことを考えると、今のうちにきっちり作りこみたい。

あれ
ロータス戦略洞察研究所の運営者が誰かわからない
あれ
2025年8月
あれあれあれ
『Steam高評価ゲーム開発者、Nintendo Switch自力移植の「悪戦苦闘」をやたら細かく解...『How I ported Penko Park to Switch: From crashes t...最適化の管理表

あれ

2025/8/9 13:10:00

記事の最後に掲載されてる最適化の管理表がすげーいいな。効果を後から誰でも確認できるし、やってる最中のモチベーション維持や現在地確認にもなりそうだ。

あれ
「家でもパーティーでも、エッチな服を着て友達や家族を怖がらせましょう!」
あれ
内科通院栄養士2025年8月9日

あれ

2025/8/9 12:17:00

朝から内科の通院に行ってきた。幸いにも朝早くに目が覚めたので、早めに病院へ着くことができ、その時点ではすいていた。

前回の内科通院で「次回で」としていた栄養士との面談をした。なぜかパンパンの冷凍庫やアレルギー性の耳鳴りについて話が弾む。楽しいね。

いつもの内科の先生には手短にお小言をいただいて終わった。はい。

あれ
レコメンド

あれ

2025/8/8 14:38:00

「ゆる○○学」系列の動画が常にレコメンドに出てくる。さすがに食傷という状態で、「興味なし」をつけているのだが、それでも出てくる。どんだけ金をつぎ込んでるんだ。

「チャンネルをおすすめに表示しない」はちょっと過剰なので、「1ヶ月間チャンネルをおすすめに表示しない」とかが欲しい。

レコメンドはどうしてもユーザーの意図通りにはならないのがちょっとしんどいな。

あれ
Repositoryに移行する2025年8月8日

あれ

2025/8/8 14:24:00

サーバーサイドでの処理をレポジトリに置き換えようとしていたが、バチクソに沼っているので、全部捨ててクライアントサイドでの処理をレポジトリに置き換えた方が良い気がしてきた。1回全部捨てることにはなるが。


サーバーサイドでもうちょっと頑張ることにした。

あれ
DPO『Prologによる解法知識を用いた誤答解説文付き多肢選択問題の生成』『難易度調整可能な多枝選択式読解問題自動生成手法とDirect Preference Optimizationによる難易度調整精度の向上』

あれ

2025/8/7 14:12:00

LLMの学習用途かと思ったら対人間の教育用途だった。
AIが無限に問題を生成できたら、人間も無限に学習できそう。


過去の研究では『Prologによる解法知識を用いた誤答解説文付き多肢選択問題の生成』とかもあるけど、文章を何も加工せずにLLMに処理させたら問題が出てくると、作成者にとってはかなり楽である。



難易度調整精度を最大化するために、DPOが使われている。DPO便利だ。

あれ
塩分不足2025年8月6日

あれ

2025/8/6 23:19:00

塩水飲んだら頭の倦怠感がパーッと晴れてきた。

自炊で塩分を控えてるつもりもないんだけど、どうも塩分不足になりやすい。

夏の間は、ご飯作るときにはもうちょっと塩を多めにするようにしよう。

あれ
日記2025年8月6日

日記2025年8月6日

2025/8/6 23:00:00

 自分の日記の文体に飽きた。

 「○○をした。□□だった。」 毎回そんな調子だ。いい加減何らか変えていきたい。そういうわけで、今回は、よそ様のブログの構成をパクることで、自身の文章の引き出しを増やしつつ、気分転換を図る。


 みなさん、調子はどうですか。私は引きこもりがたたって調子を崩しつつあります。

 今日はリフレッシュの日としました。家にこもってPCで作業をし、家にこもってPCでSNSをしているので、だんだんPCを見るのが嫌になりつつあります。
 たまには家から離れた時間を取ろうっていうことで、ドトールへ行ってきました。朝から。8時ぐらいに。そうすると混んでるんですね。平日の8時というのはどうも通勤の皆さんが出社前の憩いのひと時を過ごしているようで、席があまり良いところが残っていないという始末でした。


 ダメだ、絶望的に文章が書けない。文章を書く脳が文体と密結合している。あと調子が悪いときに文章が書けるはずもない。やめだやめだ。また今度にする。おわり。

あれ
2025年8月
Claude Opus 4.1を試すあれ日記2025年8月6日あれ
Deep ResearchClaude Opus 4.1を試す

あれ

2025/8/6 14:04:00

Claude Sonnet 4でDeep Researchにかけたら勝手に作られた言葉まみれだったテーマを、Claude Opus 4.1で改めてDeep Researchにかけたところ、存在しない単語は見られなくなっていた。記述が実在する資料に基づいているような印象を受ける。

あれ
2025年8月
あれあれあれあれあれあれあれあれ
fallacy of misplaced concreteness具体性の誤配実体的固定化Event-Centric Data ModelOntoUMLBasic Formal Ontology存在論駆動データベース設計

あれ

2025/8/5 10:25:00

プロセス哲学のRDBテーブル設計革新

アルフレッド・ノース・ホワイトヘッドのプロセス哲学は、従来の実体中心的なリレーショナルデータベース設計に対して根本的な代替案を提示し、動的プロセスと関係性を重視した新しいデータモデリングパラダイムへの道を開いている。この研究は、静的エンティティから時間的プロセスへの存在論的転換が、現代のデータベース設計にもたらす理論的・実践的含意を詳細に分析する。

プロセス哲学の核心概念とRDB設計の根本的対立

ホワイトヘッドの哲学体系における実際的存在(actual entities)は、永続的実体ではなく瞬間的な経験の単位として定義される。各実際的存在は「プリヘンション」(他の存在体による把握・感受)を通じて過去のすべての存在と内的に関連し、「コンクレッセンス」(多が一となるプロセス)により新しい統一を創造する。この 「関係性の優位性」原理は、現実を孤立した個体の集合ではなく、相互依存的なプロセスのネットワークとして理解する。

従来のER/RDBモデルは、独立して存在する識別可能なエンティティと、それらの間の外的関係を前提とする。しかし、プロセス哲学的観点では、この実体的固定化は「具体性の誤配(fallacy of misplaced concreteness)」にあたる。ビジネス現実における顧客、商品、取引は、静的属性の集合ではなく、継続的な関係性とプロセスの中で意味を持つ動的存在である。

プロセス指向データモデリングの理論的フレームワーク

事象中心データモデル(Event-Centric Data Model)

プロセス哲学的アプローチでは、データベースの基本単位を「事象」とし、各事象を一意の時空的発生として記録する。この理論的転換は、現代のEvent Sourcingパターンの哲学的基盤となる:

-- プロセス的実際存在の表現
CREATE TABLE actual_occasions (
    occasion_id UUID PRIMARY KEY,
    temporal_position TIMESTAMPTZ NOT NULL,
    prehensions JSONB[], -- 他の実際存在への参照
    subjective_form JSONB,
    satisfaction JSONB, -- 統合された経験
    causality_chain UUID[]
);

この設計では、追記専用(append-only)構造により、実際的存在の不可逆的な生成プロセスを表現し、過去の確定性と未来の潜在性を明確に区別する.

時間的関係性の動的表現

プロセス哲学における内的関係性は、従来の外部キー制約を超えた動的関係モデルを要求する:

-- 動的関係のプリヘンション的表現
CREATE TABLE prehensive_relations (
    relation_id UUID PRIMARY KEY,
    subject_occasion UUID NOT NULL,
    object_occasion UUID NOT NULL,
    prehension_type VARCHAR(50), -- 'physical' or 'conceptual'
    subjective_form JSONB,
    intensity DECIMAL(3,2),
    temporal_context TSTZRANGE,
    EXCLUDE USING GIST (
        subject_occasion WITH =,
        object_occasion WITH =,
        temporal_context WITH &&
    )
);

学術研究と実装事例の現状

プロセス認識情報システム(PAIS)の発展

Wil van der Aalst(RWTH Aachen University)の研究により確立されたプロセスマイニング分野は、プロセス哲学的思考の実装化として理解できる。ProM Process Mining Platformは、実際の実行データから「真の」プロセスを発見するリアリスト的アプローチを採用し、実際的存在の観察可能な現象化を提供する。

存在論駆動データベース設計

Giancarlo Guizzardi(University of Twente)によるUnified Foundational Ontology (UFO)は、プロセス哲学の概念をコンピューティングドメインに適用した重要な成果である。UFO-Bイベント存在論は、時間的プロセスの形式的モデリングを可能にし、OntoUMLとして視覚的設計言語に実装されている。

Barry Smith(University at Buffalo)のBasic Formal Ontology (BFO)は、ISO/IEC 21838として国際標準化され、2024年に米国国防総省によって採用された。これらの研究は、哲学的厳密性と実装可能性の架橋において重要な役割を果たしている。

現代的実装技術との親和性

時系列データベース(TimescaleDB、InfluxDB)、グラフデータベースイベントストリーミングプラットフォーム(Apache Kafka、EventStore)は、プロセス哲学的原理の技術的実現として解釈できる。特に、Event SourcingとCQRS(Command Query Responsibility Segregation)の組み合わせは、ホワイトヘッドの「生成の連続性」概念と直接対応する。

具体的なテーブル設計パターンと応用例

Bitemporal データモデルの哲学的基盤

-- 双時間的実際存在テーブル
CREATE TABLE bitemporal_entities (
    entity_id UUID,
    attribute_name VARCHAR(100),
    attribute_value JSONB,
    valid_time_start TIMESTAMPTZ,
    valid_time_end TIMESTAMPTZ,
    transaction_time_start TIMESTAMPTZ DEFAULT NOW(),
    transaction_time_end TIMESTAMPTZ,
    creative_advance_vector UUID[], -- 創造的前進の追跡
    PRIMARY KEY (entity_id, attribute_name, valid_time_start, transaction_time_start)
);

この設計は、ホワイトヘッドの時間概念における有効時間(実際的存在の客観的生成時間)とトランザクション時間(観察・記録時間)の区別を実装する。

在庫管理システムでの実装例

従来の在庫テーブル設計は、商品の「在庫量」という静的属性を中心とするが、プロセス的アプローチでは「在庫プロセス」の連続的事象として捉える:

-- プロセス中心在庫管理
CREATE TABLE inventory_occasions (
    occasion_id UUID PRIMARY KEY,
    product_id UUID NOT NULL,
    location_id UUID NOT NULL,
    process_type VARCHAR(50), -- 'receiving', 'shipping', 'adjustment'
    quantity_change INTEGER,
    temporal_position TIMESTAMPTZ,
    causal_factors JSONB, -- 需要変動、供給遅延等
    process_satisfaction JSONB -- プロセス完了状態
);

-- 現在状態の投影(プロジェクション)
CREATE MATERIALIZED VIEW current_inventory_state AS
SELECT 
    product_id,
    location_id,
    SUM(quantity_change) as current_quantity,
    MAX(temporal_position) as last_process_time,
    jsonb_agg(process_type ORDER BY temporal_position) as process_history
FROM inventory_occasions 
WHERE temporal_position <= NOW()
GROUP BY product_id, location_id;

この設計により、完全な監査証跡任意時点での状態復元需要予測のための履歴パターン分析が可能となる。

実装上の制約と課題分析

パフォーマンス考慮事項

プロセス的データモデルは、内的関係性の完全実装により計算複雑性が増大する。時間範囲クエリの最適化には、PostgreSQLのGiSTインデックスやパーティショニング戦略が有効である:

-- 時間軸パーティショニング最適化
CREATE TABLE process_events_2024 PARTITION OF process_events
FOR VALUES FROM ('2024-01-01') TO ('2025-01-01');

-- 空間時間複合インデックス
CREATE INDEX idx_spatiotemporal ON events 
USING GIST (entity_id, temporal_range);

既存システムとの統合課題

実体中心的レガシーシステムとの統合には、段階的移行戦略が必要である。Event Sourcingパターンでは、既存のCRUDシステムを「投影の一つ」として扱うことで、漸進的転換が可能となる。

組織的・教育的課題

プロセス的思考への転換は、開発チームの概念的パラダイムシフトを要求する。van der Aalstが指摘する「Event Sourcing モノリス」の反パターンを避けるには、ドメインエキスパートとの密接な協働と、継続的な教育投資が不可欠である。

新しい正規化理論への示唆

従来の正規化理論は「更新異常の回避」を目標とするが、プロセス的観点では「変更の記録」こそが重要である。時間軸正規化(Temporal Normalization)の新しい原理として:

  • 0TF(Zeroth Temporal Form): すべてのデータに時間スタンプ付与
  • 1TF(First Temporal Form): イベントの順序関係明示
  • 2TF(Second Temporal Form): 因果関係の依存性分離
  • 3TF(Third Temporal Form): プロセス状態遷移ルールの独立化

この拡張により、「データ冗長性の排除」から「プロセス断片化の回避」へのパラダイム転換が実現される。

今後の展望と研究方向性

プロセス哲学とデータベース設計の統合は、Multi-Model データベースNewSQL技術、量子コンピューティングとの接続により、さらなる発展が期待される。特に、プロセス存在論とAI/機械学習の統合は、自然言語処理や知識グラフ構築において重要な役割を果たすであろう。

IoTデータストリーム、リアルタイム分析、分散システムにおける「プロセス的アイデンティティ」の概念は、従来のエンティティ識別子を超えた動的同一性理論の構築を要求する。

結論

ホワイトヘッドのプロセス哲学は、単なる技術的改良ではなく、情報システムの存在論的基盤に関わるパラダイムシフトを提供する。静的エンティティから動的プロセスへ、外的関係から内的関係へ、存在から生成への転換は、変化し続けるビジネス現実をより正確に反映したデータモデルを可能にする。

現代のEvent Sourcing、時系列データベース、グラフデータベースの発展は、この哲学的転換の技術的実現として理解でき、理論と実践の豊かな対話を示している。ただし、実装複雑性と既存システムとの統合という現実的課題に対しては、段階的導入ハイブリッドアプローチが最も実用的な戦略となる。

プロセス的データモデリングの完全な実現は漸進的プロセスであり、組織の技術的成熟度とビジネス要件を慎重に評価した上で、既存の実体中心的アプローチとの共存と統合を図ることが成功の鍵となるであろう。

あれ
デライト(なんでもメモ)ClaudeIAとAIの融合Deep Research知的贅沢

あれ

2025/8/5 0:43:00

寝る前と起き抜け1発目でClaudeのレートリミットまでやっときたいな。


Claudeにデライトから調査すると良さそうな事項を抜き出してもらい、それについてDeep Researchをかけた。

こんな知的贅沢が許されるのか?IAとAIの融合の一つの体験している。空恐ろしくなる。
惜しむらくは、まあ、社会的成功などといったかたちではまだ成果が出ていないことだな。

あれ
2025年8月Keycloakを試す
あれあれあれあれあれあれあれ
『モデル拡張によるパラメータ効率的な LLM の事前学習』内挿法『Automated Progressive Learning for Efficient Trai...『Towards Adaptive Residual Network Training: A Neu...『Multi-level Residual Networks from Dynamical Syst...『GaLore: Memory-Efficient LLM Training by Gradient...『ReLoRA: High-Rank Training Through Low-Rank Updates』

あれ

2025/8/4 23:46:00

 この論文では「モデル拡張」手法を応用した「STEP」手法を用いて、LLMの事前学習時のGPUメモリーを削減している。

 STEPを用いると、標準事前学習と比べて、最大メモリ要求量が368Mモデルで42.3%、680Mモデルで42.2%、1.2Bモデルで53.9%に削減できると報告されている。

 安価なGPUでもLLMが学習できれば費用が低減できて嬉しい。消費電力を減らせれば費用低減できて嬉しいことに加えてエネルギー消費低減の点からSDGsへの貢献もできる。そういった意味で広範な意義がある研究。
 個人的に手元のマシンのGPUが弱いのでこういう研究大好き。


疑問

 モデルサイズが大きくなると削減率が高くなるような傾向があるんだろうか?
 学習時間への影響はあるんだろうか?

次に読みたい

あれ
AIと品質レッドオーシャンAIと量

あれ

2025/8/4 16:02:00

「成果物の品質を上げるためにAIを使う」のは持続性がありそう。

コード生成で考えると、コードの量が増えるとAIはバカになるし、ビルド時間は増えるし、人間も読み切れなくなるし、バグが発生する領域も増える。

一方で、AIを使ってバグを減らせたり、設計を良くできたりすれば、AIはバカになりづらいし、ビルド時間は増えないし、変更が容易になるし、トラブルは減るし、人間も読みやすいし、利点が多い。

あと低品質・大量生産の方向は、すぐにレッドオーシャンになりそうで怖い。需要を食いつくす。

あれ
noteあれ

あれ

2025/8/4 14:39:00

『Tak.(Word Piece)|note』の数量的なところを集計してみている。文字数、スキの数、有料の文字数、日付が集計の対象にあたる。自分がnoteをやるときには参考にできるかもしれない。

こういった文章の質を無視した数値的な分析は無意味だという見方もできるが、まずは数値的なところから押さえにかかりたい。文章の質はコントロールできない。

あれ
宣伝市場調査Xで原稿を執筆『第百七十八回:小鳥遊さんと『ADHDの僕が苦手とされる事務にとことん向き合ってみた。』について -...断片的執筆『ADHDの僕が苦手とされる事務にとことん向き合ってみた。』
あれ
9.52億円相続税

あれ

2025/8/4 12:32:00

年利を4%、相続税を55%、相続から死亡(1世代)までを20年とする。

1世代あたり21%の利益が出る。

$$1.04^{20} * 0.55 ≒ 1.21$$

生涯に必要な資金を2億円とする。
目減りしない原資について考える。

$$0.21 * x = 2 * 10^{8}$$

のxについて計算すると、

$$x = (2 / 0.21) * 10^{8}$$
$$ = 9.52 * 10^{8}$$
$$ = 9.52 [億円]$$

9.52億円欲しい!!!

あれ
あれ

知名を編集した後に元に戻る

2025/8/3 21:50:00

あれにて「Ctrl+ダブルクリック」の振る舞いを「描き直す」ボタンの振る舞いと同じにする形で修正いただいた


知名のみを変更する方式から知名を変更した場合に、保存後に知名が元に戻ってしまうようです。

知名と本文の両方を編集する方では問題なく知名が編集できています。

様子

環境

OS Ubuntu 24.04.2ブラウザ FirefoxIME Mozc・Hazkeyの双方
あれあれあれあれあれ
Claude Sonnet 4にこじつけで考えてもらったSwitch 2を買うべき理由

あれ

2025/8/3 14:37:00

ITエンジニアがNintendo Switch 2を買うことの経済的利点(超迂遠こじつけ版)

第一の因果関係:ゲームプレイ→視力低下→メガネ購入→集中力向上

Nintendo Switch 2は7.9インチの大画面ディスプレイでHDR対応、最大120Hzの可変リフレッシュレートを搭載しています。この高精細な画面でゲームをプレイすることで目への負担が増加し、ブルーライトカットメガネの購入が必要になります。メガネをかけることで集中力が向上し、プログラミング効率が20%アップします。

第二の因果関係:Cボタン押下習慣→反射神経向上→タイピング速度向上

Joy-Con 2には新たに「Cボタン」を追加し、このボタンを押すと「ゲームチャット」機能が起動します。頻繁にCボタンを押す習慣により指の反射神経が鍛えられ、タイピング速度が向上します。ITエンジニアの副業時給は4000円台が相場ですが、タイピング速度向上により作業効率が上がり、実質時給が5000円相当になります。

第三の因果関係:マウス機能→手首柔軟性向上→腱鞘炎予防→労働時間延長

Joy-Con 2は本体に装着する側面を下に向けて、机の上などで滑らせることでマウス操作が可能という特殊な操作により、手首の柔軟性が向上します。これにより腱鞘炎を予防でき、長時間のプログラミング作業が可能になり、副業時間を延長できます。

第四の因果関係:ゲームチャット→コミュニケーション能力向上→営業力アップ→高単価案件獲得

「ゲームチャット」では、離れた場所にいる最大12人のフレンドとゲームをプレイしながらチャットできます。この多人数コミュニケーション経験により、ITエンジニアの弱点とされる営業力が向上し、副業で年収325万円レベルの高単価案件を獲得しやすくなります。

第五の因果関係:おすそわけ通信→シェアリングエコノミー理解→ブロックチェーン着想

「おすそわけ通信」では、ゲームソフトが無いNintendo Switch 2に対して、ゲームそのものを"おすそわけ"し、一緒にプレイできる機能があります。この分散型リソース共有システムからブロックチェーン技術のインスピレーションを得て、Web3関連の高収入案件に参入できます。

第六の因果関係:4K出力→高画質慣れ→美的センス向上→UI/UXデザイン副業

Nintendo Switch 2はドック接続で4K出力対応しているため、常に高画質な映像に触れることで美的センスが向上します。これによりUI/UXデザインの副業案件も受注できるようになり、エンジニア+デザイナーの複合スキルで収入が倍増します。

第七の因果関係:カメラ機能→自撮り習慣→SNS映え→インフルエンサー化

別売カメラ「Nintendo Switch 2 カメラ」を本体に接続することで、自分の姿をゲーム画面に重ねて表示できます。この機能により自撮り習慣が身につき、SNS投稿が増加し、技術系インフルエンサーとして企業案件を獲得できます。

第八の因果関係:本体厚み維持→工学的感動→設計思想理解→アーキテクト転身

Nintendo Switch 2は、本体の厚みをNintendo Switchから変えることなく、7.9インチの大画面のディスプレイを搭載しています。この制約下での技術革新に感動したエンジニアが設計思想を深く学び、システムアーキテクトとして転身し、年収1000万円超の道筋が見えてきます。

最終結論:49,980円→年収2000万円の可能性

以上の迂遠な因果関係により、49,980円のNintendo Switch 2購入が、最終的に年収2000万円レベルのITエンジニアへの転身を促す可能性があります。

つまり「Nintendo Switch 2を買えば、ITエンジニアの桶屋が儲かる」のです。

(注:これらは完全に無理やりなこじつけであり、実際の効果を保証するものではありません)

あれ
Claude Sonnet 4にこじつけで考えてもらったSwitch 2を買うべき理由

あれ

2025/8/3 14:37:00

無理やりこじつけてみます。完全に机上の空論であることを前提に:

Nintendo Switch 2「投資効果」こじつけ分析

1. 業界研究投資効果

効用:年間15万円相当
最新ゲーム技術を体験することで、ゲーム業界への転職成功率が5%向上。ゲームエンジニアの平均年収600万円×5%=30万円の期待値向上。2年で回収と仮定し年間15万円。

2. ネットワーキング資産効果

効用:年間8万円相当
Switch 2保有者として業界関係者との会話が弾み、紹介案件1件獲得。フリーランス案件月80万円×1ヶ月=80万円を10年で分割。

3. 技術トレンド先行投資効果

効用:年間12万円相当
新Joy-ConのCボタンやゲームチャット機能を理解することで、UI/UX設計スキルが向上。時給単価が200円アップ×年間2000時間(転職後)=40万円を3年で分割。

4. 希少性プレミアム効果

効用:年間6万円相当
発売直後からすぐに購入できるとは限らない状況で早期入手に成功した場合、1年後に15万円で売却可能と仮定。差額10万円を純利益とし、資金調達効果として計上。

5. コンテンツクリエイション投資効果

効用:年間20万円相当
ゲーム実況やレビュー動画でYouTube収益化。月3万円×12ヶ月=36万円から機材減価償却を引いた純利益。ただし成功確率20%なので期待値は年間7万円...いや、希望的観測で20万円。

6. 健康管理・ストレス軽減効果

効用:年間5万円相当
適度な娯楽により転職活動のストレス軽減。心療内科通院費用や抗うつ薬代の削減効果。月5000円×10ヶ月=5万円。

7. 面接ネタ・差別化効果

効用:年間10万円相当
「最新技術への関心」をアピール材料として活用。面接通過率3%向上により、転職活動期間1ヶ月短縮。生活費20万円×0.5ヶ月分の節約効果。

8. 時間価値最適化効果

効用:年間4万円相当
無職期間の有効活用により、「ゲーム業界研究」という名目で罪悪感なく娯楽時間を確保。精神的安定による生産性向上効果。

総合投資効果分析

年間総効用:80万円
(15万+8万+12万+6万+20万+5万+10万+4万)

投資額:5万円(本体価格)

投資効率:1600%

投資回収期間:約23日

結論:
このこじつけ分析によると、Nintendo Switch 2は超優良投資案件となります。ただし、この分析には以下の重大な欠陥があります:

  • 成功確率を異常に高く見積もっている
  • 相関関係を因果関係と混同している
  • 機会費用を完全に無視している
  • 数字に根拠が皆無

現実には、無職で5万円の娯楽費支出は極めて危険な判断です。真面目に転職活動に専念することを強く推奨します。

あれ
LLMの文章Claude Sonnet 4面白くない文章LLMに文章を書かせても面白くならないLLMに文章を書かせる

あれ

2025/8/3 13:28:00

Claude Sonnet 4 をもってしても、やっぱLLMに文章書かせても面白くならないな。文章を書く前にいくらかやり取りしているところはなかなか面白かったのだが、そこから完成品の文章を書かせようとしたらどうにも面白みがない文章になってしまう。

あれ
ガリガリ君

あれ

2025/8/2 21:31:00

欲に負けてガリガリ君を2個買ってしまって、風呂の前と後で食べてしまったんだけど、2個目は1個目よりも脳にくる感じがなかったので、効果が逓減してしまうという学びがあった。

あれ
知名を編集した後に元に戻るあれ

あれ

2025/8/2 21:10:00

確認ありがとうございます!

私個人としては、知名だけ編集する機能はない方が良いかなと感じているので、廃止に賛成です。

下記のようなことが時折起こっており、知名のみ編集する機能・本文のみ編集する機能の双方とも、いっそ最初から全体を編集できる方が便利なんじゃないかと思います。

  1. 知名だけ編集する状態に入る
  2. 本文も編集しようとする
  3. 本文が編集できないので全体を編集する状態に切り替える
あれ
音声入力前進あるのみ

あれ

2025/7/31 23:55:00

音声入力で日記つけてみた。手が楽。音声入力した後にキーボードで調整。

ちょっと長めの文章でも音声入力でそこそこに書けるようになってきた。


音声入力だと後戻りはできないので「前進あるのみ」となる。後から直す。

あれ
AI日記2025年7月31日蛇行する散歩近所の地下ハンバーガー屋

あれ

2025/7/31 23:49:00

 朝は近所のハンバーガー屋さんでハンバーガーを食べてきた。地下にある店舗で、席のすぐ近くにカウンターがあってあまりゆっくりくつろぐような雰囲気でもないためか、いつも空いている。こちらとしては大変助かるのだが、これがこの店舗が果たして継続できるのかだろうかと言うと怪しいと思わざるを得ない。従って、足しげく通ってわずかなりとも支えるとともに、その効能を潰れるまでに目一杯享受することが良いだろう。潰れずにいてくれることがベストだが。地下の店舗なので、家賃が大いに安い可能性もある。


 作業がAIありきになってきている。調べ物はAI。コードを書くのもAI。文章を書くのもAI。AIがなくなれば私は何もできなくなってしまうだろうな。
 心理的にやりたくない作業もAI越しであればやっているような気分のことをできる。ウンコを素手では触りたくないが、トング越しならウンコを掴めるような心地だ。しかしその作業はまるで進んでおらず、堂々巡りを続けている。ウンコを握る必要がある。


 夜の散歩を蛇行して散歩することを覚えた。直線的に散歩をすると帰るのが面倒だったり、帰った後に目標の歩数に達していなかったりすることがあるが、蛇行して歩くことで家からさほど離れることなく歩数を稼ぐことができる。いつもとは違う道を歩くことになるので、散歩コースの飽きに対して耐性があるように思う。

あれ
2025年7月
あれ
読みたい『コーパスの逆蒸留』『Knowledge Unlearning for Mitigating Privacy Risks in Language Models』『A Survey on Dataset Distillation: Approaches, Applications and Future Directions』『Contrastive Decoding: Open-ended Text Generation ...『DExperts: Decoding-Time Controlled Text Generatio...

あれ

2025/7/31 15:21:00

次に読みたい:

あれ
パスタ

あれ

2025/7/31 12:41:00

パスタを水につけとくやつやったら楽だった。
しなっとした麺と牛乳をフライパンに入れて、火にかけて、味整えたら完成や。
洗い物も少ない。

光熱費の節約にもなってええね。

あれ
llm-jp-judge『llm-jp-judge: 日本語LLM-as-a-Judge評価ツール』

あれ

2025/7/31 0:04:00

現在 llm-jp-judge は,Hugging Face Hubに登録されたオープンなLLM〜〜中略〜〜による推論に対応している

助かる。ベンチマークに金がかかるのはつらいし、クローズドなLLMで評価するのは再現性の面でどうなんだとか、OpenAIにロックインしてないかとかみたいなところで気にしていた。

あれ
LLMiGPU『iGPUのVRAM割り当てをめちゃくちゃ増やせば、128BのLLMも動く。AMD公式がデモ - P...

あれ

2025/7/30 18:13:00

今年の2月頃にも私もRyzenのiGPUでLLMを動かすのをやろうとしてたんですわ(うまくいかなかった)。

その時にAMD株を買ってれば1.7倍になってたんですわ。ドタワケ。

あれ
スプシ家計簿2025年7月30日

あれ

2025/7/30 13:04:00

スプシで最新の住宅費を取ってこれるようになった。

=MAXIFS(収支[金額], 収支[科目], "住宅費", 収支[日付], MAX(収支[日付]))

これでスプシでイベントソーシングみたいなことができるぞぉ。

あれ
やる気1分着手ルール2025年7月29日あれ『やる気が出ない人にオススメの「モチベを維持しようとするな」というコツ - posfie』やる気の無さを無視して、やる
あれ
『ウェーブレット位置符号化』

あれ

2025/7/29 22:50:00

ウェーブレット勉強したいと思いつつできていなかったら最新の動向を知ることができるのありがたい。


位置符号化ということは、LLMに文中のトークンの位置を示すためのやつだろうか。
あってた。


RoPEの外挿性能は低い

一符号化における外挿性能ってなんだろう。


RoPEはウェーブレット変換の一形態であると解釈できる

私には読むのが難しい論文ということがわかってきた。


ウェーブレット位置符号化はRoPEと比較実験では、8bのモデルにおいてCodeparrotベンチマークのPPLが低くなり精度が高いとのこと。

あれ
queueあれClaude Max調査QueueChatGPT Plus

あれ

2025/7/28 21:19:00

調べることのQueueを作ってやればよさそう?

バカなことやってねぇでClaude Max契約しろっていう話かも。

あるいはOpenAIのサブスクを使うのもありか。ChatGPT Plusは20[USD/Month]、Claude Proは20[USD/Month]、Claude Maxは100[USD/Month]なので、ChatGPT PlusとClaude Proの両方を契約するなら60[USD/Month](60%)の節約となる。

Claude Max - (ChatGPT Plus + Claude Pro) = 60 [USD/Month]
(ChatGPT Plus + Claude Pro) / Claude Max = 0.4

あれあれ
ForgeFed『Forgejo+WoodpeckerでCI/CD環境を所有する | 点と接線。』
あれ
『ベイズ教師なし文境界認識』BunkaiSegment Any Text

あれ

2025/7/28 12:46:00

文分割

より一般化できそう。任意の文字列を任意の単位で分割するみたいな。
私がやりたいと思っていることに文の分割が必要と思っていたので、本論文の手法を応用できそう。


日本語では, 役割語 [7] の一種として「ナリよ」「ラジね」など無数の文末表現が発明され, 日々更新されている.

一番味わい深いところを取ってきている。


文分割を〜〜二値潜在変数の推定問題ととらえる

二値潜在変数の推定問題ってなんだろう。


ツイートやパラグラフの終わりは必ず文境界であり

データを得る方法として視点がすごく良い。
ただ、無視できるものと思うのだけど、連ツイなどでは文境界ではないものが少数ながらあるので、「必ず」よりも「ほとんど」がよさそう?

あれ
『テキスト生成における最小ベイズリスク復号の理論的な理解に向けて』『疑似参照訳文ベクトルの重心に基づく高速なニューラル最小ベイズリスク復号』最小ベイズリスク復号
あれ
股関節のストレッチ2025年7月27日股関節の痛み

あれ

2025/7/28 1:30:00

5日ほど股関節のストレッチをしていたら、痛かったのがマシになってきた。

何やら腰の調子も良い。
他の下肢のストレッチもできているからだろう。
腰の不安定な感じ、ゴリゴリとした感じが取れている。

あれ
2025年7月文章の型を試すNest.jsを試す
あれあれあれあれあれあれあれあれあれあれあれあれ
引き入れドラッグ&ドロップで引き入れ引き入れが失敗する条件
あれ
ブラウザ拡張機能Transformers.js

あれ

2025/7/27 21:12:00

そうか、ブラウザ拡張機能でLLMを使う場合、モデルを選択可能にすればいいのか。

選択肢としては下記のようにすると良さそう

  • ブラウザで動くローカルモデル(Transformers.jsとか使う)
  • ブラウザのAPIで動くモデル(現時点ではChromeだけが対応のはず)
  • 外部API(APIキーなどは利用者が入れる)
  • 自前API(プロンプトなどは学習に利用される)
あれ
チャーハン

あれ

2025/7/27 14:42:00

チャーハンを作った。

「卵を増やしたい」vs「卵を多くするとベチャベチャになる」対立への解として、半量の卵をあらかじめ炒り卵にすることを試したのだけど、卵の量の割にはベチャベチャにならなかった気がする。ただし工程と油の量が増える。

あれ
引き入れドラッグ&ドロップで引き入れ引き入れが失敗する条件
あれ
NestJS『Official Courses | NestJS - Learn to build Node.j...
あれ
脱線2025年7月27日
あれ
あれ
あれ
ダイエット水分

あれ

2025/7/26 22:40:00

食べ過ぎたら体重がモリっと増えるんだけど、これって糖質を蓄えていて、その糖質を蓄えるために必要な水分の重量なんじゃないかと思った。

なので、太ったと思って過度に悲観する必要はなさそう。もちろんそのまま食べ過ぎていくとちゃんと脂肪になるんだけど、その前に食事量を減らせば体重も戻るはず。

あれ
AIタイピング2025年7月26日

あれ

2025/7/26 22:20:00

タイピングが速いとAIに速く指示を出せてお得。

AIがあればタイピングとかいらなくなるだろうと思われたけど現時点では一番手軽に指示を出せるのはキーボードを叩いて入力する方法になってる。もし音声入力が一般的になってきたらまた状況は変わりそうではある。

あれ
n-gram言語モデルperplexity『クレオールは計量的に峻別できるか?』クレオール

あれ

2025/7/26 21:47:00

クレオールってなに?
→異なる言語を話す人たちが接触し、その第二世代が母語として獲得した言語のことをクレオールというらしい。

クレオールは単純か否か?という問いがあるらしい(単純説と同等説)く、過去の研究では単純説が優勢らしい。ただ、それについての定量的な分析は見つかっていないとのこと。


言語の複雑さをどうやって測る?
→n-gram言語モデルのperplextyを用いる
→→すげぇ

クレオールは非クレオールと比べて、n-gram言語モデルのperplextyの値が小さくなった。つまり、単純という結果になった。とのこと。
過去の研究との結果と整合している。

あれ
AndroidAndroidタブレット2025年7月26日

あれ

2025/7/26 15:47:00

特段使い道も金もないのにAndroidスマホとAndroidタブレットが欲しくなりつある。
多分金を使いたい気分になってるだけのやつだわ。

AndroidでなくともLinuxタブレットとかあればいいんだけども、なさそうな気がする。WindowsタブレットにLinuxを入れるとかすればよさそうではある。


iPhoneやiPadの微妙な不自由さも気に障りつつある。


Android開発者アカウントを放置してたら消された件も思い出されてきた。選択肢がないぞい。




やすいやつでいいからMac買ってDeveloper税払うべきという可能性も。


Macを買うとしたら、

作りたいものをWebサービスとして開発する(アプリを見越してAPIを作っておく)
XCodeの代替品を試す
XCodeの代替品がダメだったらクラウドのMacを使う
それでもダメなら実機を買う

って感じかしら。

あれあれ
2025年7月
あれあれあれあれあれあれあれあれあれあれあれあれあれあれあれ
『Amazon.co.jp: New Amazon Kindle Colorsoft | 16GBス...

あれ

2025/7/25 11:13:00

¥39,980

買うには高いな……
安いAndroidタブレットを買えてしまう。


防水だからお風呂、プールなど、お好きな場所で読書を楽しめます

お風呂読書勢への訴求だ。紙の本ではリスクがあるので良い訴求だ(私は爆速シャワーなのでターゲットでないが)。
なおここでは風呂にノートPCを持ち込む少数の者については無視するものとする。
安い防水タブレットがあればそれでええやんと思って調べたら、あまりピンとくるものがなかった。
良いポジショニングをしようとしている。

あれ