t_wの輪郭

Feedlyでフォローするボタン
生成AI

RAG

2023/11/12 21:40:00

Retrieval-Augmented Generation


大体の流れ

  1. ユーザーが質問を発する
  2. ユーザーの質問から関連情報を検索
  3. ユーザーの質問 + 検索結果 を生成AIに与える
  4. 生成結果をユーザーに提示
Agents for Amazon BedrockLangChainAdd your dataAssistantsOpenAIのAssistantにデライトの輪郭を食わせて、文章を書くのを手伝ってもらってみたら、意外性の無い文章しか生成できなかった2023年11月12日日記Retrieverembedchainあれ『RAG質問応答システムに使うRetrieverの精度比較』あれ『ナレッジグラフを用いたRAGの改善』『オープンな日本語埋め込みモデルの選択肢 / Exploring Publicly Available Japanese Embedding Models』GraphRAG『RAG vs GraphRAG の比較 | One Tech Blog』『Tanuki-8BとOllamaとDifyを使って日本語ローカルRAG構築』『Xユーザーの専門性・売上・原稿さん: 「O'Reilly Mediaはすでに全技術書を組み込んだLLMで検索ができるので事実上のRAGがある状態だけど、あれ、あんま便利じゃない気がしてるんだよな…。というか、ふつうに全文検索をしたいのにUI的にうっかりあっちを使ってしまって「もうっ!」ってなる」 / X』Genie『RAG(Retrieval-Augmented Generation)を活用したCopilotが、Uberに13,000時間のエンジニアリング時間を節約 - InfoQ』『Genie: Uber’s Gen AI On-Call Copilot | Uber Blog』

経緯

デライトアドベントカレンダーの文章を書くネタが全然降りてこないので、与えた情報に基づいてAIが回答してくれる、OpenAIのAssistantsを使って文章をかいてもらおう、ついでにネタの一つにしよう、ということになった。


手順

  1. デライトをクロールして輪郭を集める(筆者は『t_wの輪郭』を作るためにDynamoDBに格納していたデータを使用した)
  2. 各輪郭をhoge.txtに変換
  3. OpenAIのAssistantsにファイルをアップロード
  4. Assistantsに文章を書いてもらう

結果

所感

使い物にならなかった。面白い文章は出てこなかった。
ChatGPTにとって未知の情報かつ、自分にとって既知の情報を与えた場合には、意外性のない文章が出てくるのは、考えてみれば当然のことだった。

より良い使い方としては、「社内イントラなどと連携し、新入社員がこれを使って情報探査する」といったことには向いていそうだ。


結果1

User

『なんでもメモ、デライトとFediverse』というお題で1000字程度の文章を書いてください。 なお、デライトはまだActivityPubに対応しておらず、対応が検討されているに過ぎません。

Assistants(GPT-4)

「なんでもメモ、デライトとFediverse」

日常において、忘れてはならないアイデアを瞬時に記録するためにノートやメモ帳が手放せない方は少なくありません。こうした必需品のデジタル版として登場した「デライト」は、シンプルながらも機能性に優れたメモアプリケーションです。様々な情報をカテゴリーやタグで整理し、クラウドを介して端末間で同期することができるため、使用者にとって非常に便利なツールとなっています。しかし、情報の「共有」と「やり取り」の側面に関しては、現状デライト独自のクローズドなシステムに依存しており、他のプラットフォームやアプリケーションと直接連携する手段には乏しいのが実情です。

一方で、オープンソースと分散型のソーシャルネットワークである「Fediverse」(フェディバース)が成長しつつあります。Fediverseは、MastodonやPeerTubeといった異なるプラットフォーム間での相互運用性を可能にするプロトコル「ActivityPub」に基づいています。このプロトコルは、異なるサービス間でのユーザーのインタラクションを促進するもので、各サービスは独自のプラットフォームを維持しながらも、広いネットワークに参加することができるようになっています。

デライトがFediverseというオープンで分散型のエコシステムに参入すれば、メモや情報の共有が一段と手軽になるだけでなく、ユーザーは情報をさらに価値あるものとして活用することが期待できるでしょう。例えば、デライトのメモをMastodonでフォロワーに共有したり、友人がPeerTubeで投稿したビデオに直接メモとして反応したりすることが容易になるかもしれません。自分の思考やアイデアをFediverseの他のプラットフォームにいるユーザーとリアルタイムで共有し、そこからフィードバックを得たり、コラボレーションを図ったりすることで、創造性や生産性が高まります。

さらには、Fediverse上で形成される中小企業やクリエイターたちのコミュニティーにおいて、デライトがインフォメーションマネージメントのハブとなることが予測されます。そうすることで、利用者は情報源を分散させることなく、一箇所に集約された知識として活用することができるようになります。このように、デライトがFediverseと統合することで得られる相乗効果は計り知れません。

しかし、現時点でのデライトはまだActivityPubに対応しておらず、その連携は"検討中"の段階にあると報じられています。多くのデライトユーザーはこの連携を心待ちにしており、技術面での課題がどのように解決されるのか、またプライバシーとオープンネスのバランスをどう取るのか、注目されています。開発チームはユーザーコミュニティーからのフィードバックを積極的に取り入れながら、世界中で使われているFediverseとの互換性を実現すべく努力を重ねている状況です。

「なんでもメモ」としてのデライトの利便性と、Fediverseという新しい形のソーシャルネットワーキングの可能性が融合すれば、これまでにない形の情報共有、コミュニケーション、さらにはコラボレーションが見込めます。変化の激しいデジタル時代にあって、開かれたプラットフォーム間の対話と連携が、情報の価値を最大限に引き出す鍵となるかもしれません。デライトがFediverseに対応する日はいつ来るのか、その日が訪れたとき、ユーザー体験は確実に変革されるでしょう。

結果2

User

デライトの輪郭について1000字程度で説明してください

Assistants(GPT-4)

デライトの輪郭に関する記述は大まかに「Loopコンポーネント」の取り扱いとそれに関連する「描写埋め込み」に関するものでした。デライトの輪郭とは、ある種のデータ構造や文書の処理において、特定の情報を異なる文脈や範疇に埋め込むことを可能にする仕組みを指しているようです。「Loopコンポーネント」は、様々な場所に埋め込むことができる非常に柔軟なシステムであることが強調されています。しかしながら、その処理は非常に複雑であるため、実際に取り扱うのが難しいとされています。埋め込まれた情報の整合性を保ちながら、適切に管理・編集する必要があり、それには多くの注意と手間がかかるようです。

更に、「デライトの描写埋め込み」とは、Loopコンポーネントと似た概念であり、基本的な機能は「トランスクルージョン」という原理に基づいています。これは、ある文書の内容を別の文書で参照し、表示することを可能にする技術と述べられています。しかし、現状では食品のカロリー情報を埋め込む程度にしか有効利用されていないとの指摘があります【19†source】。

以上の記述から、デライトの輪郭というのは、情報技術の文脈でみられる複雑なシステムの一部であり、文書やデータの柔軟な組み合わせと運用を実現するための技術要素のようです。しかしその反面、その柔軟性が逆に整合性維持や編集の複雑さをもたらしているとも考えられます。また、そのポテンシャルにもかかわらず、まだ完全には活用されていないという現状が示唆されているようです。このためにデライトの輪郭は、情報管理やレイアウト設計、システム開発における挑戦的な側面を持っていると言えるでしょう。

Retriever

2023/11/20 22:25:00

RAGにおいて検索を担う箇所

2023年11月12日日記

2023/11/12 21:37:00

knownetはもはや私には扱いきれなくなってきた

 knownetの開発が一区切りついた。すごく疲れた。少し変更するだけでうまく動かなくなる。手からポロポロとこぼれていくようだ。
 しばらくは放置して寝かしたい。

サーモン天国

 スーパーで大きめのサーモンを買って、切って、食べた。800円だった。軽く胸焼けになった。贅沢だ。

OpenAIのAssistantsを試したらつまんなかった

 RAGが出来るっぽいので試した。面白い文章が出てくるかなと思って。全然面白くなかった。GPT-4自体飽きたし、自分が書いた文章しか入れてないし、そりゃそうか。というか、AIが書いた文章というアレで減点してしまっている気がする。

日記に書くことがない

 まじでプログラミングぐらいしかしてないので書くこともなにもない。行動力が必要。

明日は仕事

 こんなにも疲れているのに、世界は明日が月曜だと言う。働かなければならない。うへぇ。