t_wの輪郭

検索サイトインターネット作りたいサービス俺の

俺のインターネット

2024/3/31 11:16:00

俺のインターネットでできたいこと

RSS 大規模言語モデルの小規模化大規模言語モデルをOSに搭載個人化した大規模言語モデル大規模言語モデルの個人化情報搾取『ChatGPTは「植民地化されたネットの象徴」　若手起業家が警鐘』セマンティックウェブ LLM 検索サイト

大規模言語モデルによって検索サイトのビジネスモデルは崩壊し、セマンティックウェブの時代が到来する？

2023/5/25 20:02:00

今までの検索サイトのビジネスモデルでは、検索サイトと検索によって表示されるサイト（以降「被検索サイト」と呼称）の間には互恵関係があった。検索サイトから個々のウェブサイトへ閲覧者が流入するという利点が被検索サイトにはあった。

LLMが検索サイトに搭載され、検索語で知りたい情報が検索サイト自身に表示されるのであれば、被検索サイトのページビューは減少する。

閲覧者の流入がないのであれば、被検索サイトにとって検索サイトが敵になる。クロールされ、負荷を強いられ、情報を搾取されるようになるからだ。今までは被検索サイトは得られる利益と引き換えに、こうした問題を受忍してきた。しかし利益がなければ受忍する道理はない。

故に、被検索サイトもAI絵師の問題と同様に、サイトからの情報を学習に利用されることを拒否するようになる。

そうして出てくるのは、LLMを搭載したブラウザやOSだ。利用者の手元でLLMが動作し、情報を収集し、利用者の問い合わせに応じて回答する。大規模言語モデルの小規模化もそれを後押しする。

利用者にとってはLLMを通して情報を取得する形となるが、検索サイトは仲介することによる利益を広告として得ることができなくなる。すなわち、情報流通の費用が低減するのだ。

続いて勃興するのはLLMに最適化された情報の提示だ。SEOが検索エンジンに最適化したように、LLMに最適化された情報を提示して、自身の事業に有利な出力をするように仕向ける。その形態はビジュアルである必要がないため、セマンティックウェブ的になる。

購読の意味合いも変わってきて、LLMに食わせる情報源として購読するという形態が発生する。RSSが形を変えて復興する。

想定される課題と対処

プライバシー

プライバシー: ユーザーの行動や興味を反映させるためには、大量の個人データを収集する必要があります。これはプライバシーの問題を引き起こす可能性がある。

しかし、プライバシーの問題はむしろ霧散する。今のLLMは営利企業のサーバーによって実行されており、その際の問い合わせ内容はサーバーに保存される。しかし、各利用者の手元のOSで動作するLLMではその問い合わせ内容は外部に出ることはなく、完全にプライバシーが保護される。

コンピューティングリソース

個々のデバイスでAIの訓練を行うというのは、コンピューティングリソースの観点からも難しいかもしれない。

集約されたLLMと個人化されたLLMでは、サーバーで動作する「集約されたLLM」の方が潤沢なコンピューティングリソースを使うことができるため、相対的により“賢い”LLMを利用することができる。そのため、公共知は集約されたLLM、個人知は手元のOSで動作するLLM、のように使い分けることになる。

情報の正確さや信頼性を保証する難しさ

情報の正確さや信頼性を保証することが難しくなる。ユーザーが選択的に情報をクロールや購読する場合、情報源が偏ったり、誤った情報が混入する可能性がある。また、エコーチャンバーのような問題も生じる。

営利企業が運営するLLMに対しても同じことが言える。営利企業であるがために広告・宣伝・プロパガンダを混ぜ込むなどの意図的な偏りが発生する。

あれ

検索サイト有力な有力

有力な検索エンジン

2022/10/25 18:24:00

bot.txtで有力な検索エンジン以外を除外

検索サイト検索エンジン

Bing

2021/8/26 6:53:00

Bingアプリ Bing Webmaster Tools あれあれ Bing『高度な検索オプション』Firefox addon: Microsoft Bing 検索エンジン Bing Content Submission API 『Xユーザーの辻正浩 | Masahiro Tsujiさん: 「「最大手検索エンジン以外はサーバ負荷...IndexNow

Google 検索サイト検索エンジン検索

Google検索

2021/3/20 9:42:00

インデックス Google検索悲観論「Google検索によって発見され、Google Adsenseの広告によって収益を得る。企業案件やアフィリエイトブログでなければ、これがブログの最もメジャーな運用」あれ Google検索のコツ google検索で、　{検索ワード} site:https://t.co/wW3oSRo80N と...Googleにインデックスされているか確認する方法あれデライトの人口が増えたら、一つの輪郭に文脈を無視して何でもかんでも放り込まれるかコンテンツファーム「メモ知能増幅」でGoogle検索するとデライトが一番上に来ているとりあえずfaviconをSVGで作っておけばGoogle検索の検索結果に表示される「（Google検索の検索結果は）企業が運営する「内容が薄い」「無駄に長い」記事が検索結果の上位を独...『Google検索結果から特定サイトを除外する – ヤバいサイトの見分け方』あれ Google検索も独占的な商品だったが、顧客を奪われようとしているあれ Google検索は日本語を重要視 Google Search Console あれ Google検索は文字コードの上に成り立っている Google検索を支える巧妙なアイデア「ランダムサーファー」【Google2】『コマンドラインからGoogle検索できるツールGooglerの使い方』Google検索のメタクソ化パンダアップデートあれあれあれあれあれ Google検索はAIが書いた記事を弾く Google求人検索 Ad-Free Search 『広告やAI要約なしのグーグル検索結果がみられるサービス「Ad-Free Search」 - 世界の...Google Alerts