『Google検索結果から特定サイトを除外する – ヤバいサイトの見分け方』
あれ
1週間ほどスマホのデフォルトの検索エンジンをGoogleからBingに変更してみているが、思ったような検索結果とならなくて辛い。
再現:輪符が一度に複数貼り付けられることがある
修正済み:修正いたしました
Windows10のChromeとEdgeで修正されていることを確認
デライトにおいて、輪符が一度に複数貼り付けられることがある事象が、以下の環境と手順で再現することを確認した
再現環境
Windows11のFirefox
Windows10のChrome・Edge
再現手順
- 輪郭を前景一覧表示する(https://dlt.kitetu.com/?bg=K%23EDD2%2FB4C7 などに遷移する)
- 前景一覧を開いたまま輪郭の編集を開始する
- くぐり検索する
- 検索結果から
+
ボタンで輪郭の引き入れられをする - 輪符の
{
をクリックして、輪符をコピーする - 輪符を輪郭の編集欄に張り付ける
- 輪符が多重に張り付けられることを確認する
再現頻度
Windows10のChrome:3/3
備考
再現手順の4. 検索結果から+ボタンで輪郭の引き入れられをする
をしない場合には本事象は再現しなかった。
検索結果から操作
あれ
あれ
あれ
アメリカと戦うと言った意味では、まともな国産検索エンジンがないのが口惜しい。陰謀論みたいになってしまうが、アメリカがその気になればGoogle検索にくだらない記事を混入させるといったこともできてしまう。意図的じゃなくとも、検索結果にかける熱量もとい手間の量がそもそも違うだろう。ただ、現時点の話をすれば、Google検索は日本語を重要視しているらしい。
そう言った意味では、ローカルのPCでクローラを回してオープンソースの検索エンジンを動かすというのは悪いアイデアじゃない。今流行りのプライバシーにも完璧に対応できる。ただ、インターネットの圧倒的な物量にはインデックスであってもローカルのPCには入りきらないということが絶望的に欠点だった。
今から追い上げるのは難しいにしても、いつでも作れるような地固めはできないものだろうか。
最近ブログ悲観論をちょいちょい見かけるので考えてみている。現時点での考えをつらつら書いてみる。
「WordPressブログはもはや「センセーショナルなタイトルとSEOを武器に、バカがバカを相手に稼ぐ」という意味しか持たないメディアに成り下がった」
「Google検索によって発見され、Google Adsenseの広告によって収益を得る。企業案件やアフィリエイトブログでなければ、これがブログの最もメジャーな運用」
センセーショナルな本文だ。
ブログの多くがGoogle AdSenseを収入源としているために、少数の賢い人を相手に文章を書いても稼ぐことはできないのだろう。多数の「バカ」、つまり読解力の低い人でもわかるような薄い内容の文章の記事を書くことが優位な戦略となってしまう。この問題に輪をかけるのが、読解力の高い人は広告クリック率が低いという問題だ。例えば、一般的に読解力の高いであろうITエンジニアが読む、技術ブログのアドセンスのクリック率は極めて低く、0.06%となっている(『技術ブログは稼げるのか?1年以上続けた結果の収益は?』より)。これでは収益は上がらない上に安定しない。
Google検索の検索結果の品質について言及されている。確かに今回「エンジニアのクリック率」で検索したところ、クリック率について説明するページばかりが出てきて役には立っていない。Twitterで検索したところ目的の情報に当たることができた。この点においてはTwitterが勝っていたと言える。
本当にGoogle検索の検索結果の品質は低いのだろうか?Google検索を利用する人はどんどん増え、広く膾炙した。最大公約数的な品質を高めるならば、ブログを書くような一部の読解力が高い人が満足する検索結果が得られないのは当然だと思われる。
検索結果を個人に最適化することができればこのような問題も解決するかもしれないが、プライバシーの問題があるために最適化するに得る情報を収集することができないのかもしれない。また、検索というのはその人が今まで検索したことが無いものを検索することが多く、その結果がどうあるべきかについてGoogle検索があらかじめ知ることは不可能だ。
「ブログでは「まとめきる」ことができないんです。まとめきろうとすると、どうしても記事の長さは長大になります。例えばObsidianなら、軽く10万字は超えるでしょう。」
10万字の記事がなぜダメなのかについては書かれていないが、おそらく長い文章は読まれないということに対して悲観していると思われる。アクセス数が増えない。労力に見合わない。長文を読める読解力の高い人は広告をクリックしない。
現時点での結論としては、Google検索・Google Adsenseというエコシステムに依存しているようでは読解力の高い人が満足するような文章が出回ることは難しいのかもしれない。
しかしかつては本や雑誌という媒体でお金を支払わなければ情報を得ることが難しかったことを考えれば、無料でお金を支払うことなく(低品質でも)情報を得ることができる状態になっていることは社会にとって有益だ。また、読解力が低い人が読解力を高めるハシゴとなっている。
「(Google検索の検索結果は)企業が運営する「内容が薄い」「無駄に長い」記事が検索結果の上位を独占する」
あれ
「お酢 疲労回復」とかで検索すると大量に検索結果が出る。何が正しいのか分からない。「任意の飲食物 疲労回復」で検索すればいくらでも典拠を探し出せそうだ。
この情報化社会では典拠は探せば見つかるから典拠があることは正しさを保証しないな
黒酢で活力の届出表示によると疲労感を軽減する効果があるそうだ。疲労が回復するとは言っていない。
本品には酢酸が含まれます。酢酸には日常生活で生じる運動程度(5~6METs)の疲労感を軽減する機能があることが報告されています。
とりあえずfaviconをSVGで作っておけばGoogle検索の検索結果に表示される
全知検索の勘所
- 単語で全知検索するとヒットしやすい
- 関係のありそうな単語で検索して、検索結果として出てきた輪郭の中から、関係のありそうな輪郭から輪郭へ飛び回ると目的の情報に行き当たりやすい
- 文章で全知検索するとヒットしづらい
アウトライナーの検索結果から階層を操作できないと不便
タグで検索して見つかりましたで終わりって感じがするんですね
結局検索結果って見つけられますけど、検索結果から操作できないじゃないですか
だから意味ないんですよね
あれ
新しい技術を勉強して使いたい。例えばWeb WorkerやWebassemblyだ。しかしなかなか使う機会が無い。どちらも調査と検証は進めている。何もせずにこまねいているわけではない。ただ、Web Prowlerに使うには利用状況がうまく嵌ってくれない。
ウェブからのデータ取得にWeb Workerを使おうとしたが、DOMParserがWeb Workerでは使うことができなかった。DOMParserを除いた部分をWeb Workerで動かそうと考えたが、そこまで重たい処理でもない。DOMParserが一番CPUに負担がかかる処理だ。
Webassemblyで分かち書きを高速化しようとしたが、どうもTinySegmenterをWebassemblyで動かしても処理が遅くなるだけのようだ。それよりもTinySegmenterをBigramに置き換える方が速い。トークンの数は増えてしまうが、検索結果の精度向上につながるだろう。