2022/2/28 16:32:00
User-Agentを一般のコンピュータに偽装してクロールする輩MJ12botDotBot現実をクロールデライトをクロール思考をクロール『t_wの輪郭』の輪郭に編集日時を表示あれScrapboxだけ検索するWebサービス表最強説あれ『Xユーザーの辻正浩 | Masahiro Tsujiさん: 「「最大手検索エンジン以外はサーバ負荷からまともにクロールさせてもらえない問題」の対応のため、Microsoft Bingはサイト管理者からコンテンツを送りクロールを削減するBing Content Submission APIや他社と連携したIndexNowの仕組みなどで試行錯誤した。 一方BraveはGoogleを名乗ってクロールした」 / X』
nginxのログお行儀が良い熱心な読者ぬか喜び内部リンクMozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.79 Safari/537.36User-AgentDate last visitedクロール偽装
User-Agentを一般のコンピュータに偽装してクロールする輩
2022/10/25 19:45:00
『t_wの輪郭』にUser-Agentが下記のアクセスがちょいちょい来ていた。Date last visitedが乱れてちょっと気になる程度の頻度。
内部リンクが無いはずの所にアクセスしており、足跡が妙なため、nginxのログを見たら、なぜか律儀にrobot.txtにアクセスしている。
熱心な読者が来てくれているとぬか喜びしてしまった。
しかしまあ、輩と書いてしまったが、User-Agent以外はお行儀が良い。
MJ12bot
2022/10/10 20:46:00
DotBot
2022/10/10 20:46:00
あれ
2022/7/28 18:44:00
t_wの輪郭みたいにクロール、スクレイピングする(仕様合ってるかな?)のが妥当なのかな。
仕様あってます。5分に1回 https://dlt.kitetu.com/KNo.EDD2 をスクレイピングして、30秒(うろ覚え)20秒に1回の頻度で自輪郭全体をクロールしてます
あれ
2022/7/17 18:27:00
急に輪郭が作成されてドキドキしている。自分で書いた輪郭だけとはいえ、勝手にデライトをクロール(というかスクレイピング?)して転載しているので、ちょっと後ろめたいところがある。転載禁止を言い渡されたら消すしかない。
ありがたいですとのお返事をいただいた。安心した。
現実をクロール
2022/5/5 12:41:00
『t_wの輪郭』の輪郭に編集日時を表示
2022/5/1 21:58:00
Scrapboxだけ検索するWebサービス
2022/2/28 16:44:00
hogehoge site:http://scrapbox.io
でよくググるので、Scrapboxだけ検索するWebサービスとかあれば面白かろうかと思うのだけど、作るには色々重たすぎるし、流行ればアビューズされるし、クロールすればScrapboxに負荷かけちゃうかもだしなどと考えてる