あれ
2023/12/1 21:39:00
ちょっと邪悪なアイデアなんだけども、検索エンジンに偽装すればペイウォールを突破して有料記事が取得できるし、『Textbooks Are All You Need』みたいに学習データの質がLLMの質に直結するって研究もあるし、ペイウォールの先のコンテンツをつかってLLMを学習させれば良いLLMが作れるんじゃなかろうか。
ちょっと邪悪なアイデアなんだけども、検索エンジンに偽装すればペイウォールを突破して有料記事が取得できるし、『Textbooks Are All You Need』みたいに学習データの質がLLMの質に直結するって研究もあるし、ペイウォールの先のコンテンツをつかってLLMを学習させれば良いLLMが作れるんじゃなかろうか。