ディスカッション (11件)
検索エンジンKagiが展開する『Small Web』イニシアチブについてのトピックです。昨今のSEO重視な企業メディアに埋もれがちな、個人ブログや小規模なインディーサイトを再発見し、インターネット本来の面白さを取り戻そうとする試みです。情報の多様性を求めるエンジニアにとって、注目のプロジェクトと言えるでしょう。
いいアイデアだね。インデックスは申請されたサイトに基づいているよ:
https://github.com/kagisearch/smallweb/blob/main/smallweb.txt
Small Comicもあるよ:
https://kagi.com/smallweb/?comic
https://github.com/kagisearch/smallweb/blob/main/smallcomic.txt
それからSmall YouTubeも:
https://github.com/kagisearch/smallweb/blob/main/smallyt.txt
似たような話だけど、俺も手動で選別した有効なRSSフィード付きの個人ブログ集を運営・拡張してるよ:https://minifeed.net/blogs
基準はシンプル。人間が書いていること(自分で確認できる限り)、英語であること(今のところ)、有効なRSSフィードがあること、そしてマイクロブログじゃないこと(リンク集やツイートみたいな短いメッセージだけじゃないってこと)。
KagiのSmall WebビューアーやStumbleUpon風のビューアーみたいに、ブログをランダムに表示したり[1]、全ブログからランダムに投稿を表示したりできる[2]。フィードと投稿はインデックス化されてるから、全ブログで全文検索が効くよ。可能でrobots.txtで許可されていれば、検索用にテキストをスクレイピングしてる。だから作者がRSSフィードでテキストを省略していても検索できるはずだ。
近いうちに「ソース元のランダムな投稿を1つ表示する」みたいな機能も実装するつもり。
追記:自分のブログも含めて、遠慮なく申請してね![3]
[1] https://minifeed.net/blogs/by/random
コンセプトは大好きなんだけど、AI臭がめちゃくちゃ強い記事に当たるたびに、自分の中の何かがちょっと死ぬんだよね。それって「スモールウェブ」の精神とは正反対な気がする。だって、その背後にいる「隣人」が見えなくなっちゃうからさ。
もしかしてStumbleUpon?
冗談はさておき、これ本当にいいし、中毒性があるのもよくわかる。ユーザー目線のプロダクトを作ったKagiチームに拍手だね。(ちなみに毎日Kagiを使ってるけど、このツールのことは知らなかったよ)
ここ数ヶ月Kagiを使ってるけど、正直ピンとこないな。「昔のGoogleみたい」っていう投稿がたくさんあったから課金してみたんだけど、俺の経験は全然違う。今のGoogleと同じで、探してるものを正確に入力しても、なんとなく関連してるだけのランダムなサイトが出てくる。
サイトのコメントをうろ覚えで入力して、Googleで検索すれば探してた記事に辿り着けた、2010年頃のあの感じを覚えてる。俺が求めてるのは、ああいう昔の、本当に役に立つ検索エンジンなんだよね。
最初に出てきたランダムなページがこれだったんだけど―― https://gaultier.github.io/blog/how_to_make_your_own_static_site_generator.html ――自作の静的サイトジェネレーターを作る話で、すごく気に入った。そのページを閉じたとき、もう一度見つけるのがどれだけ大変か気づかなかったよ。だってKagiにアクセスするたびに、当然違うページが出てくるからね(笑)
僕はKagiの検索/アシスタントのユーザーだし支持者だけど、この「Small Web」って名前は紛らわしくてイライラする。
僕にとってのスモールウェブっていうのは、何かを売りつけるためじゃなく、面白くするために作られた小さなウェブサイトのことなんだ。Neocitiesとか、「祭壇」系のサイト、単一目的のサイト、ファンダムのポータル、ウェブ実験とかさ。
残念ながら、Kagiの「Small Web」の定義は「ブログかウェブ漫画」でしかない。RSSフィードがあって、最近の投稿がないといけない。それだと面白いものがたくさん削ぎ落とされちゃうから、何がしたいのかよくわからないよ。
僕はObsidian RSSリーダー(https://github.com/amatya-aditya/obsidian-rss-dashboard )のコントリビューターの一人なんだけど、このプロジェクトへの最初の貢献の一つが、発見ページにKagiのRSSフィードを追加したことだったんだ!
5時間ごとに更新されて、Kagiに掲載された最新のブログを表示してくれるよ。チェックしてみて!
誤解しないでほしいんだけど、Kagiも彼らのやることも大体は大好きだよ。でもこれはちょっと皮肉だよね:
https://kagi.com/smallweb/?url=https://pliutau.com/reading-list/
このページは、毎晩実行されるGitHub Actionsのワークフローによって自動生成されています。お気に入りのブログから最新の5記事を取得しています。
Kagiは方向性を見失った。検索にお金を払ってるけど、もう諦めかけてる。同じクエリでもGoogle検索の方が関連性の高い結果が出ることに何度か気づいたんだ。しかも、向こうの方が検索AIも優れてる。
こういう気まぐれな寄り道をしてると、キラープロダクトがない初期のGoogleをやってるみたいに見えるよ。