HN255
【Show HN】埋め込みモデルでコードの重複を爆速検知!新しいCLIツールを公開しました
Show HN: CLI tool for detecting non-exact code duplication with embedding models
rkochanowski・約5時間前
Show HN: CLI tool for detecting non-exact code duplication with embedding models
コードベースの中に潜む「微妙に異なる」重複コードにうんざりしていませんか?埋め込み(Embedding)モデルを活用して、完全一致ではないコードの重複を効率的に検出できるCLIツールを開発しました。プロジェクトのメンテナンス性を高める強力な武器になるはずです。ぜひ試してみてください!
Slopoを作ったのは、他のツールやコーディングAIエージェント、人間が見つけるのが最も困難な「似たコード」を探すという特定の課題を解決するためなんだ。これは埋め込み(embeddings)を使って見た目が似ているコードを見つけ出すものだよ。単なるコピペや微修正されたクローン以上のものまで検出できる。ただ、似ているコードは必ずしもリファクタリング対象のクローンとは限らないというトレードオフもあるね。最初の結果は検証が必要だけど、コーディングエージェントならすぐにやってくれるはず。サンプルプロンプトは https://slopo.dev にあるから見てみて。さらに、コードベース内で離れた場所にある似たコードほど高くランク付けされるようにして、一見して分かりにくい重複にフォーカスできるようにしたよ。コードベースによって結果はかなり変わるね。時には検出された重複のほとんどが誤検知なこともあるけど、残りはリファクタリングの有力候補だったり、あるいはバグそのものだったりするんだ。思いがけず大量の本当の重複が見つかることもあるよ。
いいアイデアだね。特にコピペじゃなくて意味的に重複しているような場合、リファクタリングの前に使うと便利そう。