HN🔥 68
💬 45

【Launch HN】APIなしのWindowsアプリをAIで自動化!スケーラブルなRPA構築ツール「Minicor」が登場

fchishtie
1日前

ディスカッション (11件)

0
fchishtieOP👍 68
1日前

皆さんこんにちは、FaizとSaheedです。私たちは、APIが存在しないデスクトップシステムとの連携に苦労しているAI企業のために、スケーラブルなデスクトップRPAを爆速で構築できるツール「Minicor」を開発しました。デモ動画はこちら:https://www.youtube.com/watch?v=MD0GHZIJ1cw

開発のきっかけは、以前担当していたRPA以外のインテグレーション案件でした。ある顧客から「とあるクリニックのWindowsベースの電子カルテシステムと連携できれば、2日後に契約する」という提示を受けたのが始まりです。当時知る由もありませんでしたが、デスクトップRPAの大規模運用は極めて困難です。スクリプト作成の複雑さ(システムの習熟、UI変更への対応)、オーケストレーションの難しさ(VMの稼働状態、キューイング、並列化)、そしてデバッグの難航(可観測性の欠如、誤検知、連鎖的なエラー)が立ちはだかります。RPAの失敗率は30%を超えることも珍しくなく、大規模運用では月間で数千件ものサポートチケットが発生するケースさえ見てきました。

これらの問題を解決するために、私たちはClaude CodeやCodexがPythonを使って仮想マシン(VM)上のデスクトップソフトを操作し、RPAワークフローを生成できるMCP(Model Context Protocol)を構築しました。RPAワークフローはPythonスクリプトとして実行されるため、高速かつ低コストで決定論的な動作が可能です。これらのワークフローはAPI経由でトリガーでき、任意の入出力スキーマに対応。実行ごとの動画リプレイやログも保存されます。MCPはRPAのデバッグやコードの修正まで自動化でき、変更はすべてバージョン管理されます。さらに、VMのクローン作成によるRPAの並列実行や、2FA/OTP認証の突破ツールも備えています。ワークフローがコードベースである利点を活かし、Slack通知やHuman-in-the-loop(人間による承認ステップ)、スクリーンショットを解析してVMの状態をLLMに確認させるフローも容易に組み込めます。

皆さんのフィードバックをお待ちしています。また、皆さんが経験した「RPAの恐怖体験談」もぜひ聞かせてください!

1
mingabunga
1日前

これってソフトウェアの新しいリリースでバグがないかテストするのに使える?GUI操作版のTDDみたいな感じで。

2
polonbike
1日前

ローンチおめでとう。一つだけ苦言を。RPAだの何だの言ってるけど、それがどういう意味なのかの説明がどこにもないよ。ランディングページで最初に出てきた時に、略さず正式名称を一度書いておいたほうがいい。

3
theaniketmaurya
1日前

ローンチおめでとう!レガシーシステムを使ってる層って、AIの導入が一番遅いイメージがあるんだけど、そこはどう攻略していくつもり?

4
dragonsenseiguy
1日前

ウェブサイトへの細かいツッコミ。「In production with」セクションの企業ロゴ、もう少し濃い色にしたほうがいいんじゃない?何があるのかほとんど見えなかったよ。

5
a-dub
1日前

ちょっと気になるんだけど、こういう確率的な自動化システムでの定常偏差(steady state error rate)って、アプデで壊れやすい決定論的なブリッジと比べてどうなの?監視(observability)はどうなってる?(推測だけど、実行ログとして各トランザクションのスクリーンショットが保存されるなら、かなり大きな改善になるはず。)

6
throw03172019
1日前

これってエラーを検知した時だけLLM Visionに切り戻す仕組みなのかな?つまり、RPAやワークフローを一回組んじゃえば、エラー状態になるまでは効率的に何度も動かせるってこと?

7
throw03172019
約24時間前

一番の懸念は、どれくらい自社のインフラで保存・処理できるか、あと独自のライフサイクルルールを適用できるかという点。例えばPHI(保護対象保健情報)を扱う可能性も高いわけで、スクリーンショットや動画、JSONの入出力データなんかはどう管理されるの?

8
oveja
約22時間前

私と同じように混乱してる人へ。RPAっていうのはRobotic Process Automationの略だよ。

9
nthdesign
約22時間前

MinicorとConveyを比較できる?かなり似てる気がするんだけど。以前Conveyの製品デモを見た時、画面共有と音声指示だけでレガシーソフトを使えるようにエージェントを学習させる様子を見せてもらったんだよね。

10
absk82
約19時間前

根本的な仕組みは「computer use」のようなものとは違うの?詳細な技術仕様が載ってる場所ってどこかある?