ディスカッション (11件)
本日、PDF、DOCX、XLSXビューアをはじめ、バウンディングボックスによる引用、ファイルアップロード、電子署名など、14種類のコンポーネントと実装例をオープンソースとして公開しました。MITライセンスで提供されており、自由にカスタマイズ可能です。
デモ動画はこちら:https://share.extend.ai/kRmSGKRF
開発当初、私たちは市場に出回っているあらゆるファイルビューアやドキュメントコンポーネントライブラリを試しましたが、求めている機能と品質を完璧に満たすものは見つかりませんでした。結局、私たちが運営する https://extend.ai/ のために自社でゼロから構築することにしたのです。もともとは社内専用のツールでしたが、顧客からの要望が非常に多かったため、今回オープンソース化することに決めました。
ドキュメント処理エージェントや、リアルタイムの文書取り込みフロー、その他あらゆる社内ツールの開発に最適です。
「PDFやXLSXのビューアなんて、もう誰かが解決している問題だろう」と甘く考えていましたが、実際に大規模環境で動作させるのは全く一筋縄ではいきませんでした。私たちは現在もExtendの運用でこのライブラリを実際に使用・保守しており、1日あたり数百万ページの処理を行う中で発生した数々のエッジケースを解決済みです。私たちのリソースとコミュニティの力が合わさることで、今後さらに素晴らしいものに成長していくことを期待しています。
これらはWebコンポーネントで作るべきだよね。React以外のフレームワークを完全に排除するのは、Web全体にとって本当によくないことだよ。
これすごくいいね!xlsxのエディターとビューアーがどうやって実装されているのか気になる。どういうヘッドレススプレッドシートを使ってるんだろ?実装はかなり大変だったんじゃないかな。
バウンディングボックスのデモ、なかなかいい感じだね。偶然にもここ2日間、pdfjsでいろいろプロトタイプを作ってたところなんだ。ページのズームや解像度の違いに対応するための、バウンディングボックスの扱い方に頭を悩ませていてさ。このコンポーネントがページを仮想化(スクロールに合わせてDOM要素を再利用するような仕組み)しているのかどうか、説明が見当たらないな。明日これを調べることになりそうだ…。
Reactコンポーネントだってことが、どこにも書かれていないのはどうして?
ありがとう、これ最高だね!アプリにDOCXとXLSXのプレビュー機能を追加しようとしてたんだけど、いいレンダリングライブラリがないせいで、多くのアプリがそうしているようにサーバーサイドでPDFに変換する方法を検討してたんだ。まさに探していたものだよ!:)
超クールだね。今、ドキュメントのワークフロー自動化に特化したローカルAIツール(コンテキストが画面・Web・フォルダ・ファイル)を開発中で、これはすごく役立ちそう。PDFやDOCXなどのパース処理のほとんどはRustでネイティブに行ってるけど、WordやPowerPointを立ち上げずに中身を確認できる方法があるのは大きな前進だよ。公開してくれてありがとう。
Markdownファイルには対応しているのかな?それとも今後対応予定?
見た目はクリーンで動作も問題ないけど、最適化が必要だね。「schema builder」のデモで「Type」をクリックすると、MacBook Pro M4でもポップオーバーが開くまでに1〜2秒かかる。重いコンポーネントが多いせいだと思うけど、それにしても遅すぎるよ。
クールなプロジェクトだね!Excelビューアーを触ってみたんだけど、ドキュメントには「シートやセル範囲を横断して検索」とあるのに、検索機能がうまく動作しないみたいだ。ブラウザの検索バーでもセルの中身が見つからないんだよね。これは既知の不具合かな?