概要
imprai では、ナレッジベース機能を提供し、エージェントがユーザーのプライベートデータと対話できるようにします。ユーザーはナレッジに個人データを保存および管理できます。
多くのデータソースがサポートされています。これにはローカルファイル、Notion、Github、Discord などが含まれます。
ナレッジの仕組み
ドキュメント
各ナレッジには複数のドキュメントが含まれており、各ドキュメントはナレッジ内で一意のドキュメント ID によって識別されます。
チャンク
ドキュメントは多くのチャンクに分割され、各チャンクはドキュメント内で一意のチャンク ID によって識別されます。チャンクは LLM 埋め込みサービスに送信され、埋め込みベクトルが取得されます。 ナレッジを作成する際に、ユーザーはチャンクサイズを指定できます。これにより、ドキュメントがいくつのチャンクに分割されるかが決まります。通常、チャンクサイズは数百から数千トークンの範囲です。
最終更新