.env.sample 1.7 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344
  1. PORT=3001
  2. # 重要:在生产环境中必须更改以下设置
  3. # 数据库路径
  4. DATABASE_PATH=./data/metadata.db
  5. # 服务主机配置(生产环境请使用实际服务器地址)
  6. ELASTICSEARCH_HOST=http://127.0.0.1:9200 # 生产环境请更改
  7. TIKA_HOST=http://127.0.0.1:9998 # 生产环境请更改
  8. LIBREOFFICE_URL=http://127.0.0.1:8100 # 生产环境请更改
  9. JWT_SECRET=your-super-secure-jwt-secret-key-change-it-in-production
  10. # File Upload Configuration
  11. UPLOAD_FILE_PATH=./uploads
  12. MAX_FILE_SIZE=104857600
  13. TEMP_DIR=./temp
  14. # Vector Dimensions Configuration
  15. # 埋め込みモデルの出力次元数と一致させる必要があります
  16. # 一般的な値: 2560 (text-embedding-3-large), 1536 (text-embedding-3-small), 2048 (カスタム)
  17. DEFAULT_VECTOR_DIMENSIONS=2048
  18. # Chunk Size Limits Configuration
  19. # チャンクサイズの上限 (tokens) - 環境変数による制限(優先度最高)
  20. # 使用する埋め込みモデルに合わせて設定してください
  21. # OpenAI text-embedding-3-large: 8191
  22. # OpenAI text-embedding-3-small: 8191
  23. # Google Gemini embedding-001: 2048
  24. MAX_CHUNK_SIZE=8191
  25. # チャンク重なり(オーバーラップ)の上限 (tokens) - 環境変数による制限
  26. # チャンクサイズの 10-20% を推奨します
  27. MAX_OVERLAP_SIZE=200
  28. # Memory Management Configuration
  29. # メモリ使用量の上限 (MB)。この値を超えると待機や強制GCがトリガーされます
  30. MAX_MEMORY_USAGE_MB=1024
  31. # バッチ処理サイズ (チャンク数)
  32. CHUNK_BATCH_SIZE=100
  33. # 強制GCのしきい値 (MB)
  34. GC_THRESHOLD_MB=800
  35. # 前端設定
  36. # ALLOWED_HOSTS - API 接続を許可するホストリスト(カンマ区切り)
  37. # フロントエンドの .env ファイルで REACT_APP_ALLOWED_HOSTS として設定