FastAPI-BitNet

FastAPI-BitNet provides a robust REST API for managing and interacting with `llama.cpp`-based BitNet model instances. Designed for developers and researchers, it allows programmatic control of automated testing, benchmarking, and interactive chat sessions. Key features include session management, batch operations, and model benchmarking.

GitHub Stars

34

User Rating

Not Rated

Favorites

0

Views

28

Forks

8

Issues

0

Technical Information

Programming Languages

PythonPrimary Language

System Requirements

Docker Desktop: Latest version
Conda: Latest version (or another Python environment manager)
Python: 3.10+

Provided Features

セッション管理: 複数の`llama-cli`および`llama-server`セッションを開始、停止、状態確認
バッチ操作: 一度のAPI呼び出しで複数のインスタンスを初期化、シャットダウン、チャット
インタラクティブチャット: 実行中のBitNetセッションにプロンプトを送信し、クリーンなモデル応答を受信
モデルベンチマーキング: GGUFモデルのベンチマークをプログラム的に実行し、パープレキシティを計算
リソース推定: 利用可能なシステムRAMとCPUスレッドに基づいて最大サーバー容量を推定
VS Code統合: Model Context Protocolを介してGitHub Copilot Chatに直接接続
自動APIドキュメント: Swagger UIおよびReDocによるインタラクティブなAPIドキュメント

Safety Analysis

Safety Score
Safe100/100

Recommended For

Recommended for developers and researchers interested in AI/LLM, particularly those involved in developing applications using FastAPI and Docker.

Maintenance Status

Active

GitHub Topics

1-bitbenchmarkingbitnetdockerfastapiinferencellmmodel-context-protocolmulti-chatperplexitypythonserver-orchestrationuvicorn