FastAPI-BitNet

FastAPI-BitNetは、llama.cppベースのBitNetモデルインスタンスを管理するための堅牢なREST APIを提供します。このプロジェクトは、開発者や研究者が自動テスト、ベンチマーク、インタラクティブチャットセッションをプログラム的に制御できるように設計されています。セッション管理、バッチ操作、モデルベンチマーキングなどの機能を備えています。

GitHub Website Docs

GitHubスター

ユーザー評価

未評価

お気に入り

閲覧数

162

フォーク

イシュー

インストール方法

難易度

中級

推定所要時間

10-20 分

必要な環境

Docker Desktop: Latest version

Conda: Latest version (or another Python environment manager)

+1 more

インストール方法

前提条件

Docker Desktop: 最新版

Conda: 最新版（または他のPython環境マネージャ）

Python: 3.10以上

インストール手順

1. Python環境のセットアップ

Conda環境を作成し、アクティブ化します:

bash
conda create -n bitnet python=3.11
conda activate bitnet

Huggingface-CLIツールをインストールしてモデルをダウンロードします:


pip install -U "huggingface_hub[cli]"

Microsoftの公式BitNetモデルをダウンロードします:


huggingface-cli download microsoft/BitNet-b1.58-2B-4T-gguf --local-dir app/models/BitNet-b1.58-2B-4T

2. アプリケーションの実行

#### Dockerを使用する（推奨）

1Dockerイメージをビルドします:

bash
docker build -t fastapi_bitnet .

2Dockerコンテナを実行します:

bash
docker run -d --name ai_container -p 8080:8080 fastapi_bitnet

#### ローカル開発 Uvicornを使用してアプリケーションを直接実行できます:

bash
uvicorn app.main:app --host 0.0.0.0 --port 8080 --reload

設定方法

基本設定

FastAPI-BitNet設定

特に設定ファイルは必要ありませんが、環境変数を設定することが推奨されます。必要に応じて以下の環境変数を設定してください:

bash
export API_KEY="your-api-key"
export DEBUG="true"

詳細設定

セキュリティ設定

APIキーは環境変数または安全な設定ファイルに保存

ファイルアクセス権限の適切な設定

ログレベルの調整

パフォーマンス調整

タイムアウト値の設定

同時実行数の制限

キャッシュ設定

設定例

基本的な設定

json
{
  "mcpServers": {
    "bitnet-mcp": {
      "command": "python",
      "args": ["-m", "app.main"],
      "env": {
        "API_KEY": "your-api-key"
      }
    }
  }
}

使用例

基本的な使用方法

APIを使用したインタラクティブチャット

python
import requests

def send_prompt(prompt):
    response = requests.post(
        'http://localhost:8080/chat',
        json={"prompt": prompt}
    )
    return response.json()

result = send_prompt("こんにちは、あなたの名前は？")
print(result)

バッチ操作の実行

python
import requests

prompts = ["こんにちは", "元気ですか？"]
response = requests.post(
    'http://localhost:8080/batch',
    json={"prompts": prompts}
)
print(response.json())

使用ケース

研究者が複数のBitNetモデルインスタンスを同時にテストし、パフォーマンスを比較する。

開発者がインタラクティブなチャットボットを構築し、ユーザーからの入力に応じて応答を生成する。

システム管理者がリソース使用量を監視し、サーバーの最適な設定を見つける。

データサイエンティストがモデルのパフォーマンスをベンチマークし、改善点を特定する。

追加リソース

GitHubリポジトリ公式ドキュメント公式ウェブサイト

作者情報

Full stack developer

GitHub

フォロワー

リポジトリ

Gist

貢献数

タグ

1-bit benchmarking bitnet docker fastapi inference llm model-context-protocol multi-chat perplexity python server-orchestration uvicorn

関連するMCP

utcp-mcp

128

UTCP-MCP Bridgeは、ユニバーサルツール呼び出しプロトコル（UTCP）をMCPエコシステムに統合する全機能を持つMCPサーバーです。このプロジェクトにより、UTCPクライアントを直接使用したり、UTCPをプロキシとして利用してMCP互換ツールを即座に公開したりできます。ユーザーフレンドリーなWebインターフェースを通じて、ツールやマニュアルの管理が簡単に行えます。

Python

magg

Maggは、MCP（Machine Control Protocol）を集約するためのPythonライブラリです。データの収集と管理を効率化し、さまざまなMCPに対応する機能を提供します。使いやすいAPIを通じて、ユーザーは簡単にMCPデータを操作できます。

Python

AGENTIX

AGENTIXは、Pythonを使用した自動化ツールで、ユーザーが特定のタスクを効率的に実行できるように設計されています。直感的なインターフェースと強力な機能により、プログラミングの知識が少ないユーザーでも簡単に利用できます。タスクの自動化、データ処理、APIとの連携など、多岐にわたる機能を提供します。

Python