llamacpp

Star

Here are 23 public repositories matching this topic...

mostlygeek / llama-swap

Star

Reliable model swapping for any local OpenAI/Anthropic compatible server - llama.cpp, vllm, etc

golang openai llama openai-api llamacpp vllm localllm localllama

Updated Jan 22, 2026
Go

kelindar / search

Sponsor

Star

Go library for embedded vector search and semantic embeddings using llama.cpp

search-engine ai gpu embeddings simd semantic-search bert vector-search llamacpp gguf

Updated Jun 28, 2025
Go

InftyAI / llmaz

Star

☸️ Easy, advanced inference platform for large language models on Kubernetes. 🌟 Star to support our work!

kubernetes inference huggingface llm modelscope llamacpp vllm text-generation-inference ollama sglang inference-platform

Updated Jan 26, 2026
Go

nekomeowww / ollama-operator

Sponsor

Star

🚢 Yet another operator for running large language models on Kubernetes with ease. Powered by Ollama! 🐫

kubernetes ai llama kubernetes-operators llm llamacpp ollama

Updated Jan 26, 2026
Go

thushan / olla

Sponsor

Star

High-performance lightweight proxy and load balancer for LLM infrastructure. Intelligent routing, automatic failover and unified model discovery across local and remote inference backends.

Updated Jan 16, 2026
Go

lordmathis / llamactl

Star

Unified management and routing for llama.cpp, MLX and vLLM models with web dashboard.

self-hosted mlx openai-api llm llamacpp llama-cpp vllm llm-inference localllm localllama llama-server llm-router mlx-lm

Updated Jan 27, 2026
Go

adrianliechti / wingman

Star

Inference Hub for AI at Scale

openai llama mistral claude rag groq openai-api azure-openai llm llamacpp function-calling ollama ai-gateway

Updated Jan 27, 2026
Go

intelligencedev / eternal

Star

Eternal is an experimental platform for machine learning models and workflows.

go ai ml inference-api htmx gpt-4 stable-diffusion llamacpp comfyui claude-ai gemini-pro

Updated Mar 9, 2025
Go

xyproto / ollamaclient

Sponsor

Star

Go package and example utilities for using Ollama / LLMs

go ai fortune summarize large-language-models llm llamacpp ollama ollama-client image-description-generator

Updated Sep 16, 2025
Go

napmany / llmsnap

Star

Fast LLM swapping with sleep/wake support, compatible with vllm, llama.cpp, etc. llama-swap fork.

golang openai openai-api llm llm-serving llamacpp vllm localllm ai-gateway localllama llmrouter

Updated Dec 23, 2025
Go

koron / c3tr-client

Star

A client for the C3TR Agent for Japanese-English and English-Japanese translation running on llama.cpp

client c3tr llamacpp

Updated Dec 15, 2025
Go

byebyebruce / ollama-chatbot

Star

Chat bot based on Ollama

chatbot llm llamacpp ollama gguf

Updated Apr 11, 2024
Go

lynxai-team / goinfer

Star

Local LLM proxy, DevOps friendly

inference inference-server inference-api openai-api llm openaiapi llamacpp llama-cpp local-llm localllm local-ai llm-proxy llama-api llama-server llm-router language-model-api local-lm local-llm-integration

Updated Jan 23, 2026
Go

A Model Context Protocol (MCP) server written in GO that provides text completion capabilities using local LLama.cpp models. This server exposes a single MCP tool that accepts text prompts and returns AI-generated completions using locally hosted language models.

go llamacpp mcp-server