Codestin Search App

Grulmex / UFund-Me-Qbot

AI-powered Quantitative Investment Research Platform.

machine-learning deep-learning bitcoin blockchain fintech quantitative-finance trademarks quantization funds strategies quantitative-trading pytrade qlib quant-trade trade-bot quant-trader

Updated Jan 9, 2026
HTML

MoHussein197 / dgx-spark-finetune-llm

Star

🔧 Fine-tune large language models efficiently on NVIDIA DGX Spark with LoRA adapters and optimized quantization for high performance.

deep-learning pytorch nvidia lora quantization fine-tuning blackwell llm nvfp4 dgx-spark transformer-engine mxfp8

Updated Jan 9, 2026
Python

Kuldeepmorya / LLM-TradeBot

Star

🤖 Optimize your futures trading with LLM-TradeBot, an intelligent multi-agent system leveraging adversarial strategies for high win rates and low drawdowns.

python nlp agent algorithm transformers stock exchange moe trading-platform llama lora futures quantization ctp peft llm qwen deepseek nof1ai

Updated Jan 9, 2026
HTML

mtmatheuus / QKV-Core

Star

🚀 Run modern 7B LLMs on legacy 4GB GPUs without crashes, breaking the VRAM barrier for developers facing GPU limitations.

python machine-learning cuda inference transformer attention numba quantization deep-tech llm gguf low-vram qkv

Updated Jan 9, 2026
Python

HenriqueMoreira-f / droid-factory-template

Star

🤖 Supercharge your AI development with a comprehensive template featuring 112 droids, custom commands, skills, and MCP integrations.

kotlin reverse-engineering virtualization transformers kotlin-android html-css quantization mobile-automation gemma android-automation mediaprojection rfb kotlin-flow rlhf instruction-tuning qwen

Updated Jan 9, 2026
Python

Xipower2 / awesome-local-ai

Star

🤖 Explore and utilize top open-source tools for running, fine-tuning, and building LLMs entirely locally, without cloud dependencies or API keys.

python ai mcp apps self-hosted quantization multi-modal dxt llm anthropic genai exllama local-ai llm-apps crewai rag-agents model-context-protocol ai-extensions

Updated Jan 9, 2026

Abdelrahmanhatem2020 / phisat2-trustworthy-onboard-ai

Star

space telemetry calibration esa satellites cubesat quantization earth-observation int8 onnx edge-ai onnxruntime quantization-efficient-network satellite-security onboard-ai phisat2

Updated Jan 9, 2026
Python

Christoferactinomycetal309 / LLaMA-Factory

Star

🛠 Build and customize LLaMA models easily with LLaMA-Factory, streamlining the training and deployment of large language models.

python nlp agent data-science ai hackathon tensorflow moe tensorboard lora quantization fine-tuning model-versioning amazon-ml-challenge llm vllm finetune-llm llama-factory

Updated Jan 9, 2026
Python

eliniyus310987 / Mini_ai

Star

🤖 Serve pre-trained AI models for real-time NLP tasks like sentiment analysis and entity recognition with a lightweight Flask API.

machine-learning lua augmented-reality chatbot tic-tac-toe face-recognition face-detection quantization javascript-games funds pytrade tic-tac-toe-game tictactoe-react face-ar openai-api wechat-ar gpt-4o-mini o3-mini

Updated Jan 9, 2026
Python

sivenz / hybrid-agent-framework

Star

🤖 Build AI agents that combine OpenAI's orchestration and Claude's execution for effective production solutions.

python nlp reinforcement-learning coinbase mcp quantization research-and-development autonomous-agents reranking rag vector-database ai-models hybrid-search llm deepsearch ai-memory agentic-ai-cli memory-agents

Updated Jan 9, 2026
Python

PDewangan / neo4j-agentframework

Star

📊 Transform documents into a smart knowledge base using Neo4j and Azure AI for efficient, intelligent searching and answer generation.

python docker machine-learning neo4j knowledge-graph graph-database cypher quantization semantic-search ai-agents bitnet rag github-container-registry hybrid-search azure-openai llm-inference enterprise-ai zero-build-time

Updated Jan 9, 2026
Python

m1ns09 / Llama

Star

🌐 Run GGUF models directly in your web browser using JavaScript and WebAssembly for a seamless and flexible AI experience.

python nlp data machine-learning openai gpt quantization agents fine-tuning multi-agents finetuning langchain instruction-tuning llama-cpp ggml llamaindex qlora deepseek

Updated Jan 9, 2026
HTML

Jaypatel2710 / whisp

Star

javascript python macos swift text-to-speech voice transformers transformer voice-recognition change speech-recognition obs quantization svc vits singing-voice-conversion openvino-intel tensorrt-llm

Updated Jan 9, 2026
Kotlin

cenZO00 / autopack

Star

🚀 Simplify running, sharing, and shipping Hugging Face models with autopack; it quantizes and exports to multiple formats effortlessly.

react java shell bash docker minecraft ios haskell spring-boot keycloak model sphinx cabal quantization autodiscover ant-design huggingface large-language-models

Updated Jan 9, 2026
Python

paswell-chiks / Optimizing-RAG-with-Hybrid-Search

Star

🔍 Optimize RAG systems by exploring Lexical, Semantic, and Hybrid Search methods for better context retrieval and improved LLM responses.

docker information-retrieval retrieval celery quantization observability bm25 lama rag fastapi huggingface hybrid-search qdrant-vector-database semantic-cache chromadb retrieval-augmented-generation reciprocal-rank-fusion sementic-search

Updated Jan 9, 2026
Jupyter Notebook

kgeon1002 / quant-fund

Star

Open-source quant finance foundation unites trading tools and protocols, funds community projects, and boosts cross-project interoperability for collaboration 🐙

machine-learning ethereum blockchain solidity quantization social-impact governance erc20 stock-trading fundamental-analysis model-deployment options-trading erc20-tokens linear-quantization train-test hugging-face generative-ai downcasting

Updated Jan 9, 2026

ambv231 / tinyllama-coreml-ios18-quantization

Star

Quantize TinyLlama-1.1B-Chat from PyTorch to CoreML (float16, int8, int4) for efficient on-device inference on iOS 18+.

nlp mobile ai transformers pytorch llama quantization int8 coreml on-device huggingface apple-silicon int4 llm tinyllama ios18 mlpackage

Updated Jan 9, 2026
Python

Wrapture lets you go from a Python-trained model to deployable JavaScript with a single command. It generates TypeScript bindings and a Web/Node-compatible wrapper, using WebGPU/WASM-ready ONNX runtimes.

javascript ruby rubygems machine-learning typescript model pytorch quantization webgpu simplifier onnx model-conversion wrapture

Updated Jan 9, 2026
TypeScript

Picovoice / picollm

Star

On-device LLM Inference Powered by X-Bit Quantization

natural-language-processing compression self-hosted llama language-models quantization language-model gemma mistral model-compression efficient-inference llm llms generative-ai large-language-model llm-inference llama2 mixtral llama3

Updated Jan 9, 2026
Python

vllm-project / llm-compressor

Sponsor

Star

Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM

sparsity compression quantization

Updated Jan 9, 2026
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

quantization

Here are 1,036 public repositories matching this topic...

Grulmex / UFund-Me-Qbot

MoHussein197 / dgx-spark-finetune-llm

Kuldeepmorya / LLM-TradeBot

mtmatheuus / QKV-Core

HenriqueMoreira-f / droid-factory-template

Xipower2 / awesome-local-ai

Abdelrahmanhatem2020 / phisat2-trustworthy-onboard-ai

Christoferactinomycetal309 / LLaMA-Factory

eliniyus310987 / Mini_ai

sivenz / hybrid-agent-framework

PDewangan / neo4j-agentframework

m1ns09 / Llama

Jaypatel2710 / whisp

cenZO00 / autopack

paswell-chiks / Optimizing-RAG-with-Hybrid-Search

kgeon1002 / quant-fund

ambv231 / tinyllama-coreml-ios18-quantization

robertocenteno / wrapture

Picovoice / picollm

vllm-project / llm-compressor

Improve this page

Add this topic to your repo