Text-to-CAD AI Model

A state-of-the-art AI model that converts natural language descriptions into parametric CAD files using a multi-modal transformer architecture with geometric validation and visual feedback.

🏗️ Architecture Overview

This project implements a multi-modal transformer architecture that:

Processes text descriptions using BERT-based encoders
Generates parametric CAD sequences with geometric validation
Incorporates visual feedback through CLIP-based scoring
Validates geometric constraints and manufacturing requirements

🔑 Key Components

1. Data Pipeline (`src/data/`)

DeepCAD dataset processing and cleaning
Multi-modal annotation generation
Geometric hash-based deduplication
8-bit quantized parameter representation

2. Model Architecture (`src/models/`)

Adaptive text encoder with BERT backbone
24-layer transformer decoder for CAD sequences
Visual feedback module with CLIP integration
Geometric validation system

3. Training Pipeline (`src/training/`)

Sequential pre-training on CAD sequences
Visual feedback fine-tuning with PPO
Multi-stage training orchestration
Gradient clipping and learning rate scheduling

4. Validation System (`src/validation/`)

KCL code generation and execution
Feature-by-feature geometric validation
Manufacturing constraint checking
Chamfer distance computation

5. Deployment (`src/deployment/`)

FastAPI server with async processing
Multiple export formats (STEP, GLTF, KCL)
Batch processing capabilities
Quantization for production deployment

📦 Installation

# Clone the repository
git clone https://github.com/omira/text-to-cad.git
cd text-to-cad

# Create virtual environment
python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

# Install dependencies
pip install -r requirements.txt

# Install additional CAD tools 
# macOS:
brew install opencascade
brew install freecad

# Ubuntu:
sudo apt-get install libopencascade-dev
sudo apt-get install freecad

🚀 Quick Start

from src.models.text_to_cad import TextToCADModel
from src.inference.pipeline import load_model_from_checkpoint, InferencePipeline

# Load pre-trained model or create a new one
try:
    model = load_model_from_checkpoint("checkpoints/final_model.pt")
except FileNotFoundError:
    model = TextToCADModel(vocab_size=10000)

pipeline = InferencePipeline(model)

# Generate CAD from text
cad_sequence = pipeline.generate("Create a rectangular bracket with mounting holes")
kcl_code = pipeline.export_kcl(cad_sequence)
print(kcl_code)

# Export to STEP format
step_file = pipeline.export_step(cad_sequence, "output.step")
print(f"STEP file saved to: {step_file}")

🏋️ Training

Dataset Preparation

# Create dataset directories
mkdir -p data/{raw,processed,annotations}

# Download and process DeepCAD dataset
python scripts/prepare_dataset.py --download --process --annotate

# Process dataset only
python scripts/prepare_dataset.py --process --input-dir data/raw --output-dir data/processed

# Generate annotations
python scripts/prepare_dataset.py --annotate --output-dir data/processed --annotation-dir data/annotations

Model Training

# Train small model for prototyping
python scripts/train.py --config configs/small_config.yaml --output-dir checkpoints/small

# Train base model
python scripts/train.py --config configs/base_config.yaml --output-dir checkpoints/base

# Train large model 
python scripts/train.py --config configs/large_config.yaml --output-dir checkpoints/large

# Fine-tune with visual feedback
python scripts/train.py --config configs/base_config.yaml --checkpoint checkpoints/base/final_model.pt --finetune

📊 Evaluation

# Run evaluation suite
python scripts/evaluate.py --model checkpoints/final_model.pt --output-dir outputs/evaluation --visualize

# Generate validation report
python scripts/evaluate.py --model checkpoints/final_model.pt --test-set data/processed/test.json --output-dir outputs/validation

🖥️ Deployment

# Start the API server
python src/deployment/server.py --model checkpoints/final_model.pt --config configs/base_config.yaml --port 8000

# Generate example CAD from text with curl
curl -X POST "http://localhost:8000/generate" \
     -H "Content-Type: application/json" \
     -d '{"text": "Create a rectangular bracket with two mounting holes", "format": "step"}'

🔧 VS Code Tasks

This project includes pre-configured VS Code tasks for common operations:

Install Dependencies: Install required Python packages
Train Model (Small): Train a small model for quick iteration
Train Model (Base): Train the standard model
Fine-tune with Visual Feedback: Fine-tune model with CLIP-based visual feedback
Run Evaluation: Evaluate model performance
Run API Server: Start the model serving API
Process DeepCAD Dataset: Process the raw dataset
Generate Example CAD: Run a quick CAD generation example
Run Tests: Run test suite

📋 Technical Specifications

Model Architecture: Multi-modal transformer (BERT encoder + 24-layer decoder)
Model Size: 350M parameters
Sequence Length: Up to 512 CAD operations (768 for large model)
Precision: 8-bit quantization with 12-bit for critical dimensions
Training Data: DeepCAD dataset with geometric hash deduplication
Training Stages: Pre-training + PPO fine-tuning with visual feedback
Performance Metrics:
- Chamfer Distance: <0.87mm
- CLIP Score: >0.82
- Inference Speed: <2s for 50-operation sequences on NVIDIA A100
- Manufacturing Validity Rate: >95%

📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

Accuracy: 0.87mm Chamfer Distance, 0.82 CLIP Score

Project Structure

├── src/
│   ├── data/           # Data processing and loading
│   ├── models/         # Model architectures
│   ├── training/       # Training loops and optimization
│   ├── validation/     # Geometric validation
│   ├── inference/      # Inference pipeline
│   └── deployment/     # Deployment utilities
├── configs/            # Training and model configurations
├── scripts/            # Training and evaluation scripts
├── data/              # Dataset storage
├── checkpoints/       # Model checkpoints
├── outputs/           # Generated outputs and logs
└── tests/             # Unit and integration tests

Contributing

Fork the repository
Create a feature branch
Make your changes
Run tests: pytest tests/
Submit a pull request

License

MIT License - see LICENSE file for details.

Citation

@article{omira2025textcad,
  title={Text-to-CAD: A State-of-the-Art Model for Converting Natural Language to Parametric CAD},
  author={OMIRA Technologies},
  journal={arXiv preprint arXiv:2025.xxxxx},
  year={2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.github		.github
.vscode		.vscode
configs		configs
data		data
outputs/logs		outputs/logs
scripts		scripts
src		src
tests		tests
.gitignore		.gitignore
Miniconda3-latest-Windows-x86_64.exe		Miniconda3-latest-Windows-x86_64.exe
README.md		README.md
REFACTORING_REPORT.md		REFACTORING_REPORT.md
requirements.txt		requirements.txt
requirements_data_collection.txt		requirements_data_collection.txt
test_modular_system.py		test_modular_system.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Text-to-CAD AI Model

🏗️ Architecture Overview

🔑 Key Components

1. Data Pipeline (`src/data/`)

2. Model Architecture (`src/models/`)

3. Training Pipeline (`src/training/`)

4. Validation System (`src/validation/`)

5. Deployment (`src/deployment/`)

📦 Installation

🚀 Quick Start

🏋️ Training

Dataset Preparation

Model Training

📊 Evaluation

🖥️ Deployment

🔧 VS Code Tasks

📋 Technical Specifications

📄 License

Project Structure

Contributing

License

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

Abdul-Omira/cad-fusion-lab

Folders and files

Latest commit

History

Repository files navigation

Text-to-CAD AI Model

🏗️ Architecture Overview

🔑 Key Components

1. Data Pipeline (src/data/)

2. Model Architecture (src/models/)

3. Training Pipeline (src/training/)

4. Validation System (src/validation/)

5. Deployment (src/deployment/)

📦 Installation

🚀 Quick Start

🏋️ Training

Dataset Preparation

Model Training

📊 Evaluation

🖥️ Deployment

🔧 VS Code Tasks

📋 Technical Specifications

📄 License

Project Structure

Contributing

License

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

1. Data Pipeline (`src/data/`)

2. Model Architecture (`src/models/`)

3. Training Pipeline (`src/training/`)

4. Validation System (`src/validation/`)

5. Deployment (`src/deployment/`)

Packages