Thanks to visit codestin.com
Credit goes to Github.com

Skip to content

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。

License

Notifications You must be signed in to change notification settings

yeahhe365/gemini-nexus

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Gemini Nexus Logo

Gemini Nexus

🚀 赋予浏览器原生 AI 灵魂:深度集成 Google Gemini 的全能助手

Gemini Chrome Extension Vite

TypeScript JavaScript License


🌟 项目简介

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。


⚙️ 多驱动核心对比 (services/providers)

项目内置了三种驱动方案,通过代码逻辑动态适配不同的使用场景:

驱动方案 逻辑入口 支持模型 核心优势 使用前提
Web Client web.js Gemini 3 系列 完全免费,支持联网插件 需保持 Google 账号登录
Official API official.js Pro/Flash 预览版 极速响应,原生支持 Thinking 模式 需 Google AI Studio Key
OpenAI Compatible openai_compatible.js GPT/Claude 等 高扩展性,支持中转接口 需第三方服务密钥

🤖 浏览器控制 (MCP) 能力集

基于 background/control/ 模块实现,AI 可以执行复杂的 Agent 任务:

分类 核心指令 代码实现逻辑
导航控制 navigate_page, new_page 调用 chrome.tabs 进行页面生命周期管理
页面交互 click, fill, drag 基于 Accessibility Tree 生成 UID 进行精准操控
数据观测 take_snapshot, get_logs 实时提取 DOM 结构、控制台日志及网络请求
脚本执行 evaluate_script 在网页 Context 中运行自定义 JavaScript

以下是为您翻译的中文内容:

外部 MCP 工具(远程服务器)

Gemini Nexus 可以选择连接到外部 MCP 服务器(通过 SSE可流式传输的 HTTPWebSocket),并在现有的工具循环(Tool Loop)中执行其工具。

推荐方案:使用本地代理(支持 stdio 服务器)

由于 Chrome 扩展程序无法直接运行基于 stdio 的 MCP 服务器,推荐的设置方案是运行一个本地代理(例如 MCP SuperAssistant Proxy)。在代理中配置您的 MCP 服务器(包括 stdio 服务器),然后将 Gemini Nexus 连接到该代理端点。

常见的代理端点如下:

  • SSE: http://127.0.0.1:3006/sse
  • 可流式传输的 HTTP: http://127.0.0.1:3006/mcp
  • WebSocket: ws://127.0.0.1:3006/mcp

设置步骤

  1. 启动您的 MCP 代理并在其中配置好 MCP 服务器。

  2. 设置 (Settings) → 连接 (Connection) → 外部 MCP 工具 (External MCP Tools) 中:

    • 启用“外部 MCP 工具” (Enable External MCP Tools)。
    • 选择一个活动服务器 (Active Server)(您可以保存多个服务器条目并根据需要切换)。
    • 选择传输协议并设置服务器 URL(SSE / 可流式传输的 HTTP / WebSocket)。
    • 点击测试连接 (Test Connection) 和刷新工具 (Refresh Tools)。
  3. 可选(当工具较多时推荐):将公开工具 (Expose Tools) 设置为仅限选定工具 (Selected tools only),然后仅启用您希望模型查看/使用的工具。

  4. 开始正常对话;当模型需要使用工具时,它会输出一个如下所示的 JSON 工具块:

    { "tool": "工具名称", "args": { "键": "" } }

✨ 核心功能亮点

  • 💬 智能侧边栏:基于 sidePanel API,提供毫秒级唤起的对话空间,支持全文搜索历史记录。
  • 🪄 划词工具栏:注入 Content Script,选中文字即刻进行翻译、总结、重写,支持一键回填表单。
  • 🖼️ 图像 AI 处理
    • OCR & 截图翻译:集成 Canvas 裁剪技术,框选图片区域即刻提取文字并翻译。
    • 浮窗探测:自动识别网页图片并生成悬浮 AI 分析按钮。
    • 水印消除:内置 watermark_remover.js 算法,显著提升生成图像的可视化质量。
  • 🛡️ 安全渲染:所有 Markdown、LaTeX 公式及代码块均在 sandbox 隔离环境中渲染,确保主页面安全。

❤️ 赞助与支持

如果您觉得 Gemini Nexus 提升了您的工作效率,欢迎请开发者喝杯咖啡,支持项目的持续维护!☕

赞赏通道(爱发电): https://afdian.com/a/gemini-nexus

afdian-yeahhe

扫描上方二维码或 点击此处 前往爱发电支持我


🚀 快速开始

安装步骤

  1. Releases 下载最新 ZIP 包并解压。
  2. Chrome 访问 chrome://extensions/,右上角开启 “开发者模式”
  3. 点击 “加载已解压的扩展程序”,选择解压后的文件夹即可。

技术栈

  • 构建工具:Vite + TypeScript
  • 架构协议:Chrome MV3 + Browser Control Protocol
  • 核心库:Marked.js, KaTeX, Highlight.js

📄 许可证

本项目基于 MIT License 开源。

About

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件,而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP),将 AI 的触角伸向网页浏览的每一个交互细节。

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages