外国語会話練習アプリ（仮称）

AI キャラクターとの音声会話を通じて外国語を学習できるアプリケーションです。Next.js ベースのフロントエンドから Go 製バックエンド、Python 製 AI サービスまでをモノレポで管理しており、gRPC ストリーミングを介してリアルタイムな会話体験を提供します。

主な機能

OS のマイクを用いた AI とのリアルタイム音声会話
会話相手となる 3 種類のキャラクター選択機能
Web Speech API を利用した音声認識と、AI 応答の音声合成
会話履歴の表示

キャラクター一覧

キャラクター	性別・年代	特徴	ベトナム語音声	日本語音声
Friend	男性 / 20 代	カジュアルで親しみやすい友達キャラ	vi-VN-Standard-B	ja-JP-Standard-C
Parent	女性 / 40 代	温かく経験豊富な母親キャラ	vi-VN-Standard-A	ja-JP-Standard-A
Sister	女性 / 20 代前半	親しげで少しいたずらっぽい妹キャラ	vi-VN-Standard-A	ja-JP-Standard-A

対応言語

ベトナム語（vi）
日本語（ja）
英語（en）

画面構成

/ 認証画面（暫定的に遷移のみ実装予定）
/talk 会話画面（ChatGPT の音声会話体験に近い UI を想定）

アーキテクチャ概要

Next.js (Web Speech API / AudioWorklet)
          │
          ▼ WebSocket (Binary Audio / Text Control)
          │
       Go API (Gin, Gorilla WebSocket) ─── Auth Bypass for WS
          │
          ▼ gRPC Bidirectional Streaming (StreamChat)
          │
    Python AI サービス (gRPC Server)
          │
          ├── Premium Mode: Gemini Live API (Full Duplex Streaming via WebSocket)
          └── Light Mode: Gemini Flash (Buffered Input -> REST API)

フロントエンドは WebSocket を経由して Go のバックエンドへ接続し、オーディオチャンクをリアルタイム送信
Go バックエンドは Proxy として機能し、gRPC 双方向ストリームで Python サービスへデータを転送
Premium Mode: Gemini Live API を使用し、真のリアルタイム・双方向ストリーミング会話を実現（低遅延）
Light Mode: 従来のバッファリング方式。発話終了（VAD 検知）までを蓄積し、Gemini Flash で一括処理する軽量モード

状態管理

TanStack Query: サーバー状態の管理、キャッシング、エラーハンドリングを担当
- AI 会話の API 通信を mutation で管理
- 自動的なエラーハンドリングとリトライ機能
- ローディング状態の一元管理

技術スタック

フロントエンド

Next.js 15.2.4（App Router）
TypeScript
TanStack Query（サーバー状態管理）
Connect-Web（gRPC-Web クライアント）
Web Speech API / AudioWorklet（音声処理）

バックエンド

Go 1.24.1
Connect-Go（gRPC 互換サーバー）
Gin（HTTP フレームワーク）

AI サービス

Python 3.11
Google Gemini Live API（リアルタイム音声対話）
Google Gemini Flash（テキスト生成）
gTTS（音声合成・Light Mode 用）
gRPC（サービス間通信）

インフラ / ツール

Docker & Docker Compose
Protocol Buffers
Buf（v2 系）

ディレクトリ構成

.
├── go/             # Go バックエンド
│   └── gen/        # proto から自動生成された Go コード
├── next/           # Next.js フロントエンド
│   └── src/
│       └── gen/    # proto から自動生成された TypeScript コード
├── python/         # AI サービス
└── proto/          # Protocol Buffers 定義と Buf 設定
    ├── app/        # アプリケーション用 proto 定義
    ├── buf.gen.yaml
    ├── buf.yaml
    └── Makefile

開発環境

必要な環境変数

# Google Cloud 認証
GOOGLE_APPLICATION_CREDENTIALS=/path/to/service-account-key.json

# Gemini API
GOOGLE_GEMINI_API_KEY=your_gemini_api_key

主要コマンド

# Proto のコード生成
cd proto
make generate

# フロントエンド開発
cd next
pnpm dev

# Go バックエンド開発
cd go
make run

# すべてのサービスを起動
docker compose up --build -d

補足

初期実装ではデータベースを使用せず、会話体験の構築を優先します。
各キャラクターは異なるプロンプトと音声設定を持ち、状況に応じて音声 API を切り替える設計です。
詳細なアプリ仕様は docs/application/app.md を参照してください。

task memo

frontend(next)

チャットインターフェイス

backend(go)

DB のマイグレーション
クリーンアーキテクチャベース
gin to gRPC-connect wrapper
error handling
logging

ai service(python)

free プラン

mobile app(mobile)

スプラッシュ画面表示

infra

terraform 設定

common（共通設定）

認証
課金設定
利用規約
プライバシーポリシー

Name		Name	Last commit message	Last commit date
Latest commit History 248 Commits
.agent		.agent
.claude		.claude
.github		.github
.obsidian		.obsidian
.specify		.specify
.vscode		.vscode
Todo		Todo
docs		docs
go		go
locales		locales
mobile		mobile
next		next
proto		proto
python		python
.env.example		.env.example
.gitignore		.gitignore
.node-version		.node-version
.prettierrc		.prettierrc
AGENTS.md		AGENTS.md
CLAUDE.md		CLAUDE.md
GEMINI.md		GEMINI.md
README.md		README.md
docker-compose.yaml		docker-compose.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

外国語会話練習アプリ（仮称）

主な機能

キャラクター一覧

対応言語

画面構成

アーキテクチャ概要

状態管理

技術スタック

フロントエンド

バックエンド

AI サービス

インフラ / ツール

ディレクトリ構成

開発環境

必要な環境変数

主要コマンド

補足

task memo

frontend(next)

backend(go)

ai service(python)

mobile app(mobile)

infra

common（共通設定）

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

hiroky1983/talk

Folders and files

Latest commit

History

Repository files navigation

外国語会話練習アプリ（仮称）

主な機能

キャラクター一覧

対応言語

画面構成

アーキテクチャ概要

状態管理

技術スタック

フロントエンド

バックエンド

AI サービス

インフラ / ツール

ディレクトリ構成

開発環境

必要な環境変数

主要コマンド

補足

task memo

frontend(next)

backend(go)

ai service(python)

mobile app(mobile)

infra

common（共通設定）

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages