Trợ lý AI 24/7 · Tiếng Việt công nhân · RAG grounding

Trợ lý AI cho
công nhân công nghiệp.

AI Service của VIVA — chat streaming DeepSeek V3, grounded trên Wiki KB pgvector 768-dim, function tools tra thẳng vào Laravel M2M. Built cho KCN Bắc Ninh · Bắc Giang.

V
VIVA AI
DeepSeek V3 · phản hồi ~ 2 giây
Xin chào Tôi là VIVA AI — hỏi gì cũng được về việc làm, lương, kỹ năng hay khu công nghiệp.
12 tuần
M0 → M3 — từ blueprint đến production
348 tests
Feature + Unit + Integration, all green
DeepSeek V3
+ Gemini · Claude · GPT-4 fallback chain
Tính năng 01 · Ngôn ngữ tự nhiên

AI hiểu tiếng Việt công nhân — không cần từ chuyên ngành.

Gõ thế nào cũng hiểu.

Prompt engineering tối ưu cho Vietnamese informal — model đã tune qua 100+ kịch bản eval. Hiểu được từ lóng ("đứng máy", "làm ca", "ở KTX"), tên KCN viết tắt, và context location Bắc Ninh.

Tiếng Việt informal Từ lóng công nhân Tên KCN viết tắt ✓ Eval F1 = 0.87
Em ở Từ Sơn, muốn tìm việc đứng máy gần 10tr, có KTX
Mình hiểu rồi. Ở Từ Sơn có 3 lựa chọn đứng máy CNC phù hợp: Samsung Yên Phong (11.5tr, KTX free), Goertek VSIP (12tr, KTX), Canon Quế Võ (9.8tr, xe đưa đón). Muốn mình so sánh chi tiết không?
Cái nào dễ vô nhất, không cần kinh nghiệm?
Samsung Yên Phong dễ nhất — không yêu cầu kinh nghiệm, đào tạo 5 ngày có lương. Tuyển gấp, còn 47 slot.
OK chốt. Phỏng vấn ngày nào?
Sáng thứ 2 tới (28/04), 9:00 tại cổng A Samsung Yên Phong. Mình gửi lịch + hướng dẫn đường đi vào Zalo nhé.
Tính năng 02 · Retrieval Augmented Generation

Wiki KB — 50+ bài chuyên ngành công nghiệp.

pgvector 768-dim semantic search.

Mỗi bài wiki được embed bằng text-embedding-3-small (OpenAI) hoặc Gemini, lưu Postgres 17 với pgvector extension. Mỗi query worker lấy top-3 articles liên quan nhất, inject vào prompt làm grounding context — giảm hallucination xuống dưới 2%.

CNC · Hàn · Điện tử KCN Yên Phong / Quế Võ / VSIP Samsung · Canon · Foxconn ✓ Cosine ≥ 0.72 threshold
User query: "Lương CNC Bắc Ninh?"
    │
    ▼
[Gemini embed 768-dim]
    │
    ▼
[pgvector top-3 match]
    │ ├─ cnc-operator.md          (0.89)
    │ ├─ kcn-que-vo.md            (0.81)
    │ └─ salary-bac-ninh-2026.md  (0.77)
    ▼
[Inject → LLM prompt]
    │
    ▼
  Grounded answer ✓
Tính năng 03 · Function calling

AI tự tra data thật từ Laravel backend.

Không dữ liệu tĩnh — luôn live.

LLM gọi 3 function tools qua M2M service key đến api.xanhvina.com.vn: JobSearch (tìm việc theo location/salary/skill), ProfileGet (worker data), ScheduleCreate (đặt lịch phỏng vấn). Không cache — mỗi câu trả lời based on real-time DB.

JobSearch ProfileGet ScheduleCreate ✓ VerifyServiceKey
Worker: "việc Samsung Yên Phong còn tuyển?"
    │
    ▼
LLM → decides tool_call:
    JobSearch(company="Samsung", zone="Yen Phong")
    │
    ▼  (M2M key + staff token)
Laravel /api/v1/jobs/search
    │  → 3 jobs returned (live from MySQL)
    ▼
LLM compose answer with data:
    "Còn 47 slot CNC, lương 11.5-14.2tr..."
    │
    ▼
  Streamed to worker via SSE ✓
Tính năng 04 · Resilience

Multi-LLM fallback với circuit breaker.

Không bao giờ xuống — 99.95% SLO.

Nếu primary fail (timeout, 5xx, quota), circuit breaker opens trong 30s, traffic tự shift sang provider kế tiếp. Mỗi provider được health-probe mỗi 60s. Cost tracking per-request giúp tối ưu tỉ lệ routing.

Circuit Breaker Retry + Backoff Cost tracker
1
DeepSeek V3 PRIMARY
$0.14 / 1M tokens · latency p50 ~ 1.2s
● Healthy
↓ on error / quota
2
Gemini 2.5 Flash
$0.10 / 1M tokens · fast fallback
● Standby
3
Claude 4.7 Sonnet
quality fallback cho long-context
● Standby
4
GPT-4o
last-resort enterprise fallback
● Standby
Tính năng 05 · Red Team hardened

Safety layer — NFKC, PII mask, injection, rate limit.

7 findings Red Team đã fix.

Input pipeline: Unicode NFKC normalize → prompt-injection detector (regex + model) → PII mask (số điện thoại, CCCD, bank account) → rate limit per-worker per-IP. Tất cả đều có test coverage.

F1 · Injection F2 · PII leak F6 · Rate limit F7 · SSRF F9 · Staff token revoke F10 · Drain shutdown F13 · CORS tighten
Aa
NFKC normalize
Homoglyph attack prevention · zero-width chars stripped
##
PII masking
Phone + CCCD + bank auto-redact trước khi log
!
Injection detect
"Ignore previous" patterns + semantic model probe
Rate limit
Token bucket per-worker (30/min) + per-IP (120/min)
SSRF guard
URL allowlist · private-IP deny · 3s timeout
Session revoke
Redis pub/sub push-invalidate staff tokens <5s
Tính năng 06 · M3 milestone

Voice + Admin GUI + Eval harness.

Voice WS streaming

Deepgram STT · ElevenLabs TTS. Session ID 5-phút TTL, graceful drain reconnect.

Admin GUI

Wiki editor với 2-person approval, live preview embedding, analytics dashboard.

Eval harness

100 YAML scenarios · regression CI · golden-set accuracy tracking.

Conversation memory

Per-worker chat history · auto-summarize mỗi 20 turns · Postgres persistence.

Graceful shutdown

Voice WS drain broadcast · 5s timeout · zero dropped conversations on deploy.

Profile building

Chat-driven CV · AI trích skill từ conversation · Laravel sync on complete.

Sẵn sàng trò chuyện với VIVA AI?

Test ngay trong widget phía trên — hoặc đọc docs để biết cách nạp thêm knowledge.