Trợ lý AI 24/7 · Tiếng Việt công nhân · Tools + scrape ingest

Trợ lý AI cho
công nhân công nghiệp.

AI Service của VIVA — chat streaming OpenAI + DeepSeek, 11 function tools tra thẳng vào Laravel M2M, generative UI carousel + ứng tuyển inline, lead-capture LLM-driven, multi-turn nhớ ngữ cảnh xuyên F5. Built cho KCN Bắc Ninh · Bắc Giang.

V
VIVA AI
OpenAI + DeepSeek · phản hồi ~ 2 giây
Xin chào Tôi là VIVA AI — hỏi gì cũng được về việc làm, lương, kỹ năng hay khu công nghiệp.
11 tools
Function calling realtime → Laravel M2M
500+ tests
Feature + Unit + Integration, all green
OpenAI + DeepSeek
Cost routing + circuit breaker · 99.95% SLO
Tính năng 01 · Ngôn ngữ tự nhiên

AI hiểu tiếng Việt công nhân — không cần từ chuyên ngành.

Gõ thế nào cũng hiểu.

Prompt engineering tối ưu cho Vietnamese informal — system prompt tune sát với ngôn ngữ công nhân. Hiểu được từ lóng ("đứng máy", "làm ca", "ở KTX"), tên KCN viết tắt, và context location Bắc Ninh.

Tiếng Việt informal Từ lóng công nhân Tên KCN viết tắt ✓ 500+ tests green
Em ở Từ Sơn, muốn tìm việc đứng máy gần 10tr, có KTX
Mình hiểu rồi. Ở Từ Sơn có 3 lựa chọn đứng máy CNC phù hợp: Samsung Yên Phong (11.5tr, KTX free), Goertek VSIP (12tr, KTX), Canon Quế Võ (9.8tr, xe đưa đón). Muốn mình so sánh chi tiết không?
Cái nào dễ vô nhất, không cần kinh nghiệm?
Samsung Yên Phong dễ nhất — không yêu cầu kinh nghiệm, đào tạo 5 ngày có lương. Tuyển gấp, còn 47 slot.
OK chốt. Phỏng vấn ngày nào?
Sáng thứ 2 tới (28/04), 9:00 tại cổng A Samsung Yên Phong. Mình gửi lịch + hướng dẫn đường đi vào Zalo nhé.
Tính năng 02 · Tool orchestration

Tools tra Laravel data — không cần wiki KB tĩnh.

Mọi data đều realtime từ Laravel.

AI gọi function tools đến api.xanhvina.com.vn qua M2M để lấy data trực tiếp — worker profile, jobs, lịch phỏng vấn. Jobs được scrape ngoài rồi đẩy vào Laravel, AI tự rank và explain match. Không cache stale, không hallucinate.

11 tools Generative UI cards Scrape ingest pipeline ✓ HMAC + JWT + Idempotency

worker_profile

Lấy CV, kỹ năng, vị trí worker từ Laravel realtime.

job_search + job_detail

Query live theo location/salary/skill, paginated, full filters.

job_compare

So sánh 2-3 việc — lương, KTX, khoảng cách, yêu cầu, side-by-side.

parse_search_intent

NL → structured filters (industry/location/salary/benefits).

prepare_job_application

Pre-fill form, render Generative UI confirm card, worker bấm 1 nút gửi.

escalate_to_human

Handoff sang ops khi AI không đủ thông tin — lưu context đầy đủ.

Tính năng 03 · Phase 02 robustness

Parallel tool dispatch · result compression · retry classify.

Gọi nhiều tools cùng lúc, gọn token, retry thông minh.

LLM có thể gọi nhiều tools song song qua asyncio.gather — giảm latency 40%+ khi cần nhiều thông tin. Result compressor chỉ giữ field essential per-tool (top-10 jobs với 8 fields thay vì 50 với 30 fields) — tiết kiệm 60-70% context. Retry classifier phân loại lỗi retryable / non-retryable theo provider để tránh đốt quota vô ích.

asyncio.gather Result compressor Retry classify ✓ Indirect injection guard
Worker: "so sánh việc Samsung & Goertek, em muốn KTX free"
    │
    ▼
LLM → 3 tool_calls SONG SONG:
    ├─ job_search(company="Samsung", benefits=["dorm"])
    ├─ job_search(company="Goertek", benefits=["dorm"])
    └─ worker_profile(worker_id=current)
    │
    ▼  (asyncio.gather — 1 round-trip)
Laravel /api/v1/...  ← 3 calls parallel
    │
    ▼  result_compressor: 50 fields → 8 essential
indirect_injection_guard: lọc model tokens / URL inject
    ▼
LLM compose so sánh:
    "Samsung 11.5tr KTX free · Goertek 12tr KTX..."
    │
    ▼
  Streamed to worker via SSE ✓
Tính năng 04 · Cost routing + resilience

OpenAI + DeepSeek — cost routing có chủ đích.

OpenAI gpt-4o-mini chính · DeepSeek dự phòng giá rẻ.

Gateway dùng OpenAI gpt-4o-mini làm primary (chất lượng tiếng Việt tốt + tool calling chuẩn xác), DeepSeek deepseek-chat làm fallback giá rẻ. Provider + model có thể đổi runtime qua admin Settings UI mà không cần redeploy. Circuit breaker mở 30s khi 5xx/timeout, traffic shift tự động. Mỗi request log cost USD vào ``llm_usage_log`` — admin xem realtime trên dashboard.

Circuit Breaker Retry + Backoff Cost tracker
O
OpenAI gpt-4o-mini PRIMARY
$0.15 / $0.60 / 1M tokens · chat + tool calling · latency p50 ~ 1.1s
● Healthy
↔ failover tự động khi 5xx / 429
D
DeepSeek deepseek-chat FALLBACK · CHEAP
$0.14 / $0.28 / 1M tokens · OpenAI-compatible · backup khi primary gặp sự cố
● Healthy
↗ embedding via OpenAI text-embedding-3-small (1536-dim)
E
text-embedding-3-small
$0.02 / 1M tokens · Wiki RAG semantic search · pgvector + tsvector hybrid
● Active
Tính năng 05 · Red Team hardened

Safety layer — VN-aware PII, direct + indirect injection guard.

Đa tầng phòng thủ, hiểu chuẩn Việt Nam.

Input pipeline: Unicode NFKC normalize → direct prompt-injection detector → PII masker VN-aware (CCCD 12 số, CMND 9 số, MST 10/13 số, STK ngân hàng, SĐT VN) → rate limit per-worker + per-IP. Trên đường về: indirect_injection_guard (Phase 02 B4) sanitize tool result trước khi feed lại LLM — chống prompt injection ngầm từ data ngoài.

VN PII (CCCD/MST/STK) Direct injection Indirect injection guard Output filter Rate limit SSRF guard
Aa
NFKC normalize
Homoglyph attack prevention · zero-width chars stripped
##
PII masker VN
CCCD 12 / CMND 9 / MST 10/13 / STK / SĐT VN · auto-redact trước khi log + LLM
!
Direct injection
"Ignore previous" + EN/VI imperative patterns · semantic model probe
Indirect guard
Lọc model role tokens + URL inject từ tool result trước khi feed lại LLM
Output filter
Re-mask PII có thể leak từ LLM response trước khi gửi worker
Rate limit
Token bucket per-worker (30/min) + per-IP (120/min)
SSRF guard
URL allowlist · private-IP deny · 3s timeout
Tenant scope
JWT sub === worker_id mọi request — Red Team C3 chặn cross-worker access
Tính năng 06 · V5 stack

Generative UI · Intelligence · Webhooks · Memory · Voice.

Generative UI cards

5 cards live: JobCarouselCard swipe ngang (2-8 jobs), JobPickerCard list dọc, ApplicationFormCard ứng tuyển inline, ApplicationSuccessCard, ApplicationConfirmCard. Tool emit tool_card hoặc lead_signal SSE — frontend dispatch theo whitelist.

Intelligence endpoints

4 admin AI: churn risk, draft-reply HR, anomaly detection, campaign suggestions theo KCN.

6 webhook events

profile.built · content.generated · safety.incident · match.found · churn.spike · anomaly.detected — fire-and-forget với daily idempotency keys.

Conversation memory (RLS)

Per-worker chat history với row-level security · auto-summarize mỗi 20 turns · TTL 90d worker / 365d staff / 7d guest (NEW). Guest sessions multi-turn từ 2026-04-29.

Phase 02 robustness

Parallel tool dispatch (asyncio.gather) + result compressor 60-70% gọn + retry classifier theo provider + indirect injection guard.

Profile building

State machine 8 câu hỏi · AI trích skill từ chat · Laravel sync on complete.

Anonymous → registered

Worker chat ngay không cần đăng ký · LLM tool should_capture_lead tự nhận biết khi nào hỏi SĐT (không cần regex hardcode) · auto-prefill vị trí + KCN từ context · ApplicationFormCard inline submit tạo Worker + applied_jobs[].

Worker AI endpoints

search/parse · feed/explain · content/summarize-job · suggestions · thinking events — gọn cho frontend SSE.

Scrape ingest pipeline

Jobs scraper EXTERNAL → Laravel /jobs/ingest → AI extract + rank · 100 jobs/day · <5% manual override.

Có gì mới

Cập nhật gần đây của VIVA AI.

Theo dõi đầy đủ tại GitLab commits.

Sẵn sàng trò chuyện với VIVA AI?

Test ngay trong widget phía trên — hoặc đọc docs để biết cách nạp thêm knowledge.