Bỏ qua tới nội dung

NHÀ MÁY

Năm giai đoạn. Một nhà máy.

Hầu hết các nhà cung cấp vận hành thị trường. Thị trường tạo ra kết quả không nhất quán vì đơn vị chịu trách nhiệm là người chú thích cá nhân. Chúng tôi vận hành nhà máy — đơn vị chịu trách nhiệm là quy trình.

Âm thanh và video tiếng Việt được xử lý qua các hệ thống ASR, phân đoạn người nói, và OCR chuyên biệt. Kết quả nhanh nhưng thô — con người sẽ hiệu chỉnh tiếp.

MẠNG LƯỚI CHUYÊN GIA CỦA CHÚNG TÔI

Một mạng lưới làm việc đa lĩnh vực.

Người làm việc mà chúng tôi có thể xác minh. Chuyên gia có thể xác minh công việc. Cả hai được tuyển trong Việt Nam và được trả công cho thời gian của họ.

Giáo sư Lịch sử Việt Nam
Nhà nghiên cứu Ngôn ngữ học
Chuyên gia Hán-Nôm
Người chú thích bản ngữ Việt
Người duyệt phương ngữ vùng miền
Học giả Tiếng Việt Cổ
Nhà bảo tồn kho lưu trữ
Kỹ sư âm thanh phát thanh
Biên tập viên Tiếng Việt

Khoảng cách thị trường

500B+TOKEN CẦN
100–200BKHO DỮ LIỆU CÔNG KHAI
50,000TÁC PHẨM CHƯA SỐ HOÁ TẠI VFI

GIẢI PHẪU NHÀ MÁY

Năm giai đoạn, từ đầu đến cuối.

Mỗi giai đoạn có công cụ riêng, cấp người làm riêng, và ngưỡng chất lượng riêng. Đầu ra của một giai đoạn không thể chuyển sang giai đoạn tiếp theo nếu chưa vượt qua ngưỡng trước đó.

  1. Giai đoạn 1

    Khai thác

    FFmpeg, faster-whisper, pyannote, PaddleOCR. Đầu ra máy lần một.

  2. Giai đoạn 2

    Hiệu chỉnh

    Người chú thích bản ngữ Việt cấp L1–L3. Ngưỡng độ chính xác dấu thanh.

  3. Giai đoạn 3

    Cấu trúc

    Người chú thích cao cấp L3+. Thực thể, cảnh, taxonomy chủ đề.

  4. Giai đoạn 4

    Chuyên gia đánh giá

    Chuyên gia tiếng Việt độc lập theo lĩnh vực. Kiểm tra chéo nội dung gây tranh cãi.

  5. Giai đoạn 5

    Kiểm tra

    Bài kiểm tra chuẩn, thang bậc người duyệt, báo cáo chính xác đo lường được trên từng lô.

CÂU HỎI THƯỜNG GẶP

Những câu hỏi bạn đang muốn hỏi.

Bạn xử lý dấu thanh tiếng Việt thế nào khi Whisper sai?
Sử dụng ASR chuyên biệt cho tiếng Việt cộng với lớp hiệu chỉnh thủ công bởi người bản ngữ. Mọi đầu ra đều phải vượt qua ngưỡng kiểm tra độ chính xác dấu thanh trước khi giao. CER pilot dưới ba phần trăm trên nội dung tin tức trước khi có hiệu chỉnh thủ công.
Còn âm thanh phát thanh cũ và các phương ngữ vùng miền thì sao?
Âm thanh trước năm 1990 và phương ngữ vùng miền chính là nơi các nhà cung cấp toàn cầu thất bại. Mạng lưới người chú thích của chúng tôi gồm người bản ngữ Việt đến từ các vùng khác nhau, và lớp chuyên gia bao gồm các chuyên gia ngôn ngữ học Việt Nam độc lập cho việc kiểm tra phương ngữ. Chúng tôi không thuê ngoài những gì chúng tôi không có chuyên môn để xác minh.
Chúng tôi có thể giữ taxonomy và phương pháp luận thuộc IP của mình không?
Có. Mỗi hợp đồng đều chuyển giao toàn bộ quyền sở hữu bộ dữ liệu cho bạn. Chúng tôi chỉ giữ lại phương pháp luận nội bộ — không bao giờ giữ dữ liệu cụ thể, taxonomy, hay xử lý trường hợp đặc biệt của bạn. Chúng tôi trung lập về cấu trúc bởi vì chúng tôi không huấn luyện các mô hình cạnh tranh.
Nội dung nhạy cảm hoặc có yếu tố chính trị được xử lý thế nào?
Đội ngũ của chúng tôi ký NDA theo từng dự án bao phủ toàn bộ nội dung khách hàng. Quyền truy cập theo từng dự án — không có chế độ truy cập chéo dự án trừ khi được cho phép rõ ràng. Dữ liệu lưu trú tại Việt Nam theo mặc định.
Nếu chúng tôi cần mở rộng từ 100 giờ/tháng lên 5.000 thì sao?
Lộ trình nâng công suất được hiệu chỉnh ở mức 230–400 nhân lực tương đương để đạt doanh thu năm năm triệu đô trong 24 tháng. Chúng tôi không tăng khối lượng vượt quá ngưỡng chất lượng — mỗi lô đều báo cáo theo CER và độ chính xác thực thể đã thoả thuận trước khi cấp tiếp theo mở rộng.
Quy trình xác thực chuyên gia thực tế diễn ra thế nào?
Đầu ra Cấp 3 đi qua các chuyên gia lịch sử và ngôn ngữ học Việt Nam độc lập theo lĩnh vực. Mỗi người làm việc 5–15 giờ một tuần theo hợp đồng tư vấn chính thức. Nội dung lịch sử gây tranh cãi được hai chuyên gia kiểm tra chéo.
Chúng tôi có thể thử nghiệm trước khi cam kết hợp đồng dài hạn không?
Có. Hợp tác mặc định bắt đầu bằng một pilot trả phí 20 giờ, giá cố định, giao hàng trong bốn tuần. Pilot cho ra kết quả đo lường được mà bạn có thể đánh giá theo tiêu chí riêng. Không cần cam kết nhiều năm để xem chất lượng công việc.
Một dự án có thể bắt đầu nhanh đến mức nào?
Cuộc gọi khảo sát trong vòng 48 giờ kể từ khi bạn liên hệ. Xử lý mẫu bắt đầu trong 1–2 tuần. Đề xuất nằm trong tay bạn trong 4–5 tuần kể từ cuộc gọi đầu tiên. Lô sản xuất đầu tiên có thể bắt đầu trong vòng 9 tuần.