NHÀ MÁY
Năm giai đoạn. Một nhà máy.
Hầu hết các nhà cung cấp vận hành thị trường. Thị trường tạo ra kết quả không nhất quán vì đơn vị chịu trách nhiệm là người chú thích cá nhân. Chúng tôi vận hành nhà máy — đơn vị chịu trách nhiệm là quy trình.
Âm thanh và video tiếng Việt được xử lý qua các hệ thống ASR, phân đoạn người nói, và OCR chuyên biệt. Kết quả nhanh nhưng thô — con người sẽ hiệu chỉnh tiếp.
MẠNG LƯỚI CHUYÊN GIA CỦA CHÚNG TÔI
Một mạng lưới làm việc đa lĩnh vực.
Người làm việc mà chúng tôi có thể xác minh. Chuyên gia có thể xác minh công việc. Cả hai được tuyển trong Việt Nam và được trả công cho thời gian của họ.
Khoảng cách thị trường
GIẢI PHẪU NHÀ MÁY
Năm giai đoạn, từ đầu đến cuối.
Mỗi giai đoạn có công cụ riêng, cấp người làm riêng, và ngưỡng chất lượng riêng. Đầu ra của một giai đoạn không thể chuyển sang giai đoạn tiếp theo nếu chưa vượt qua ngưỡng trước đó.
- Giai đoạn 1
Khai thác
FFmpeg, faster-whisper, pyannote, PaddleOCR. Đầu ra máy lần một.
- Giai đoạn 2
Hiệu chỉnh
Người chú thích bản ngữ Việt cấp L1–L3. Ngưỡng độ chính xác dấu thanh.
- Giai đoạn 3
Cấu trúc
Người chú thích cao cấp L3+. Thực thể, cảnh, taxonomy chủ đề.
- Giai đoạn 4
Chuyên gia đánh giá
Chuyên gia tiếng Việt độc lập theo lĩnh vực. Kiểm tra chéo nội dung gây tranh cãi.
- Giai đoạn 5
Kiểm tra
Bài kiểm tra chuẩn, thang bậc người duyệt, báo cáo chính xác đo lường được trên từng lô.
CÂU HỎI THƯỜNG GẶP