📖 คู่มือการใช้งาน Video Translate
แปลวิดีโอและพากย์เสียงอัตโนมัติด้วย AI — รองรับ 16 ภาษา คุณภาพระดับมืออาชีพ
🎯 Video Translate คืออะไร?
ระบบแปลวิดีโอและสร้างเสียงพากย์อัตโนมัติ ทำงานได้ตั้งแต่ขั้นตอนเดียวจบ — อัปโหลดวิดีโอ เลือกภาษา กดแปล แล้วได้วิดีโอภาษาไทย (หรือภาษาอื่น) ที่มีทั้งเสียงพากย์และซับไตเติ้ลพร้อมดาวน์โหลด
ความสามารถหลัก
- ถอดเสียง (Speech-to-Text) — ใช้ Whisper จับคำพูดจากวิดีโอ
- แปลภาษา — Gemini 2.5 Pro (ค่าเริ่มต้น) / GPT-4o / Claude
- พากย์เสียง (TTS) — OpenAI / ElevenLabs / Google Chirp 3 HD
- Clone เสียง — เสียงพากย์ใหม่คล้ายเสียงคนในวิดีโอเดิม (ElevenLabs)
- Lip Sync — ขยับปากให้ตรงกับเสียงพากย์ใหม่
- OCR — แปลข้อความในวิดีโอ (ป้าย, หัวข้อ, ฯลฯ)
- YouTube — ดาวน์โหลดและแปลคลิปจาก YouTube ได้โดยตรง
ภาษาที่รองรับ
ไทย, อังกฤษ, จีน, ญี่ปุ่น, เกาหลี, เวียดนาม, อินโด, มาเลย์, ฮินดี, อารบิก, ฝรั่งเศส, เยอรมัน, สเปน, โปรตุเกส, รัสเซีย, อิตาลี
🚀 เริ่มต้นใช้งาน
สมัครสมาชิก
ไปที่
/register กรอก username (3-30 ตัวอักษร a-z, 0-9, _ -) และรหัสผ่าน (อย่างน้อย 8 ตัวอักษร)
รอ admin อนุมัติ
หลังสมัครเสร็จ บัญชีจะอยู่สถานะ ⏳ pending — ต้องรอผู้ดูแลระบบกดอนุมัติก่อน (ระบบจะแจ้งถ้าพยายาม login ก่อนได้รับอนุมัติ)
เข้าสู่ระบบ
ที่
/login — ติ๊ก "จำฉันไว้" ได้เพื่อไม่ต้องล็อกอินซ้ำบ่อย
เลือกโหมดการทำงาน
🔄 แปลวิดีโอ = มีไฟล์วิดีโออยู่แล้ว / 📝 พากย์จากสคริป = มีแต่ข้อความ
ตั้งค่าและกดเริ่ม
ระบบแจ้งความคืบหน้าแบบ real-time รอสักครู่แล้วดาวน์โหลดไฟล์ผลลัพธ์ได้เลย
💡 ทิป: ครั้งแรกลองใช้คลิปสั้น ๆ (1-2 นาที) ก่อน เพื่อเทสต์ว่าเสียงและคุณภาพถูกใจไหม ก่อนลงทุนเวลากับคลิปยาว
🔄 โหมดแปลวิดีโอ
โหมดหลักของระบบ — รับวิดีโอเข้า ได้วิดีโอที่พากย์เสียงภาษาใหม่ออก
ขั้นตอน
อัปโหลดวิดีโอ หรือวาง YouTube URL
รองรับ MP4, MOV, AVI, MKV, WebM — ขนาดไม่เกินที่ admin ตั้งไว้ (ค่าเริ่มต้น 500MB)
เลือกภาษาปลายทาง
เลือกภาษาที่ต้องการให้แปลและพากย์ไปเป็นภาษานั้น (เริ่มต้น: ไทย)
ปรับตัวเลือกอื่น ๆ
Speed, Keep original audio, Subtitle, Lip Sync, OCR ฯลฯ
กด "เริ่มแปล"
รอระบบประมวลผล (เวลาใช้ประมาณ 1-3 เท่าของความยาววิดีโอ ขึ้นอยู่กับตัวเลือก)
ตรวจทานและดาวน์โหลด
ถ้าเปิด "ยืนยันก่อนพากย์" จะมีขั้นแก้ไขข้อความแปลก่อนสร้างเสียง
⚠️ หมายเหตุ: ไฟล์ผลลัพธ์จะถูกลบอัตโนมัติหลังจากช่วงเวลาที่ admin ตั้งไว้ (ค่าเริ่มต้น 24 ชั่วโมง) ดาวน์โหลดเก็บไว้ก่อนปิดหน้าเว็บจะปลอดภัยที่สุด
📝 โหมดพากย์จากสคริป
สำหรับกรณีที่คุณมีข้อความอยู่แล้ว อยากได้แต่เสียงพากย์ — ไม่ต้องมีวิดีโอต้นฉบับ
การใช้งาน
- กดแท็บ 📝 พากย์จากสคริป
- วางข้อความ (พิมพ์เอง หรือคัดลอกมาจากที่อื่น)
- เลือกภาษา + เสียงพากย์
- กด "สร้างเสียงพากย์"
- ดาวน์โหลดไฟล์ MP3
💡 ใช้ AI เขียนสคริปให้: มีปุ่ม "ใช้ AI ช่วยเขียน" ที่จะเรียก Gemini 2.5 Pro ให้เขียนสคริปให้ตามหัวข้อที่คุณให้มา
🎙️ เลือกเอนจินเสียง (TTS Engine)
ระบบรองรับ 3 เอนจินเสียง แต่ละตัวมีจุดเด่นต่างกัน
| เอนจิน | คุณภาพ | จุดเด่น | เหมาะกับ |
| ElevenLabs แนะนำ |
★★★★★ |
เป็นธรรมชาติที่สุด, Clone เสียงได้ |
วิดีโอเชิงพาณิชย์, YouTube, ผลงานที่ต้องการคุณภาพสูง |
| Google TTS Chirp 3 HD |
★★★★★ |
12 เสียงภาษาไทยคุณภาพสูง, ไม่จำกัดโควต้าใน GCP |
งานทั่วไป ใช้ปริมาณมาก ต้นทุนต่ำ |
| OpenAI TTS |
★★★★ |
ปรับสไตล์การพูดได้ (news, dramatic, funny) |
งานครีเอทีฟที่ต้องการโทนเสียงเฉพาะ |
✨ เสียง Chirp 3 HD ใหม่ 2024-2025
เทคโนโลยีเสียงสังเคราะห์รุ่นใหม่ล่าสุดของ Google — เป็นธรรมชาติกว่า Neural2/WaveNet อย่างเห็นได้ชัด
เสียงผู้หญิง (6 เสียง)
- Kore — อบอุ่น เหมาะกับการบรรยาย ค่าเริ่มต้น
- Aoede — สดใส ร่าเริง เหมาะกับคอนเทนต์ไลฟ์สไตล์
- Leda — นุ่มนวล อ่อนโยน เหมาะกับเรื่องเล่า
- Zephyr — เบา สบาย เหมาะกับพอดแคสต์
- Despina — ใส เป็นทางการ เหมาะกับงานธุรกิจ
- Callirrhoe — ลึก มั่นใจ เหมาะกับสารคดี
เสียงผู้ชาย (6 เสียง)
- Charon — ลึก น่าเชื่อถือ เหมาะกับข่าว สารคดี
- Puck — ร่าเริง มีพลัง เหมาะกับ YouTube/โฆษณา
- Fenrir — หนัก ทรงพลัง เหมาะกับตัวอย่างหนัง
- Orus — นุ่ม เหมาะกับการบรรยาย
- Algenib — เป็นทางการ คล้ายผู้ประกาศข่าว
- Iapetus — อบอุ่น เป็นมิตร
💡 ลองเทียบเสียง: ใช้โหมด "พากย์จากสคริป" กับข้อความสั้น ๆ เพื่อฟังเสียงแต่ละตัวก่อนเลือกใช้กับงานจริง
📝 คำบรรยาย (Subtitle)
ตัวเลือกหลัก
- Burn subtitle — เผาซับลงวิดีโอเลย (เปิดแล้วไม่ต้องใช้ไฟล์ srt)
- Upload SRT/VTT — ใช้ไฟล์ซับที่มีอยู่แทนการให้ AI ถอดเอง
- ดาวน์โหลด SRT — ได้ไฟล์ซับแยกออกมาด้วย (ไปเปิดใน YouTube ได้)
ปรับสไตล์ซับ
- ฟอนต์ / ขนาด / สี
- ตำแหน่ง (บน/ล่าง)
- ขอบซับ (outline) และเงา
- พื้นหลังทึบ (box)
⚙️ ตัวเลือกขั้นสูง
Voice Clone ElevenLabs เท่านั้น
โคลนเสียงจากวิดีโอต้นฉบับ — เสียงพากย์ใหม่จะคล้ายเสียงคนในวิดีโอเดิม เหมาะกับงาน localization
Audio Isolation
แยกเสียงพูดออกจากเสียงพื้นหลัง/เพลง ก่อนส่งเข้า Whisper — ช่วยให้การถอดเสียงแม่นยำขึ้น
Keep Original Audio
เก็บเสียงต้นฉบับไว้เบา ๆ (ปรับความดังได้) เป็น BGM ผสมกับเสียงพากย์ใหม่ — เหมาะกับคลิปที่มีเพลงประกอบ
Lip Sync
ขยับปากของคนในวิดีโอให้ตรงกับเสียงพากย์ใหม่ — ใช้เวลาประมวลผลเพิ่มประมาณ 3-5 เท่า
OCR Translation
ตรวจและแปลข้อความที่ปรากฏบนหน้าจอ (ป้าย, หัวข้อ, subtitle ต้นฉบับ) ทับลงวิดีโอ
Time-Fit Segments
ปรับความเร็วแต่ละช่วงเสียงพากย์ให้พอดีกับเวลาต้นฉบับ (0.75x – 1.5x) — ป้องกันเสียงเหลื่อมเวลากับภาพ
Speed
ปรับความเร็วเสียงพากย์โดยรวม (0.5x – 2.0x)
📋 งานของฉัน
ไปที่ /my-jobs เพื่อดูงานทั้งหมดที่คุณเคยสร้าง
ข้อมูลที่เห็น
- ID — 8 ตัวอักษรแรกของ job ID
- Type — translate / script / summary
- Title — ชื่อวิดีโอ/หัวข้อสคริป
- Status — done running queued หรือ error
- Model / Engine — โมเดล AI และเสียงที่ใช้
- Action — ปุ่มดาวน์โหลดไฟล์ (ถ้ายังไม่หมดอายุ)
⚠️ เห็นเฉพาะงานของตัวเอง: ผู้ใช้ทั่วไปเห็นเฉพาะงานของตัวเอง ไม่สามารถดูงานของคนอื่นได้
👤 จัดการบัญชี
เปลี่ยนรหัสผ่าน
- ไปที่ /change-password หรือคลิก "🔑 เปลี่ยนรหัส" ที่มุมบนขวา
- กรอกรหัสปัจจุบัน
- กรอกรหัสใหม่ (อย่างน้อย 8 ตัวอักษร, ต้องไม่เหมือนรหัสเดิม)
- ยืนยันรหัสใหม่อีกครั้ง
- กด "บันทึกรหัสผ่านใหม่"
ออกจากระบบ
คลิก "ออกจากระบบ" ที่มุมบนขวา — session จะถูกลบ ต้องล็อกอินใหม่ครั้งต่อไป
⚙️ สำหรับผู้ดูแลระบบ Admin เท่านั้น
ผู้ใช้ที่มีสิทธิ์ admin จะเห็นเมนู "⚙️ Admin" เพิ่มขึ้นมา
หน้า Dashboard (/admin)
- สรุปจำนวนงานทั้งหมด / สำเร็จ / ล้มเหลว
- จำนวนผู้ใช้ในระบบ
- สถานะ API keys ที่ตั้งไว้
Job History (/admin/jobs)
ดูงานของผู้ใช้ทุกคนในระบบ — กรองตาม status, ผู้ใช้, ช่วงเวลาได้
User Management (/admin/users)
- อนุมัติผู้สมัครใหม่ — คลิก ✅ อนุมัติ ให้ผู้ใช้ในส่วน "⏳ รอการอนุมัติ"
- ปฏิเสธผู้สมัคร — ❌ ลบทิ้งเลยก็ได้
- ระงับบัญชี (suspend) — ⛔ ระงับผู้ใช้ที่เคย approve ไปแล้ว (login ไม่ได้จนกว่าจะ approve ใหม่)
- สร้างบัญชีใหม่ (auto-approve)
- รีเซ็ตรหัสผ่านผู้ใช้
- เลื่อน/ลดขั้นเป็น admin
- ลบบัญชี (ลบ admin คนสุดท้ายไม่ได้)
🔔 Dashboard แจ้งเตือน: ถ้ามีผู้สมัครใหม่รออนุมัติ จะมีกล่องเหลือง ๆ ขึ้นที่หน้า Dashboard และมี badge ตัวเลขสีแดงข้างเมนู "Users"
Settings (/admin/settings)
- ดูรายการ API key ที่ตั้งค่าไว้ (แสดงแบบ masked เช่น
sk-••••xyz (53 chars))
- เปิด/ปิดการสมัครสมาชิก (allow_registration)
- ดูค่า config อื่น ๆ ของระบบ
CLI Management
บนเซิร์ฟเวอร์ใช้คำสั่งนี้จัดการ user ได้:
python manage.py initdb — สร้างตาราง DB ครั้งแรก
python manage.py createuser <username> <password> --admin — สร้าง admin
python manage.py passwd <username> <new_password> — เปลี่ยนรหัส
python manage.py listusers — แสดงผู้ใช้ทั้งหมด
python manage.py deluser <username> — ลบผู้ใช้
❓ คำถามที่พบบ่อย
Q: ทำไมไฟล์ใหญ่เกินไป อัปโหลดไม่ได้?
A: ค่าเริ่มต้น 500MB — ถ้าไฟล์ใหญ่กว่านี้ ให้ลดความละเอียด/ตัดช่วงก่อน หรือแจ้ง admin ปรับค่าให้
Q: วิดีโอ YouTube บางอันดาวน์โหลดไม่ได้?
A: คลิปที่ล็อกอายุ, private, หรือ region-lock ระบบจะโหลดไม่ได้ — ต้องดาวน์โหลดเองก่อนแล้วอัปโหลด
Q: เสียง Chirp 3 HD ต่างกับ Neural2 ยังไง?
A: Chirp 3 HD เป็นเสียงรุ่นใหม่สุดของ Google (2024-2025) ฟังดูเป็นธรรมชาติกว่ามาก มีอารมณ์และการเน้นเสียงคล้ายคนจริงมากกว่า Neural2 ซึ่งเป็นรุ่นเก่าปี 2021-2022
Q: Clone เสียงได้แค่กับเอนจินไหน?
A: ElevenLabs เท่านั้น — Google/OpenAI ยังไม่รองรับ IVC (Instant Voice Cloning) แบบนี้
Q: งานค้างกลางทาง ทำยังไง?
A: ดูที่ /my-jobs ว่า status เป็นอะไร — ถ้า error จะมีข้อความบอกเหตุผล ลองสร้างใหม่ได้เลย หรือแจ้ง admin
Q: ไฟล์ผลลัพธ์หายไป?
A: ไฟล์ถูกลบอัตโนมัติหลังจากช่วงเวลาที่ admin กำหนด (ค่าเริ่มต้น 24 ชั่วโมง) — ดาวน์โหลดเก็บทันทีที่เสร็จจะปลอดภัยที่สุด
Q: ใช้ API key ของตัวเองได้ไหม?
A: ระบบใช้ key กลางที่ admin ตั้งไว้ — ถ้าต้องการใช้ key ส่วนตัว ต้อง deploy instance แยก
Q: รองรับวิดีโอยาวแค่ไหน?
A: ไม่มีขีดจำกัดฮาร์ดโค้ด แต่ในทางปฏิบัติแนะนำไม่เกิน 30 นาที เพราะใช้เวลาประมวลผลนานและอาจชน timeout บางจุด