📖 คู่มือการใช้งาน Video Translate

แปลวิดีโอและพากย์เสียงอัตโนมัติด้วย AI — รองรับ 16 ภาษา คุณภาพระดับมืออาชีพ

สารบัญ

Video Translate คืออะไร?
เริ่มต้นใช้งาน
โหมดแปลวิดีโอ
โหมดพากย์จากสคริป
เลือกเอนจินเสียง (TTS)
เสียง Chirp 3 HD
คำบรรยาย (Subtitle)
ตัวเลือกขั้นสูง
งานของฉัน
จัดการบัญชี
สำหรับผู้ดูแลระบบ
คำถามที่พบบ่อย

🎯 Video Translate คืออะไร?

ระบบแปลวิดีโอและสร้างเสียงพากย์อัตโนมัติ ทำงานได้ตั้งแต่ขั้นตอนเดียวจบ — อัปโหลดวิดีโอ เลือกภาษา กดแปล แล้วได้วิดีโอภาษาไทย (หรือภาษาอื่น) ที่มีทั้งเสียงพากย์และซับไตเติ้ลพร้อมดาวน์โหลด

ความสามารถหลัก

ถอดเสียง (Speech-to-Text) — ใช้ Whisper จับคำพูดจากวิดีโอ
แปลภาษา — Gemini 2.5 Pro (ค่าเริ่มต้น) / GPT-4o / Claude
พากย์เสียง (TTS) — OpenAI / ElevenLabs / Google Chirp 3 HD
Clone เสียง — เสียงพากย์ใหม่คล้ายเสียงคนในวิดีโอเดิม (ElevenLabs)
Lip Sync — ขยับปากให้ตรงกับเสียงพากย์ใหม่
OCR — แปลข้อความในวิดีโอ (ป้าย, หัวข้อ, ฯลฯ)
YouTube — ดาวน์โหลดและแปลคลิปจาก YouTube ได้โดยตรง

ภาษาที่รองรับ

ไทย, อังกฤษ, จีน, ญี่ปุ่น, เกาหลี, เวียดนาม, อินโด, มาเลย์, ฮินดี, อารบิก, ฝรั่งเศส, เยอรมัน, สเปน, โปรตุเกส, รัสเซีย, อิตาลี

🚀 เริ่มต้นใช้งาน

สมัครสมาชิก ไปที่ /register กรอก username (3-30 ตัวอักษร a-z, 0-9, _ -) และรหัสผ่าน (อย่างน้อย 8 ตัวอักษร)

รอ admin อนุมัติ หลังสมัครเสร็จ บัญชีจะอยู่สถานะ ⏳ pending — ต้องรอผู้ดูแลระบบกดอนุมัติก่อน (ระบบจะแจ้งถ้าพยายาม login ก่อนได้รับอนุมัติ)

เข้าสู่ระบบ ที่ /login — ติ๊ก "จำฉันไว้" ได้เพื่อไม่ต้องล็อกอินซ้ำบ่อย

เลือกโหมดการทำงาน 🔄 แปลวิดีโอ = มีไฟล์วิดีโออยู่แล้ว / 📝 พากย์จากสคริป = มีแต่ข้อความ

ตั้งค่าและกดเริ่ม ระบบแจ้งความคืบหน้าแบบ real-time รอสักครู่แล้วดาวน์โหลดไฟล์ผลลัพธ์ได้เลย

💡 ทิป: ครั้งแรกลองใช้คลิปสั้น ๆ (1-2 นาที) ก่อน เพื่อเทสต์ว่าเสียงและคุณภาพถูกใจไหม ก่อนลงทุนเวลากับคลิปยาว

🔄 โหมดแปลวิดีโอ

โหมดหลักของระบบ — รับวิดีโอเข้า ได้วิดีโอที่พากย์เสียงภาษาใหม่ออก

ขั้นตอน

อัปโหลดวิดีโอ หรือวาง YouTube URL รองรับ MP4, MOV, AVI, MKV, WebM — ขนาดไม่เกินที่ admin ตั้งไว้ (ค่าเริ่มต้น 500MB)

เลือกภาษาปลายทาง เลือกภาษาที่ต้องการให้แปลและพากย์ไปเป็นภาษานั้น (เริ่มต้น: ไทย)

เลือกเอนจินเสียง (TTS Engine) ดูหัวข้อ เลือกเอนจินเสียง สำหรับรายละเอียด

ปรับตัวเลือกอื่น ๆ Speed, Keep original audio, Subtitle, Lip Sync, OCR ฯลฯ

กด "เริ่มแปล" รอระบบประมวลผล (เวลาใช้ประมาณ 1-3 เท่าของความยาววิดีโอ ขึ้นอยู่กับตัวเลือก)

ตรวจทานและดาวน์โหลด ถ้าเปิด "ยืนยันก่อนพากย์" จะมีขั้นแก้ไขข้อความแปลก่อนสร้างเสียง

⚠️ หมายเหตุ: ไฟล์ผลลัพธ์จะถูกลบอัตโนมัติหลังจากช่วงเวลาที่ admin ตั้งไว้ (ค่าเริ่มต้น 24 ชั่วโมง) ดาวน์โหลดเก็บไว้ก่อนปิดหน้าเว็บจะปลอดภัยที่สุด

📝 โหมดพากย์จากสคริป

สำหรับกรณีที่คุณมีข้อความอยู่แล้ว อยากได้แต่เสียงพากย์ — ไม่ต้องมีวิดีโอต้นฉบับ

การใช้งาน

กดแท็บ 📝 พากย์จากสคริป
วางข้อความ (พิมพ์เอง หรือคัดลอกมาจากที่อื่น)
เลือกภาษา + เสียงพากย์
กด "สร้างเสียงพากย์"
ดาวน์โหลดไฟล์ MP3

💡 ใช้ AI เขียนสคริปให้: มีปุ่ม "ใช้ AI ช่วยเขียน" ที่จะเรียก Gemini 2.5 Pro ให้เขียนสคริปให้ตามหัวข้อที่คุณให้มา

🎙️ เลือกเอนจินเสียง (TTS Engine)

ระบบรองรับ 3 เอนจินเสียง แต่ละตัวมีจุดเด่นต่างกัน

เอนจิน	คุณภาพ	จุดเด่น	เหมาะกับ
ElevenLabs แนะนำ	★★★★★	เป็นธรรมชาติที่สุด, Clone เสียงได้	วิดีโอเชิงพาณิชย์, YouTube, ผลงานที่ต้องการคุณภาพสูง
Google TTS Chirp 3 HD	★★★★★	12 เสียงภาษาไทยคุณภาพสูง, ไม่จำกัดโควต้าใน GCP	งานทั่วไป ใช้ปริมาณมาก ต้นทุนต่ำ
OpenAI TTS	★★★★	ปรับสไตล์การพูดได้ (news, dramatic, funny)	งานครีเอทีฟที่ต้องการโทนเสียงเฉพาะ

✨ เสียง Chirp 3 HD ใหม่ 2024-2025

เทคโนโลยีเสียงสังเคราะห์รุ่นใหม่ล่าสุดของ Google — เป็นธรรมชาติกว่า Neural2/WaveNet อย่างเห็นได้ชัด

เสียงผู้หญิง (6 เสียง)

Kore — อบอุ่น เหมาะกับการบรรยาย ค่าเริ่มต้น
Aoede — สดใส ร่าเริง เหมาะกับคอนเทนต์ไลฟ์สไตล์
Leda — นุ่มนวล อ่อนโยน เหมาะกับเรื่องเล่า
Zephyr — เบา สบาย เหมาะกับพอดแคสต์
Despina — ใส เป็นทางการ เหมาะกับงานธุรกิจ
Callirrhoe — ลึก มั่นใจ เหมาะกับสารคดี

เสียงผู้ชาย (6 เสียง)

Charon — ลึก น่าเชื่อถือ เหมาะกับข่าว สารคดี
Puck — ร่าเริง มีพลัง เหมาะกับ YouTube/โฆษณา
Fenrir — หนัก ทรงพลัง เหมาะกับตัวอย่างหนัง
Orus — นุ่ม เหมาะกับการบรรยาย
Algenib — เป็นทางการ คล้ายผู้ประกาศข่าว
Iapetus — อบอุ่น เป็นมิตร

💡 ลองเทียบเสียง: ใช้โหมด "พากย์จากสคริป" กับข้อความสั้น ๆ เพื่อฟังเสียงแต่ละตัวก่อนเลือกใช้กับงานจริง

📝 คำบรรยาย (Subtitle)

ตัวเลือกหลัก

Burn subtitle — เผาซับลงวิดีโอเลย (เปิดแล้วไม่ต้องใช้ไฟล์ srt)
Upload SRT/VTT — ใช้ไฟล์ซับที่มีอยู่แทนการให้ AI ถอดเอง
ดาวน์โหลด SRT — ได้ไฟล์ซับแยกออกมาด้วย (ไปเปิดใน YouTube ได้)

ปรับสไตล์ซับ

ฟอนต์ / ขนาด / สี
ตำแหน่ง (บน/ล่าง)
ขอบซับ (outline) และเงา
พื้นหลังทึบ (box)

⚙️ ตัวเลือกขั้นสูง

Voice Clone ElevenLabs เท่านั้น

โคลนเสียงจากวิดีโอต้นฉบับ — เสียงพากย์ใหม่จะคล้ายเสียงคนในวิดีโอเดิม เหมาะกับงาน localization

Audio Isolation

แยกเสียงพูดออกจากเสียงพื้นหลัง/เพลง ก่อนส่งเข้า Whisper — ช่วยให้การถอดเสียงแม่นยำขึ้น

Keep Original Audio

เก็บเสียงต้นฉบับไว้เบา ๆ (ปรับความดังได้) เป็น BGM ผสมกับเสียงพากย์ใหม่ — เหมาะกับคลิปที่มีเพลงประกอบ

Lip Sync

ขยับปากของคนในวิดีโอให้ตรงกับเสียงพากย์ใหม่ — ใช้เวลาประมวลผลเพิ่มประมาณ 3-5 เท่า

OCR Translation

ตรวจและแปลข้อความที่ปรากฏบนหน้าจอ (ป้าย, หัวข้อ, subtitle ต้นฉบับ) ทับลงวิดีโอ

Time-Fit Segments

ปรับความเร็วแต่ละช่วงเสียงพากย์ให้พอดีกับเวลาต้นฉบับ (0.75x – 1.5x) — ป้องกันเสียงเหลื่อมเวลากับภาพ

Speed

ปรับความเร็วเสียงพากย์โดยรวม (0.5x – 2.0x)

📋 งานของฉัน

ไปที่ /my-jobs เพื่อดูงานทั้งหมดที่คุณเคยสร้าง

ข้อมูลที่เห็น

ID — 8 ตัวอักษรแรกของ job ID
Type — translate / script / summary
Title — ชื่อวิดีโอ/หัวข้อสคริป
Status — done running queued หรือ error
Model / Engine — โมเดล AI และเสียงที่ใช้
Action — ปุ่มดาวน์โหลดไฟล์ (ถ้ายังไม่หมดอายุ)

⚠️ เห็นเฉพาะงานของตัวเอง: ผู้ใช้ทั่วไปเห็นเฉพาะงานของตัวเอง ไม่สามารถดูงานของคนอื่นได้

👤 จัดการบัญชี

เปลี่ยนรหัสผ่าน

ไปที่ /change-password หรือคลิก "🔑 เปลี่ยนรหัส" ที่มุมบนขวา
กรอกรหัสปัจจุบัน
กรอกรหัสใหม่ (อย่างน้อย 8 ตัวอักษร, ต้องไม่เหมือนรหัสเดิม)
ยืนยันรหัสใหม่อีกครั้ง
กด "บันทึกรหัสผ่านใหม่"

ออกจากระบบ

คลิก "ออกจากระบบ" ที่มุมบนขวา — session จะถูกลบ ต้องล็อกอินใหม่ครั้งต่อไป

⚙️ สำหรับผู้ดูแลระบบ Admin เท่านั้น

ผู้ใช้ที่มีสิทธิ์ admin จะเห็นเมนู "⚙️ Admin" เพิ่มขึ้นมา

หน้า Dashboard (`/admin`)

สรุปจำนวนงานทั้งหมด / สำเร็จ / ล้มเหลว
จำนวนผู้ใช้ในระบบ
สถานะ API keys ที่ตั้งไว้

Job History (`/admin/jobs`)

ดูงานของผู้ใช้ทุกคนในระบบ — กรองตาม status, ผู้ใช้, ช่วงเวลาได้

User Management (`/admin/users`)

อนุมัติผู้สมัครใหม่ — คลิก ✅ อนุมัติ ให้ผู้ใช้ในส่วน "⏳ รอการอนุมัติ"
ปฏิเสธผู้สมัคร — ❌ ลบทิ้งเลยก็ได้
ระงับบัญชี (suspend) — ⛔ ระงับผู้ใช้ที่เคย approve ไปแล้ว (login ไม่ได้จนกว่าจะ approve ใหม่)
สร้างบัญชีใหม่ (auto-approve)
รีเซ็ตรหัสผ่านผู้ใช้
เลื่อน/ลดขั้นเป็น admin
ลบบัญชี (ลบ admin คนสุดท้ายไม่ได้)

🔔 Dashboard แจ้งเตือน: ถ้ามีผู้สมัครใหม่รออนุมัติ จะมีกล่องเหลือง ๆ ขึ้นที่หน้า Dashboard และมี badge ตัวเลขสีแดงข้างเมนู "Users"

Settings (`/admin/settings`)

ดูรายการ API key ที่ตั้งค่าไว้ (แสดงแบบ masked เช่น sk-••••xyz (53 chars))
เปิด/ปิดการสมัครสมาชิก (allow_registration)
ดูค่า config อื่น ๆ ของระบบ

CLI Management

บนเซิร์ฟเวอร์ใช้คำสั่งนี้จัดการ user ได้:

python manage.py initdb — สร้างตาราง DB ครั้งแรก
python manage.py createuser <username> <password> --admin — สร้าง admin
python manage.py passwd <username> <new_password> — เปลี่ยนรหัส
python manage.py listusers — แสดงผู้ใช้ทั้งหมด
python manage.py deluser <username> — ลบผู้ใช้

❓ คำถามที่พบบ่อย

Q: ทำไมไฟล์ใหญ่เกินไป อัปโหลดไม่ได้?

A: ค่าเริ่มต้น 500MB — ถ้าไฟล์ใหญ่กว่านี้ ให้ลดความละเอียด/ตัดช่วงก่อน หรือแจ้ง admin ปรับค่าให้

Q: วิดีโอ YouTube บางอันดาวน์โหลดไม่ได้?

A: คลิปที่ล็อกอายุ, private, หรือ region-lock ระบบจะโหลดไม่ได้ — ต้องดาวน์โหลดเองก่อนแล้วอัปโหลด

Q: เสียง Chirp 3 HD ต่างกับ Neural2 ยังไง?

A: Chirp 3 HD เป็นเสียงรุ่นใหม่สุดของ Google (2024-2025) ฟังดูเป็นธรรมชาติกว่ามาก มีอารมณ์และการเน้นเสียงคล้ายคนจริงมากกว่า Neural2 ซึ่งเป็นรุ่นเก่าปี 2021-2022

Q: Clone เสียงได้แค่กับเอนจินไหน?

A: ElevenLabs เท่านั้น — Google/OpenAI ยังไม่รองรับ IVC (Instant Voice Cloning) แบบนี้

Q: งานค้างกลางทาง ทำยังไง?

A: ดูที่ /my-jobs ว่า status เป็นอะไร — ถ้า error จะมีข้อความบอกเหตุผล ลองสร้างใหม่ได้เลย หรือแจ้ง admin

Q: ไฟล์ผลลัพธ์หายไป?

A: ไฟล์ถูกลบอัตโนมัติหลังจากช่วงเวลาที่ admin กำหนด (ค่าเริ่มต้น 24 ชั่วโมง) — ดาวน์โหลดเก็บทันทีที่เสร็จจะปลอดภัยที่สุด

Q: ใช้ API key ของตัวเองได้ไหม?

A: ระบบใช้ key กลางที่ admin ตั้งไว้ — ถ้าต้องการใช้ key ส่วนตัว ต้อง deploy instance แยก

Q: รองรับวิดีโอยาวแค่ไหน?

A: ไม่มีขีดจำกัดฮาร์ดโค้ด แต่ในทางปฏิบัติแนะนำไม่เกิน 30 นาที เพราะใช้เวลาประมวลผลนานและอาจชน timeout บางจุด

📖 คู่มือการใช้งาน Video Translate

🎯 Video Translate คืออะไร?

ความสามารถหลัก

ภาษาที่รองรับ

🚀 เริ่มต้นใช้งาน

🔄 โหมดแปลวิดีโอ

ขั้นตอน

📝 โหมดพากย์จากสคริป

การใช้งาน

🎙️ เลือกเอนจินเสียง (TTS Engine)

✨ เสียง Chirp 3 HD ใหม่ 2024-2025

เสียงผู้หญิง (6 เสียง)

เสียงผู้ชาย (6 เสียง)

📝 คำบรรยาย (Subtitle)

ตัวเลือกหลัก

ปรับสไตล์ซับ

⚙️ ตัวเลือกขั้นสูง

Voice Clone ElevenLabs เท่านั้น

Audio Isolation

Keep Original Audio

Lip Sync

OCR Translation

Time-Fit Segments

Speed

📋 งานของฉัน

ข้อมูลที่เห็น

👤 จัดการบัญชี

เปลี่ยนรหัสผ่าน

ออกจากระบบ

⚙️ สำหรับผู้ดูแลระบบ Admin เท่านั้น

หน้า Dashboard (/admin)

Job History (/admin/jobs)

User Management (/admin/users)

Settings (/admin/settings)

CLI Management

❓ คำถามที่พบบ่อย

Q: ทำไมไฟล์ใหญ่เกินไป อัปโหลดไม่ได้?

Q: วิดีโอ YouTube บางอันดาวน์โหลดไม่ได้?

Q: เสียง Chirp 3 HD ต่างกับ Neural2 ยังไง?

Q: Clone เสียงได้แค่กับเอนจินไหน?

Q: งานค้างกลางทาง ทำยังไง?

Q: ไฟล์ผลลัพธ์หายไป?

Q: ใช้ API key ของตัวเองได้ไหม?

Q: รองรับวิดีโอยาวแค่ไหน?

พร้อมแล้วใช่ไหม? มาเริ่มแปลวิดีโอกันเลย!

หน้า Dashboard (`/admin`)

Job History (`/admin/jobs`)

User Management (`/admin/users`)

Settings (`/admin/settings`)