演講練習與配速優化工具 · 早鳥募集中

Vox every slide.

把投影片與講稿轉成可聆聽、可調速、可反覆練習的 AI 配音版本，幫你在通勤、散步、洗澡時用耳朵打磨演講內容。

把 TTS 從「給觀眾的旁白」重新定位成「給講者本人的配速節拍器」。

上傳 PPTX / PDF → 編輯講稿、調速、插停頓 → 匯出音檔 / 影片 → 用耳朵聽 5–10 輪

演講者準備上台，卡在三個地方

這是新手與老手共同的痛，而現有工具都只解決其中一塊。

痛點 A

用眼睛看自己寫的稿，大腦會加速略過熟悉段落。結果是「寫的時候覺得 20 分鐘剛好，上台講變 35 分鐘」。

痛點 B

腦中朗讀比實際開口快 30–50%。沒有真實聲音對照，講者往往直到上台才發現節奏失準。

痛點 C

對鏡子、找朋友聽都被綁在桌前。但真正改稿的靈感，常出現在通勤、散步、洗澡——耳朵讀稿時。

Voxlide 的產品架構，圍繞三個信念。

別人用 TTS 產出給觀眾的影片；Voxlide 用 TTS 產出給講者本人聽的「目標配速範本」。

輸出的音檔／影片必須能離開電腦——在通勤、散步、洗澡時，用耳朵以聽眾視角重新聽見內容。

聽到問題 → 回桌前改一段 → 只重生成該段 → 10 秒內重匯出 → 下一輪。快到不打斷思考。

每個元件都成熟穩定，沒有 moonshot——只把對的東西串成一個迴圈。

PPTX / PDF 上傳，自動轉成投影片圖，並抓取 speaker notes 作為講稿初始值。完整中文字型渲染。

左側縮圖、中間 timeline 與波形、右側講稿編輯。每張投影片對應一個段落，即時顯示時長。

台灣中文聲音（zh-TW），語速 0.5x–2.0x、可調音調、SSML 精確停頓，單段預覽即時生成。

每張投影片與總時長即時更新。設定目標時長，系統提示「目前超時 3 分 12 秒」並標示異常段落。

純音檔（MP3 / M4A）適合通勤聽；影片（MP4）含 burn-in 頁碼，朋友聽到問題能指明「第幾張」。

以 hash（文字＋聲音＋速度）快取，改一段只重生成該段。20 張投影片改 1 段，重匯出 < 10 秒。

旁白工具做影片、教練工具做聲音分析。把五件事用一個迴圈串起來，是 Voxlide 的切入點。

	投影片匯入	講稿管理	TTS 配速示範	練習回饋	異步聽稿
旁白影片工具	有	有	有	—	部分
AI 演講教練	部分	—	—	有	—
腳本驅動工具	—	有	有	部分	部分
開源元件	部分	有	有	—	—
Voxlide	有	有	有	有	有

Voxlide 正在招募早鳥使用者。留下信箱，產品開放時第一時間通知你。