fedi.matsuu.org

fedi.matsuu.org

matsuu . @matsuu,

Whisperのような字幕生成もできるかな?とGitHubのIssueを見に行ったが、Timestamp同期は考慮してないので字幕生成は難しいらしい。なるほど。
---
Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース
https://gigazine.net/news/20231201-meta-seamlessm4t-v2/
#bookmarks

Open thread