Whisperのような字幕生成もできるかな?とGitHubのIssueを見に行ったが、Timestamp同期は考慮してないので字幕生成は難しいらしい。なるほど。
---
Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース
https://gigazine.net/news/20231201-meta-seamlessm4t-v2/
#bookmarks
Whisperのような字幕生成もできるかな?とGitHubのIssueを見に行ったが、Timestamp同期は考慮してないので字幕生成は難しいらしい。なるほど。
---
Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース
https://gigazine.net/news/20231201-meta-seamlessm4t-v2/
#bookmarks