バグ #105
未完了[メインページ]「は」を特定の文字列に繋げると、「WA」と発音される
説明
不具合の内容¶
「は」を特定の文字列に繋げると、「WA」と発音される。
例えば、「急いでるんだから、はよ来て!」を合成すると、
「いそいでるんだから、わよきて」と出力され、回避ができない。
現象・ログ¶
【入力例①】
はあ、はい、はう、はえ、はお、
はか、はき、はく、はけ、はこ、
はさ、はし、はす、はせ、はそ、
はた、はち、はつ、はて、はと、
はな、はに、はぬ、はね、はの、
はは、はひ、はふ、はへ、はほ、
はま、はみ、はむ、はめ、はも、
はや、はゆ、はよ、はら、はり、
はる、はれ、はろ、はわ、はを、
はん
⇒「そ」「ち」「ぬ」「の」「は」「ひ」「ふ」「ほ」「ほ」「も」「ゆ」「よ」「わ」の前の「は」が「WA」と発音される
【入力例②】
あは、いは、うは、えは、おは、
かは、きは、くは、けは、こは、
さは、しは、すは、せは、そは、
たは、ちは、つは、ては、とは、
なは、には、ぬは、ねは、のは、
はは、ひは、ふは、へは、ほは、
まは、みは、むは、めは、もは、
やは、ゆは、よは、らは、りは、
るは、れは、ろは、わは、をは、
んは
⇒すべての「は」が「WA」と発音される
【入力例③】
いち、に、さん、し、ご、ろく、しち、はち、きゅう、じゅう
⇒「いち に さん し ご ろく しち わ ち きゅう じゅう」と発音される
再現手順¶
- [WEB版VOICEVOX]画面を起動する
- 「現象・ログ」の入力例の通り入力し、[合成]ボタンをクリックする
OSの種類/ブラウザ/バージョン¶
OS:Windows 10 Pro 22H2
ブラウザ:FireFox 125.0.2 (64 ビット)
その他¶
特になし
関連チケット¶
https://webapp.wiki/issues/94
⇒合成語の文字列は、発音を表しているので、issues#94はユーザーの作業を妨げない認識
ファイル
tts.quest 開発者 さんが7ヶ月前に更新
報告ありがとう!
形態素解析に失敗してそう。
急いで 動詞,*,子音動詞ガ行,タ系連用テ形,急ぐ,いそいで,代表表記:急ぐ/いそぐ
る 接尾辞,動詞性接尾辞,母音動詞,基本形,る,る,代表表記:る/る
んだ 助動詞,*,ナ形容詞,基本形,んだ,んだ,*
から 助詞,接続助詞,*,*,から,から,*
、 特殊,読点,*,*,、,、,*
は 助詞,副助詞,*,*,は,は,*
よ 助詞,終助詞,*,*,よ,よ,*
来て 動詞,*,カ変動詞来,タ系連用テ形,来る,きて,代表表記:来る/くる 反義:動詞:帰る/かえる
! 特殊,記号,*,*,!,!,*
「はよ」が標準語の辞書にないから、副助詞の「は」と勘違いして「わ」と読んでる。
こういった解析ミスをユーザーが修正する手段が Erlang 環境に無いのが問題かな。
PHP 環境なら手動で上書きできるけど、 Erlang 環境は GUI 操作だから。
( #94 も、本当に「 wa ta shi ha 」と読ませたいなら不便かも?)
ちなみに、「急いでるんだから、ハよ来て!」で回避可能。(余談)