语音转文字时,语音模型经过相关语义训练识别后,极有可能存在同音的繁体、简体、阿拉伯文字,并且语音属于口语范畴,各种口语化的金额描述层出不穷,极大的提高了金额识别的难度。本核心组件利用相关技术,结合在项目中实际遇到的场景经验,着力解决语音式金额转为标准数值金额问题。
金额文本:
提交
金额数值:
-
四毛二分
五角钱
三点零一元
六千捌佰万
六万六六六
四千零九十八块六毛七
9十万零贰佰三十八
九万二
五个亿
两亿零玖佰陆拾伍万肆仟玖佰贰拾一元一角三分
四万零二〇四
三亿零一块
二百三十
午时万
三快吧脚三
二百三十
两千
一千
一千元
二千七百六
贰仟〇玖拾陆
八九零零
二一四五点零零
七万零七元
六十万零三百零三
八万七千六百五十四元钱
八十万零三千四百五十二
五亿元
四千六百三十六万三千七百六十四
七零零零零零零点零零
二块五毛零分
二点五
五百万零七
三亿零一块
六千万九百