凡语要想彻底颠覆社交领域,做facebook、twitter的终结者,仅凭当下的完美翻译远远不够。龙腾小说 ltxs520.com
还需要更进一步,拥有更多的卖点!
当下社交软件的交互,不仅局限于传统的文字,更是包含视频、语音等等。
更重要的是,互相之间的综合交互,例如语音和文字之间的转译。
因此,凡人论坛或者凡语,要颠覆整个领域,逃不过与时俱进。
视频交互容易解决,没多少难度,然而语音就不同了。
尽管当下智能语音输入软件颇多,但精准度以及模糊识别一直是个大问题。
当用户对着语音输入法,兴奋地说了一堆话,结果识别错误颇多,掉字连连,甚至连语义都扭曲了。
至于那些不标准的普通话,以及方言,结果更是惨不忍睹。
说是鸡肋都不为过。
更何况王凡要求的更高!
他想要将一种语言的语音,翻译成另一种语言的语音。
完美实现不同语言之间的对话交互,而不是单纯地局限在文字上的完美交互。
例如英语和华夏语的对话交互。
这需要将英语的语音,转为英文。然后完美翻译成华夏文,再度读出来,变成华夏语,从而传递给另一个人。
反义亦然。
整个过程要确保准确无误,尤其是第一个过程,语音到文字,一旦出现错误,后面整个过程都会出现问题。
而两种文字的完美翻译,当下已经实现,至于最后的文字到语音的阅读,那更不是问题。
只是如此精准地将语音识别,这种近似“智能”的过程,王凡凭自己的力量当然搞不定。
即便当下全球领先的巨头,依旧局限在“模糊识别”的不精确阶段。
不过通过科技衍生系统,一切都将与之不同。
王凡亲自挑选了一些语音识别软件,讯飞、千度、灵犀、云械,m.
一番比较,各有千秋。
讯飞、千度、灵犀等,比较适合华夏,但对国际方面的处理不太给力。
而googlenow、siri以及微软cortana,则擅长国际,很多华夏方面的做不到位。
一番权衡,王凡最终疡了googlenow,这款综合性比较优越的语音识别软件。
在此基础上,王凡衍生出一款新的语音识别软件——tt智语。
一番测试,这款语音识别软件的强大让王凡赞不绝口。
不仅能智能识别华夏语、英语、俄语、法语等常用语言,还能识别俚语。
即便王凡对着tt智语爆粗口,都能智能识别或模糊转译。
之所以有些模糊转译,是因为很多方言或者粗口,太过“高端”,当下还没有具体的汉字与之对应,连我们都写不出。
不过很快王凡发现了问题,对于普通话或者近乎普通话,智能识别准确率几乎百分百。
但对于方言音频的识别,有些差强人意,准确率只有百分之九十左右。
尽管这一比例已经很高,足够用户使用。但作为系统出品的黑科技,还是有些不够看。
另外,对于方言音频的识别,会出现两个版本。
例如智能识别咱们屯里人时候,出现了两个结果。
一个是标准的普通话版,一个是直接识别的版本:偶滴老嘎,就组在则个屯。偶系则个屯里,土生土长滴羊