Tetra筹集了150万美元的种子资金 将深度学习引入语音转录领域
市场上有一百万和一个语音转录服务。但即使只有一项工作要做,我也从未见过一项服务能够处理现实世界中长尾词的使用。如果你是一家初创公司,试图向企业销售你的服务,依赖于他们业务的准确转录,这尤其具有挑战性。
语音转录初创公司Tetra的联合创始人乔恩戈德史密斯理解这一挑战。事实上,他甚至愿意承认自己没有100%解决这个问题。但戈德史密斯认为,答案在于深度学习,他将在YCombinator和一些天使的参与下,用由Amplify Partners牵头的150万种子轮来证明这一点。
我顺道去了Tetra的办公室,看看戈德史密斯、他的联合创始人尼克利奥斯和另一位工程师创造了什么。戈德史密斯打电话给我,在他的智能手机上安装了Tetra应用程序。当他听着后台运行的深度学习模式时,我对转录服务提出了一系列挑战。
以不同的速度交谈,抛出数字、初创公司的名字等强硬的字眼,确实在一定程度上让利乐感到沮丧——但平心而论,没有一个人工智能是我没有打破的。考虑到使用Tetra有多容易,我可以看到它被用作备份参考或记录保存-打开它,忘记它,然后使用它来搜索笔记。
如果需要99%或100%的准确性,Tetra提供成本和24小时等待人工转录。这实际上有助于客户和Tetra,因为精确的转录可以用作训练数据反馈,以提高未来的性能。
戈德史密斯告诉我,他正在寻找向投资者销售的动力,并经常打电话。这些客户希望Tetra创建与行业专家的永久对话记录。其他更传统的企业用例也存在,例如在销售中。
这对公司来说似乎是一个相当好的结果。此外,由于三人Tetra团队在设计用于商业用途的住宅公寓中工作,情况仍然相当糟糕。在工程领域,许多基础设施都是由现成的应用编程接口提供动力的。
这其实是一件好事,因为这意味着Tetra不会浪费时间构建市场上已经存在的东西,而是集中精力收集大量的转录数据集,这只会不断提高服务质量。
团队的方法很大程度上取决于能否优化对话的哪些部分被发送到哪个云应用编程接口。例如,一些NLP服务提供商对电影、音乐和媒体相关的演讲有更好的理解,而另一些则更擅长数字。
150万元的种子资金将用于扩大工程团队,完善机器学习渠道。Tetra包括搜索功能,因此用户可以在传统上无法检索的语音记录中快速找到特定的句子。我可以看到,这将在未来变得更加积极主动——例如,自动标记姓名和日期。
郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。
标签: