首页-风暴,风暴平台,美食NEW风暴娱乐

2023-02-19 11:19:51 jinqian

风暴平台报道:

    ChatGPT的主结构是当前业界主流的Transformer模型,目前科大讯飞已经将Transformer深度神经网络算法应用于其语音识别、图文识别、机器翻译中,而这些也已经从其面向消费者和行业的具体方案中充分体现出来。


并且科大讯飞还开源了6大类、超40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万。


第二个优势在于数据积累,行业认知大模型想达到人类专家水平,就需要大量行业文本语料和用户反馈数据做支撑。不过还有一大难关是,数据既要涵盖多行业、多领域,还需技术加人工实现双重筛选,进一步提高其模型生成结果的可靠性、合理性和可控性。


刘聪透露,科大讯飞在多年积累和研发过程中,已经拥有超过50TB的行业语料和每天超过10亿人次用户交互的活跃应用。


有了软件支撑,硬件也是极为重要的物质基础。刘聪谈道,超大模型由于参数规模大、数据体量大,因此需要更大的算力支持,带来过高的训练成本。在推理阶段也如此,“以对话交互为例,目前单次交互成本大致是主流方法的1000倍左右”。


科大讯飞在总部合肥的数据中心,在工程技术方面能实现百亿参数大模型推理效率的近千倍加速。而这也是让其大模型能够真正落地,并实现规模化应用的基础。


因此,在这些深厚技术积累的助推下,科大讯飞才能够迅速抓住ChatGPT爆发的风口。刘聪认为:“ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命,将为以自然语言处理为核心的认知智能技术发展提供新的‘历史机遇期’。


首页
产品
新闻
联系