据介绍,“星云研发大模型”支持白名单机制有效控制使用范围,以及代码特征值识别有效识别敏感代码片段、敏感词识别机制可实时监测并拦截敏感内容,还有后台审计机制可完整回溯安全事件等。
中兴通讯表示,2023年4月,“星云研发大模型”使用启动,截至目前,日活人数达1.2万人,代码采纳率达40%~45%,编码提效30%,整体研发提效10%。
IT之家从官方公告获悉,中兴通讯将领域数据、Know-How知识积累、数十万篇通信领域技术文档和1000亿token的无线/核心网/云代码语料等注入大模型,进行增量预训练,使用并行训练框架。
中兴通讯号称:“自研部署方案使用动态batch策略、PagedAttention技术,结合无损模型量化,吞吐量大幅提升,单GPU(A800)达到1500tokens/s,仅使用4张GPU卡(A800)可满足超千人使用需求。对比业界常规的部署方案,单GPU吞吐量分别提升10+倍和20+倍;结合int4量化技术,在模型精度不下降情况下,模型大小和显存使用量均下降一半。”