自5月15日首次亮相的7个月以来,豆包大模型在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。
截至2024年12月,最新版豆包通用模型Doubao-pro-1215综合能力较5月提升32%,已全面对齐GPT-4o。在数学、专业知识等部分复杂场景任务中,效果表现甚至更好,同时其推理服务价格仅为 GPT-4o 的八分之一。其经过海量数据优化及模型架构的创新,包括提升模型稀疏度、引入强化学习等,从而使该模型理解精度、生成质量大幅提升。
此外,豆包还首次披露了其300万字窗口的长文本能力。其能够一次性轻松阅读“上百篇”学术报告,每百万tokens处理延迟仅15秒。