题图丨 TechStartups(图上从左至右分别为 Mistral AI 联合创始人:Guillaume Lample、Arthur Mensch、Timoth é e Lacroix)
这家被法国媒体称为 " 欧洲版 OpenAI"、" 法国对抗 ChatGPT 的秘密项目 " 的初创公司再获巨额融资。
据外媒报道,由前 meta 和 Alphabet 研发人员共同成立的生成式 AI 初创公司 Mistral 在四个月前刚刚获得了由光速创投领投的 1.13 亿美元融资,成为了欧洲生成式 AI 公司有史以来最大的种子轮融资。而在最近,他们再次获得了 3 亿美元融资。
知情人士透露,这一轮融资预计将使这家位于巴黎的初创公司估值超过 10 亿美元,正式跻身独角兽行列。今年 9 月,Mistral AI 发布了自家首个大模型 Mistral 7B,号称 " 最强 7B 开源模型 ",其规模较小仅有 73 亿,但在所有基准测试上,其表现都优于规模更大的 meta 旗下大模型 Llama 2 13B。
那么,到底这家初出茅庐的新公司有什么底气能够称之为 " 欧洲版 OpenAI" 呢?
挑战 OpenAI,
三位校友不到半年干出一家独角兽
刚刚年过 30 的三位大学同学,今年 5 月再次相逢成立了这家名为 Mistral AI 的公司。
创始人兼 CEO Arthur Mensch 当年在巴黎综合理工学院和巴黎高等师范学院学习期间结识了另外两位创始人—— Timoth é e Lacroix 和 Guillaume Lample。
之所以萌生了创业的念头,源于他们去年看到了生成式 AI 的发展趋势。虽然 Arthur Mensch 并未直说是受到 ChatGPT 大获成功的启发,但从去年的 12 月以来,ChatGPT 的爆火确实给很多 AI 从业者带来了新的思路。
Mistral AI 创始人兼 CEO Arthur Mensch,图源:wired
尽管年纪轻轻,他们却有着光鲜的履历。
Arthur Mensch 曾任谷歌旗下人工智能公司 DeepMind 的高级研究科学家,是 Retro、Flamingo 和 Chinchilla 项目的主要贡献者,积累了优化大型语言模型的宝贵经验;首席科学家 Guillaume Lample 和 CTO Timoth é e Lacroix 此前曾在 meta 人工智能团队共同领导了大型语言模型 LLaMa 的开发。
可以说,这样的团队背景在 AI 领域算得上顶尖。在全球范围内,真正懂得构建类似 ChatGPT 的 LLMs 模型、具备训练和优化大模型专业知识的Kaiyun官方网站app登录 都极为稀缺,大约只有 80-100 人。
除了这三位联合创始人,就连三位核心员工也具备创业经历或政府背景。
包括来自法国小企业健康保险平台 Alan 的 CEO Jean-Charles Samuelian 和 CTO Charles Gorintin,以及前法国数字事务国务秘书 C é dric O。睿兽分析显示,Alan 公司目前已经融资 6 轮,估值达 29 亿美元,也已经是一家独角兽公司。
从外媒消息来看,此次的 Mistral AI 的 3 亿美元融资,还未披露参投的投资方。但从其种子轮融资就足以见其火爆程度。
开发了 " 网红 " 生图工具 Stable Diffusion 的 Stability AI 公司曾在去年获得 1.01 亿美元,而Mistral AI 今年 5 月刚成立时只有 6 个人,还没有做出产品时,仅仅靠 7 页 PPT 就创纪录地获得了 1.13 亿美元的种子轮融资,并且挤进了 14 家投资方,阵容强大得也足以令人瞠目:
既有美国头部老牌 VC:光速创投(Lightspeed Ventures Partners)、红点创投(Redpoint)、指数创投(Index Ventures);
又有豪华家办:老佛爷百货所有者 Moulin-Houz é 家族办公室(Motier Ventures)、意大利最有钱的阿涅利家族旗下基金 Exor Ventures;
欧洲各国风投:德国种子轮投资投资机构 La Famiglia ,专注于早期数字公司的 Headline,比利时老牌风投机构 Sofina,英国早期 AI区块链风投机构 First Minute Capital 和专注种子轮数字领域投资的 LocalGlobe;
还有知名企业及高管:前谷歌首席执行官埃里克施密特、法国电信亿万富翁泽维尔尼尔、法国第一大集装箱承运公司达飞海运集团老板 Rodolphe Saad é、全球排名第一的国际性户外媒体公司德高集团(JCDecaux)。
知情人士透露,种子轮过后,Mistral AI 的估值就达到了 2.6 亿美元,而如今伴随着新一轮 3 亿美元的融资,这家公司也正式跻身独角兽行列。
Mistral AI 团队成员,图源:Mistral AI 官网
" 全法国的希望 ",
凭什么成为 " 欧洲版 OpenAI"?
那么,Mistral AI 到底有何独特之处呢?
为了能够与 OpenAI 竞争,Arthur Mensch 表示,公司主打的就是差异化的 " 错位竞争 ",具体是将开源、企业级以及聚焦欧洲市场作为自己的定位。
首先,Mistral AI 想成为开源版的 OpenAI。
Arthur Mensch 谈到," 尽管 OpenAI 名字里有 Open,但其完全不 Open。很多企业不想将敏感数据放入到类似 OpenAI 这种封闭的‘黑匣子’系统,这也让我们看到了机会。"
在他看来,开源有 2 个好处,一是避免训练数据的法律问题,由于建构模型使用的是公开可用的数据;二是有助于吸引更多顶级开发者的加入,用户也可以贡献自己的数据集。
而 Mistral AI 所要做的就是,通过提高数据源的质量和控制,为模型提供可选的数据源访问:对于付费高级版,某个模型可以专门针对金融/ 法律等领域进行定制。
9 月 27 日,Mistral AI 发布了自家首个大模型 Mistral 7B,该模型号称是 " 最强 7B 开源模型 "。
Mistral 7B 的特别之处在于其规模较小仅有 73 亿,但是在所有基准测试上,都轻松击败了 Llama 2 的 70 亿和 130 亿参数两个模型,还具有编写程序代码以及处理 8,000 个 token 的能力。
图源:Mistral AI 官网
在涵盖数学、历史、法律和其他科目的大规模多任务语言理解测试中,Mistral 的模型准确率达到 60.1%,而 Llama 2 模型 70 亿参数和 130 亿参数两个版本的准确率分别为 44% 和 55%。在常识推理和阅读理解基准测试中,Mistral 的表现也优于 Llama 2 的模型。
只有在编码方面 Mistral 落后于 meta。Mistral 7B 在 "Humaneval" 和 "MBPP" 两项基准测试中的准确率分别为 30.5% 和 47.5%,而 Llama 2 的 70 亿模式的准确率分别为 31.1% 和 52.5%。
整体来说,Mistral 7B 在多个基准测试,包括常识推理、世界知识、阅读理解、数学和程序代码等方面表现亮眼,除了明显优于 Llama 2 13B 之外,也和 Llama 34B 模型打成平手,其编写程序代码的能力接近 CodeLlama 7B,并且在英文任务中表现良好。
可以说,Mistral 7B 的表现相当一个 3 倍大的 Llama 2 模型,但是却使用了更少的计算量。如果与 ChatGPT 作比较,根据 medium 的计算,Mistral AI 的使用成本要比 GPT-4 便宜约 187 倍,比 GPT 3.5 模型便宜约 9 倍。
简单来讲,就是让人工智能真正有用、可用。这也引出了Mistral AI 第二个差异化:ToB。
目前,企业真正需要的是专业化的人工智能,即 ASI(Artificial Specialized Intelligence),这也已经逐渐成为业界共识,而不是将所有内容都塞在一个巨大的 AGI 通用模型里。因此,Mistral AI 瞄准企业用户,帮助企业客户搞清楚他们能用大模型做什么,以及如何落地。
最后,Mistral AI 将聚焦于欧洲市场。
针对隐私问题,欧盟加强了对于 OpenAI 的 ChatGPT、谷歌 Bard 的监管,他们必须符合欧洲的隐私准则。这也给了欧洲本土的生成式 AI 企业以宝贵的时间窗口得以发展。
根据风险投资公司 Accel 的最新报告,过去 12 个月,欧洲和以色列的生成式 AI 创业公司的融资总额接近 10 亿美元,同时美国相关公司的融资总额超过 140 亿美元。其中,仅 OpenAI 一家就完成了 100 亿美元的融资。
而 Mistral AI 的出现可谓成为了 " 全法国的希望 "。就连法国总统马克龙也表达了对 Mistral AI 的支持,称之为法国的 OpenAI。
马克龙还称," 我们将在培训和研究方面疯狂投资 "。在巴黎的 VivaTech 上,马克龙宣布了 5 亿欧元(合 5.62 亿美元)的新资金用以投入 AI 领域。此前,法国政府曾承诺在 2022 年前向 AI 领域投入 15 亿欧元,以赶上美国和中国。
可以说,有了产品、资金,又有了法国政府的支持,Mistral AI 现在最亟需做的就是尽可能的抢占市场。
来源:创业邦